Visão realista para design de interiores
Uma API de pipeline de design de interiores personalizada que combina o Vision Realistic V3.0 Painting Pipeline com segmentação e MLSD ControlNets. Este repositório usa o Cog para criar uma API Dockerized. Veja a demonstração replicada para testar a API em execução.
Uso básico
Você precisará instalar o Cog e o Docker para servir seu modelo como uma API. Para executar uma previsão:
cog predict -i image=@test_images/bedroom_3.jpg prompt= " A bedroom with a bohemian spirit centered around a relaxed canopy bed complemented by a large macrame wall hanging. An eclectic dresser serves as a unique storage solution while an array of potted plants brings life and color to the room "
Para iniciar seu servidor e servir o modelo como uma API:
cog run -p 5000 python -m cog.server.http
Os argumentos de entrada da API são os seguintes:
- Imagem: A imagem fornecida serve como base ou referência para o processo de geração.
- Prompt: O prompt de entrada é uma descrição de texto que orienta o processo de geração de imagens. Deve ser uma descrição detalhada e específica da imagem de saída desejada.
- negativo_prompt: Este parâmetro permite especificar instruções negativas. Prompts negativos são termos ou descrições que devem ser evitadas na imagem gerada, ajudando a afastar a saída dos elementos indesejados.
- NUM_INFERELE_STEPS: Este parâmetro define o número de etapas de denoising no processo de geração de imagens.
- Guidance_Scale: O parâmetro da escala de orientação ajusta a influência da orientação livre de classificadores no processo de geração. Valores mais altos farão com que o modelo se concentre mais no prompt.
- Prompt_Strength: No modo de pintura, esse parâmetro controla a influência do prompt de entrada na imagem final. Um valor de 1,0 indica transformação completa de acordo com o prompt.
- Semente: O parâmetro de semente define uma semente aleatória para a geração de imagens. Uma semente específica pode ser usada para reproduzir resultados ou em branco deixado para geração aleatória.
Detalhes do modelo
Este é um pipeline personalizado inspirado no design generativo de design de interiores da AICROWD, que usa o Vision Vision V3.0 realista como o modelo básico. Consulte as páginas do modelo Base e Controlnet para suas respectivas licenças. Esta base de código está licenciada sob a licença do MIT.
De neuralwork com ❤️