RealisticVision para el diseño de interiores
Una API de tubería de diseño de interiores personalizado que combina la visión realista v3.0 de la tubería de entrada con segmentación y control de control MLSD. Este repositorio usa COG para crear una API dockerizada. Vea la demostración replicada para probar la API en ejecución.
Uso básico
Deberá tener instalados COG y Docker para servir a su modelo como API. Para ejecutar una predicción:
cog predict -i image=@test_images/bedroom_3.jpg prompt= " A bedroom with a bohemian spirit centered around a relaxed canopy bed complemented by a large macrame wall hanging. An eclectic dresser serves as a unique storage solution while an array of potted plants brings life and color to the room "
Para iniciar su servidor y servir al modelo como API:
cog run -p 5000 python -m cog.server.http
Los argumentos de entrada de API son los siguientes:
- Imagen: La imagen proporcionada sirve como base o referencia para el proceso de generación.
- Aviso: El mensaje de entrada es una descripción de texto que guía el proceso de generación de imágenes. Debe ser una descripción detallada y específica de la imagen de salida deseada.
- negativo_prompt: este parámetro permite especificar indicaciones negativas. Las indicaciones negativas son términos o descripciones que deben evitarse en la imagen generada, lo que ayuda a alejar la salida de los elementos no deseados.
- num_inference_steps: este parámetro define el número de pasos de renovación en el proceso de generación de imágenes.
- Guidance_Scale: el parámetro de escala de guía ajusta la influencia de la guía sin clasificadores en el proceso de generación. Los valores más altos harán que el modelo se enfoque más en el aviso.
- ARD_STRength: en el modo de entrada, este parámetro controla la influencia de la solicitud de entrada en la imagen final. Un valor de 1.0 indica una transformación completa de acuerdo con el aviso.
- Semilla: el parámetro de semilla establece una semilla aleatoria para la generación de imágenes. Se puede usar una semilla específica para reproducir resultados o dejar en blanco para la generación aleatoria.
Detalles del modelo
Esta es una tubería personalizada inspirada en el hackathon generativo de diseño de interiores de Aicrowd que utiliza la visión realista v3.0 como modelo base. Consulte las páginas del modelo Base y ControlNet para sus respectivas licencias. Esta base de código tiene licencia bajo la licencia MIT.
Del trabajo neuronal con ❤️