Kuaishou lanzó recientemente un gran avance tecnológico, abriendo oficialmente su modelo de generación de imágenes desarrollado independientemente: "Kotu Kolors". Este modelo no solo representa la profunda acumulación de Kuaishou en el campo de la inteligencia artificial, sino que también demuestra su fortaleza innovadora en la tecnología de generación de imágenes. El lanzamiento de Kotu Kolors marca otro avance importante para Kuaishou en la aplicación de la tecnología de IA, especialmente en el campo de la generación y procesamiento de imágenes, proporcionando a los creadores un poderoso soporte para herramientas.
La ventaja central de Kolos es su fuerte comprensión del lenguaje y capacidades de generación de imágenes. Este modelo utiliza el modelo de idioma general (GLM) como codificador de texto, admite palabras rápidas bilingües chinas e inglesas y puede manejar contextos de hasta 256 tokens. Esto significa que los usuarios pueden generar imágenes que están muy en línea con las expectativas a través de descripciones de texto detalladas, ya sea un diseño de escena complejo o una expresión emocional delicada, se puede lograr a través de este modelo.
En términos de datos de capacitación, Kolor se entrena profundamente en miles de millones de imágenes de texto, lo que le da al modelo una rica base de conocimiento y permite la generación de imágenes diversas y precisas. Vale la pena mencionar que el modelo ha sido optimizado para los elementos culturales chinos.
Además, los kotocolores se desempeñaron particularmente bien en la generación de texto chino. No solo puede comprender las palabras rápidas chinas, sino que también incrustar el texto chino en las imágenes generadas, agregando un poder más expresivo a la imagen. Esto se ha verificado completamente en las pruebas reales.


En aplicaciones prácticas, Koto Kolor demuestra su poderosa capacidad de generación. Por ejemplo, al generar imágenes sobre el tema del "gatito plano mentiroso", el modelo puede presentar perfectamente los requisitos de las palabras inmediatas chinas, y el texto en la imagen es claro y preciso. Sin embargo, cuando se usa palabras rápidas en inglés, el rendimiento del modelo es ligeramente insuficiente y es propenso a faltar palabras o errores tipográficos. Esto muestra que aunque Kolos funciona bien en el procesamiento chino, todavía hay margen de mejora en la generación inglesa.

Detrás de Kolor es el poderoso soporte técnico de Kuaishou. El modelo se basa en la arquitectura SDXL e incorpora la tecnología CHATGLM256, mejorando aún más su comprensión bilingüe y capacidades de generación de texto. Sin embargo, vale la pena señalar que ejecutar este modelo requiere una gran memoria de video, de aproximadamente 19 GB, lo que pone altas demandas en los dispositivos de hardware y puede limitar el uso de algunos usuarios.
El código abierto de Kolors de Kuaishou esta vez no es solo una contribución a la comunidad tecnológica, sino también una audaz promoción de la libertad creativa. A través de código abierto, Kuaishou espera que más desarrolladores, diseñadores y artistas puedan usar esta herramienta para explorar las infinitas posibilidades de la IA en la creación artística. Al mismo tiempo, esto también demuestra la determinación y fortaleza de Kuaishou en el campo de la tecnología de IA, lo que indica que se aplicarán tecnologías más innovadoras a los escenarios reales en el futuro.
El plan de código abierto de Koto Kolors también incluye soporte CN (ControlNet), Lora (adaptación de bajo rango), IPA (adaptación de inmediato) y soporte directo Comfyui. proceso.
En general, el lanzamiento de Kotu Kolors no solo es un avance importante para Kuaishou en el campo de la tecnología de IA, sino también una innovación en la tecnología de generación de imágenes. A través de su poderosa comprensión del lenguaje y capacidades de generación de imágenes, proporciona a los usuarios nuevas herramientas creativas, y también abre una nueva ruta para la aplicación de la tecnología de IA en la creación artística.
Sitio web oficial de Ketu: https://top.aibase.com/tool/kuaishouketudamoxingkolors
Dirección del proyecto: https://top.aibase.com/tool/kolors