Kuaishou เพิ่งเปิดตัวการพัฒนาทางเทคโนโลยีที่สำคัญเปิดอย่างเป็นทางการเปิดตัวโมเดลการสร้างภาพที่พัฒนาขึ้นอย่างเป็นอิสระ - "Kotu Kolors" โมเดลนี้ไม่เพียง แต่แสดงถึงการสะสมอย่างลึกซึ้งของ Kuaishou ในด้านปัญญาประดิษฐ์ แต่ยังแสดงให้เห็นถึงความแข็งแกร่งที่เป็นนวัตกรรมในเทคโนโลยีการสร้างภาพ การเปิดตัว Kotu Kolors นับเป็นความก้าวหน้าที่สำคัญอีกประการหนึ่งสำหรับ Kuaishou ในการประยุกต์ใช้เทคโนโลยี AI โดยเฉพาะอย่างยิ่งในด้านการสร้างภาพและการประมวลผลทำให้ผู้สร้างได้รับการสนับสนุนเครื่องมือที่ทรงพลัง
ข้อได้เปรียบหลักของ Kolos คือความเข้าใจภาษาที่แข็งแกร่งและความสามารถในการสร้างภาพ โมเดลนี้ใช้โมเดลภาษาทั่วไป (GLM) เป็นตัวเข้ารหัสข้อความรองรับคำพร้อมสองภาษาจีนและภาษาอังกฤษและสามารถจัดการบริบทของโทเค็นได้สูงสุด 256 โทเค็น ซึ่งหมายความว่าผู้ใช้สามารถสร้างภาพที่สอดคล้องกับความคาดหวังผ่านคำอธิบายข้อความโดยละเอียดไม่ว่าจะเป็นการออกแบบฉากที่ซับซ้อนหรือการแสดงออกทางอารมณ์ที่ละเอียดอ่อนสามารถทำได้ผ่านรุ่นนี้
ในแง่ของข้อมูลการฝึกอบรม Kolors ฝึกฝนอย่างลึกซึ้งจากภาพข้อความหลายพันล้านภาพซึ่งทำให้แบบจำลองเป็นฐานความรู้ที่หลากหลายและช่วยให้สามารถสร้างภาพที่หลากหลายและแม่นยำ โดยเฉพาะอย่างยิ่งการกล่าวถึงว่าแบบจำลองได้รับการปรับให้เหมาะสมสำหรับองค์ประกอบทางวัฒนธรรมของจีน
นอกจากนี้ Kotokolors ยังทำงานได้ดีโดยเฉพาะในการสร้างข้อความภาษาจีน ไม่เพียง แต่สามารถเข้าใจคำที่รวดเร็วของจีนได้ แต่ยังฝังข้อความภาษาจีนในภาพที่สร้างขึ้นเพื่อเพิ่มพลังที่แสดงออกมาให้กับภาพมากขึ้น สิ่งนี้ได้รับการตรวจสอบอย่างเต็มที่ในการทดสอบจริง


ในการใช้งานจริง Koto Kolors แสดงให้เห็นถึงความสามารถในการสร้างที่ทรงพลัง ตัวอย่างเช่นเมื่อสร้างภาพในธีมของ "Laid Flat Kitten" โมเดลสามารถนำเสนอข้อกำหนดของคำที่รวดเร็วของภาษาจีนได้อย่างสมบูรณ์แบบและข้อความในภาพนั้นชัดเจนและแม่นยำ อย่างไรก็ตามเมื่อใช้คำที่เป็นภาษาอังกฤษประสิทธิภาพของโมเดลนั้นไม่เพียงพอเล็กน้อยและมีแนวโน้มที่จะขาดคำหรือพิมพ์ผิด สิ่งนี้แสดงให้เห็นว่าถึงแม้ว่า Kolos จะทำงานได้ดีในการประมวลผลภาษาจีน แต่ก็ยังมีพื้นที่สำหรับการปรับปรุงในรุ่นอังกฤษ

ด้านหลัง Kolors คือการสนับสนุนทางเทคนิคที่ทรงพลังของ Kuaishou โมเดลนี้ใช้สถาปัตยกรรม SDXL และรวมเอาเทคโนโลยี ChatGLM256 เพิ่มความเข้าใจสองภาษาและความสามารถในการสร้างข้อความ อย่างไรก็ตามเป็นที่น่าสังเกตว่าการใช้งานรุ่นนี้ต้องใช้หน่วยความจำวิดีโอขนาดใหญ่ประมาณ 19GB ซึ่งทำให้ความต้องการสูงบนอุปกรณ์ฮาร์ดแวร์และอาจ จำกัด การใช้งานของผู้ใช้บางคน
แหล่งโอเพ่นซอร์สของ Kuaishou ในครั้งนี้ไม่เพียง แต่เป็นส่วนหนึ่งของชุมชนเทคโนโลยี แต่ยังเป็นการส่งเสริมเสรีภาพในการสร้างสรรค์ ผ่านโอเพ่นซอร์ส Kuaishou หวังว่านักพัฒนานักออกแบบและศิลปินสามารถใช้เครื่องมือนี้เพื่อสำรวจความเป็นไปได้ที่ไม่มีที่สิ้นสุดของ AI ในการสร้างศิลปะ ในเวลาเดียวกันสิ่งนี้ยังแสดงให้เห็นถึงความมุ่งมั่นและความแข็งแกร่งของ Kuaishou ในด้านเทคโนโลยี AI ซึ่งบ่งชี้ว่าเทคโนโลยีที่เป็นนวัตกรรมมากขึ้นจะถูกนำไปใช้กับสถานการณ์จริงในอนาคต
แผนโอเพ่นซอร์สของ Koto Kolors ยังรวมถึงการสนับสนุน CN (ControlNet), LORA (การปรับตัวระดับต่ำ), IPA (การปรับตัวของภาพ) และการสนับสนุนโดยตรงของ ComFYUI กระบวนการ
โดยทั่วไปแล้วการเปิดตัว Kotu Kolors ไม่เพียง แต่เป็นการพัฒนาที่สำคัญสำหรับ Kuaishou ในด้านเทคโนโลยี AI แต่ยังเป็นนวัตกรรมในเทคโนโลยีการสร้างภาพ ด้วยความเข้าใจภาษาที่ทรงพลังและความสามารถในการสร้างภาพจะช่วยให้ผู้ใช้มีเครื่องมือสร้างสรรค์ใหม่และยังเปิดเส้นทางใหม่สำหรับการประยุกต์ใช้เทคโนโลยี AI ในการสร้างศิลปะ
เว็บไซต์อย่างเป็นทางการของ Ketu: https://top.aibase.com/tool/kuaishouketudamoxingkolors
ที่อยู่โครงการ: https://top.aibase.com/tool/kolors