AnyText โอเพ่นซอร์สของ Alibaba: สามารถสร้างข้อความที่แม่นยำในรูปภาพ รองรับภาษาจีน!

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-01-22 08:32:01

อาลีบาบาได้ใช้โมเดลการสร้างและแก้ไขข้อความรูปภาพแบบโอเพ่นซอร์ส AnyText ซึ่งสามารถสร้างข้อความที่แม่นยำตามอำเภอใจในรูปภาพ และรองรับหลายภาษา รวมถึงภาษาจีนด้วย ผู้ใช้สามารถปรับแต่งตำแหน่งข้อความ ความเข้มของภาพ และพารามิเตอร์อื่นๆ เพื่อสร้างภาพที่ตรงตามความต้องการของพวกเขา ที่สำคัญกว่านั้น อาลีบาบายังได้เปิดชุดข้อมูล AnyWord-3M พร้อมกันซึ่งประกอบด้วยคู่ข้อความรูปภาพ 3 ล้านคู่ ครอบคลุมหลายภาษา เช่น จีน อังกฤษ ญี่ปุ่น และเกาหลี ซึ่งจะช่วยปรับปรุงการประมวลผลข้อความได้อย่างมาก ความสามารถของโมเดล AnyText ส่งเสริมการพัฒนาเทคโนโลยีการสร้างข้อความรูปภาพเพิ่มเติม

โมเดลการสร้างและแก้ไขข้อความรูปภาพแบบโอเพ่นซอร์สของ Alibaba AnyText สามารถสร้างข้อความที่แม่นยำในภาพได้ รวมถึงภาษาจีนด้วย รุ่นนี้รองรับการวางแผนพารามิเตอร์แบบกำหนดเอง เช่น ตำแหน่งของข้อความและความเข้มของรูปภาพ และสร้างรูปภาพ Wensheng ที่ตรงตามข้อกำหนด ในเวลาเดียวกัน อาลีบาบายังได้เปิดชุดข้อมูล AnyWord-3M เพื่อปรับปรุงความสามารถด้านข้อความของ AnyText ชุดข้อมูลนี้ประกอบด้วยคู่ข้อความรูปภาพ 3 ล้านคู่ ครอบคลุมภาษาจีน อังกฤษ ญี่ปุ่น เกาหลี และภาษาอื่นๆ

โอเพ่นซอร์สของโมเดล AnyText และการเปิดตัวชุดข้อมูล AnyWord-3M ถือเป็นความก้าวหน้าที่สำคัญของอาลีบาบาในด้านการสร้างข้อความรูปภาพ โดยมอบเครื่องมือและทรัพยากรอันทรงพลังให้กับนักวิจัยและนักพัฒนา และคาดว่าจะส่งเสริมนวัตกรรมทางเทคโนโลยีและการประยุกต์ในเรื่องนี้ นำไปใช้เพื่อปรับปรุงประสิทธิภาพและความแม่นยำของการประมวลผลภาพและข้อความ