เมื่อเร็วๆ นี้ DeepSeek ได้เปิดตัวโมเดลโอเพ่นซอร์สใหม่ DeepSeek-Coder-V2 ซึ่งเหนือกว่า GPT-4-Turbo ในแง่ของโค้ดและความสามารถทางคณิตศาสตร์ อีกทั้งยังปรับปรุงการรองรับหลายภาษาและความยาวการประมวลผลบริบทอย่างมีนัยสำคัญ ใช้สถาปัตยกรรม Mix of Experts (MoE) และได้รับการปรับปรุงเป็นพิเศษสำหรับการสร้างโค้ดและความสามารถในการให้เหตุผลทางคณิตศาสตร์ ประสิทธิภาพเป็นหนึ่งในสถาปัตยกรรมที่ดีที่สุดในโลก และมีตัวเลือกขนาด 2 ระดับของพารามิเตอร์ 236B และพารามิเตอร์ 16B เพื่อตอบสนองความต้องการใช้งานที่แตกต่างกัน รหัส เอกสาร และโมเดลทั้งหมดเป็นโอเพ่นซอร์สและสามารถนำไปใช้ในเชิงพาณิชย์ได้ฟรีโดยไม่ต้องสมัคร
ข่าวหน้าแรกของผู้ดูแลเว็บ (ChinaZ.com) เมื่อวันที่ 18 มิถุนายน: เมื่อเร็วๆ นี้ DeepSeek ได้ประกาศเปิดตัวโมเดลโอเพ่นซอร์สชื่อ DeepSeek-Coder-V2 ซึ่งเหนือกว่า GPT-4-Turbo ในแง่ของโค้ดและความสามารถทางคณิตศาสตร์ และได้รับการขยายออกไปอย่างมาก การสนับสนุนหลายภาษาและระยะเวลาในการประมวลผลบริบท อิงตามโครงสร้างแบบจำลองของ DeepSeek-V2 นั้น DeepSeek-Coder-V2 ใช้สถาปัตยกรรม Mix of Experts (MoE) ที่ออกแบบมาเป็นพิเศษเพื่อปรับปรุงความสามารถในการเขียนโค้ดและการให้เหตุผลทางคณิตศาสตร์
ประสิทธิภาพของ DeepSeek-Coder-V2 อยู่ในอันดับที่ดีที่สุดในโลก และความสามารถในการสร้างโค้ดและคณิตศาสตร์ทางคณิตศาสตร์ก็มีความโดดเด่นเป็นพิเศษ โมเดลนี้ รวมถึงรหัสและเอกสารที่เกี่ยวข้องล้วนเป็นโอเพ่นซอร์สและพร้อมให้ใช้งานเชิงพาณิชย์ฟรีโดยไม่ต้องสมัคร รุ่นนี้มีจำหน่ายสองขนาด: พารามิเตอร์ 236B และพารามิเตอร์ 16B เพื่อตอบสนองความต้องการใช้งานที่แตกต่างกัน

ในแง่ของการรองรับหลายภาษา ภาษาการเขียนโปรแกรมที่ DeepSeek-Coder-V2 สามารถรองรับได้ขยายจาก 86 เป็น 338 ซึ่งปรับให้เข้ากับความต้องการการพัฒนาที่หลากหลายมากขึ้น ในขณะเดียวกัน ความยาวบริบทที่รองรับก็ขยายจาก 16K เป็น 128K ทำให้สามารถจัดการเนื้อหาอินพุตที่ยาวขึ้นได้ DeepSeek-Coder-V2 ยังมีบริการ API รองรับบริบท 32K และราคาเท่ากับ DeepSeek-V2
ในการทดสอบเกณฑ์มาตรฐานมาตรฐาน DeepSeek-Coder-V2 มีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สบางรุ่นในการสร้างโค้ด การเติมโค้ดให้สมบูรณ์ การซ่อมแซมโค้ด และการให้เหตุผลทางคณิตศาสตร์ ผู้ใช้สามารถดาวน์โหลดรุ่น DeepSeek-Coder-V2 เวอร์ชันต่างๆ ได้ รวมถึงเวอร์ชันพื้นฐานและเวอร์ชันคำสั่ง ตลอดจนเวอร์ชันที่มีขนาดพารามิเตอร์ต่างกัน
นอกจากนี้ DeepSeek ยังมีแพลตฟอร์มประสบการณ์ออนไลน์และลิงก์ GitHub รวมถึงรายงานทางเทคนิค เพื่ออำนวยความสะดวกให้ผู้ใช้เข้าใจและใช้ DeepSeek-Coder-V2 เพิ่มเติม การเปิดตัวโมเดลนี้ไม่เพียงแต่นำโค้ดอันทรงพลังและความสามารถในการประมวลผลทางคณิตศาสตร์มาสู่ชุมชนโอเพ่นซอร์สเท่านั้น แต่ยังช่วยส่งเสริมการพัฒนาและการประยุกต์ใช้เทคโนโลยีที่เกี่ยวข้องอีกด้วย
ที่อยู่โครงการ: https://top.aibase.com/tool/deepseek-coder-v2
ประสบการณ์ออนไลน์: https://chat.deepseek.com/sign_in
การเปิดตัวโอเพ่นซอร์สของ DeepSeek-Coder-V2 ช่วยให้นักพัฒนามีเครื่องมืออันทรงพลัง และถือเป็นความก้าวหน้าครั้งสำคัญในเทคโนโลยีโอเพนซอร์สโมเดลขนาดใหญ่ แพลตฟอร์มการใช้งานเชิงพาณิชย์ฟรีและประสบการณ์ออนไลน์ที่สะดวกสบายของบริษัท จะช่วยส่งเสริมความนิยมและการประยุกต์ใช้เทคโนโลยีปัญญาประดิษฐ์ และคุ้มค่าที่จะรอคอยการพัฒนาและการประยุกต์ใช้ในอนาคต