Deepseek-V3-0324 เปิดตัวอย่างเงียบ ๆ : การอัพเกรดคีย์ต่ำในวงกลมเทคโนโลยี-บทความ AI

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-05-22 01:50:02

2025 Binance Direct

เมื่อวันที่ 24 มีนาคม 2568 Deepseek สถาบันวิจัยปัญญาประดิษฐ์จีนได้เปิดตัวโมเดลภาษาเรือธงเวอร์ชันล่าสุด-Deepseek-V3-0324 บนแพลตฟอร์ม Hugging Face โดยไม่ต้องดูตัวอย่างใด ๆ การอัปเดต "ต่ำและแข็งแกร่ง" นี้ได้จุดประกายการอภิปรายอย่างรุนแรงในชุมชนเทคโนโลยีและนักพัฒนาหลายคนและผู้ที่ชื่นชอบ AI ได้แบ่งปันประสบการณ์และความคาดหวังเริ่มต้นของพวกเขา ต่อไปนี้เป็นรายงานเชิงลึกที่รวบรวมตามข้อเสนอแนะจากชุมชนเทคโนโลยี

1. การเปิดตัวลึกลับ: ค่าพารามิเตอร์ 68.5 พันล้านตัวที่เปิดเผยอย่างเงียบ ๆ

Deepseek รักษาสไตล์คีย์ต่ำที่สอดคล้องกัน ตามชุมชนเทคโนโลยีโมเดลใหม่อย่างเงียบ ๆ มีชีวิตอยู่อย่างเงียบ ๆ บนใบหน้าที่กอดในตอนเช้าของวันที่ 24 มีนาคมโดยไม่มีการประกาศอย่างเป็นทางการหรือการแถลงข่าว เวอร์ชันใหม่มีพารามิเตอร์ 68.5 พันล้านพารามิเตอร์ในขณะที่เอกสารทางเทคนิค Deepseek-V3 ที่วางจำหน่ายในเดือนธันวาคมปีที่แล้วคือ 67.1 พันล้านพารามิเตอร์ ความแตกต่างนี้ได้จุดประกายการเก็งกำไรเกี่ยวกับการปรับสถาปัตยกรรมที่อาจเกิดขึ้น แม้ว่าเจ้าหน้าที่จะไม่เปิดเผยพารามิเตอร์ทางเทคนิคโดยละเอียด แต่ "การโจมตีฉับพลัน" นี้ก็เพียงพอที่จะทำให้ชุมชนตื่นเต้น

ข้อความหลายข้อความยืนยันว่า Deepseek แจ้งการอัพเกรดผ่านข้อความกลุ่มเท่านั้นซึ่งแสดงว่าโมเดลได้รับการเปิดแหล่งที่มาจากการกอดเพื่อดาวน์โหลดฟรีโดยทุกคน รายงานยังชี้ให้เห็นว่าแพลตฟอร์มของบุคคลที่สามให้การสนับสนุน API อย่างรวดเร็วซึ่งแสดงให้เห็นถึงการตอบสนองอย่างรวดเร็วของชุมชนต่อรุ่นใหม่

2. การก้าวกระโดดประสิทธิภาพ: การปรับปรุงที่สำคัญในวิชาคณิตศาสตร์และความสามารถในการเขียนโปรแกรม

จุดเด่นหลักของการอัปเดตนี้คือการปรับปรุงประสิทธิภาพที่สำคัญ แม้ว่า บริษัท จะวางตำแหน่งให้เป็น "การอัปเดตรุ่นเล็ก" การทดสอบเบื้องต้นแสดงให้เห็นถึงการปรับปรุงที่สำคัญทั้งความสามารถทางคณิตศาสตร์และการออกแบบส่วนหน้า ผู้ตรวจสอบทางเทคนิคหลายคนรายงานว่าความสามารถในการเขียนโปรแกรมของแบบจำลองได้รับการปรับปรุงอย่างมากใกล้กับระดับของ Claude 3.5 ผู้ตรวจสอบบางคนแบ่งปันภาพตัวอย่างที่สร้างขึ้นโดย V3-0324 โดยกล่าวว่าเอฟเฟกต์เริ่มต้นคือ "ค่อนข้างดี"

นอกจากนี้ข้อเสนอแนะในช่วงต้นยังชี้ให้เห็นว่านอกเหนือจากการปรับปรุงงานทางเทคนิคแล้วโมเดลใหม่อาจให้ประสบการณ์การสนทนาที่มีมนุษยธรรมมากขึ้น อย่างไรก็ตามเนื่องจากข้อมูลมาตรฐานยังไม่ได้รับการเผยแพร่โดยหน่วยงานการประเมินเบื้องต้นเหล่านี้จำเป็นต้องมีการตรวจสอบเพิ่มเติม

3. ทัศนคติโอเพนซอร์สใหม่: ชุมชนตอบสนองอย่างกระตือรือร้นภายใต้โปรโตคอล MIT

ซึ่งแตกต่างจากรุ่นก่อนหน้า Deepseek-V3-0324 ใช้โปรโตคอลโอเพ่นซอร์ส MIT ที่ผ่อนคลายมากขึ้นการเปลี่ยนแปลงที่ได้รับการยอมรับอย่างกว้างขวางว่าเป็นการพัฒนาเชิงบวก นักวิจารณ์เทคโนโลยีชี้ให้เห็นว่านอกเหนือจากการเพิ่มประสิทธิภาพที่สำคัญในความสามารถในการเขียนโปรแกรมแล้วโมเดลยังใช้โปรโตคอลโอเพนซอร์ซแบบเปิดที่มากขึ้น ขณะนี้รุ่นนี้มีอยู่บนแพลตฟอร์มโอเพนซอร์สที่มีปริมาณพารามิเตอร์ 68.5 พันล้านซึ่งสะท้อนทัศนคติที่เปิดกว้างของ Deepseek ต่อชุมชนโอเพ่นซอร์ส

การตอบสนองที่อบอุ่นจากส่วนความคิดเห็นของใบหน้ากอดตรวจสอบการสังเกตนี้ ข้อได้เปรียบสองประการของโอเพนซอร์สและการปรับปรุงประสิทธิภาพทำให้ Deepseek-V3-0324 ได้รับการยกย่องว่าเป็นตัวเปลี่ยนอุตสาหกรรมที่มีศักยภาพและอาจท้าทายสถานะของรุ่นปิดเช่น Openai GPT-4O หรือ Anthropic Claude 3.5 Sonnet

4. ประสบการณ์ผู้ใช้: การเปลี่ยนจากเว็บไซต์อย่างเป็นทางการเป็น API อย่างไร้รอยต่อ

แพลตฟอร์ม OpenRouter ได้เปิดอินเทอร์เฟซ API

Deepseek ยังปรับปรุงประสบการณ์ผู้ใช้ในการอัปเดตนี้ ตามรายงานทางเทคนิคผู้ใช้จะต้องปิดฟังก์ชั่น "การคิดอย่างลึกซึ้ง" บนเว็บไซต์ทางการเพื่อใช้เวอร์ชัน V3-0324 โดยตรงในขณะที่อินเตอร์เฟส API และวิธีการใช้งานยังคงไม่เปลี่ยนแปลง การออกแบบการสลับแบบไร้รอยต่อนี้ช่วยลดเกณฑ์การใช้งานและได้รับการตอบรับอย่างดีจากชุมชน

รายงานยังชี้ให้เห็นว่าแพลตฟอร์มของบุคคลที่สามได้ให้การเข้าถึง API ซึ่งแสดงให้เห็นถึงความสามารถในการปรับตัวที่รวดเร็วของระบบนิเวศ

5. แนวโน้มในอนาคต: โหมโรงถึง R2?

แม้ว่าจะถูกทำเครื่องหมายว่าเป็น "การอัพเกรดรุ่นเล็ก" แต่ผลกระทบของการอัปเดตนี้นั้นเกินความคาดหมาย หลายคนในชุมชนเทคโนโลยีคาดการณ์ว่าสิ่งนี้จะปูทางไปสู่ Deepseek-R2 ที่กำลังจะมาถึงหรือไม่ ก่อนหน้านี้โมเดล R1 ของ Deepseek ได้แข่งขันกับโมเดล O1 ของ OpenAI ในการใช้เหตุผลเชิงตรรกะและงานทางคณิตศาสตร์และการเปิดตัว V3-0324 ถือเป็นพื้นฐานทางเทคนิคสำหรับการสะสมของแบบจำลองการอนุมานรุ่นต่อไป แม้ว่า Deepseek ยังไม่ได้ยืนยันวันที่วางจำหน่ายเฉพาะสำหรับ R2 แต่ความคาดหวังของชุมชนก็ร้อนขึ้นอย่างชัดเจน

6. สรุป: การเพิ่มขึ้นอย่างแข็งแกร่งของคีย์ต่ำ

การเปิดตัว Deepseek-V3-0324 ยังคงดำเนินต่อไปตามสไตล์ปกติของ บริษัท : การเปิดตัวคีย์ต่ำและประสิทธิภาพที่ยอดเยี่ยม จากระดับพารามิเตอร์ 68.5 พันล้านพารามิเตอร์ไปจนถึงการปรับปรุงที่สำคัญในความสามารถทางคณิตศาสตร์และการเขียนโปรแกรมไปจนถึงกลยุทธ์โอเพ่นซอร์สของโปรโตคอล MIT โมเดลนี้ได้ฉีดพลังใหม่ลงในสนามของ AI อย่างไม่ต้องสงสัย ตามที่ผู้ตรวจสอบทางเทคนิคคนหนึ่งอธิบายว่า: "พื้นผิวมีความสำคัญต่ำ แต่จริงๆแล้วมันมีประสิทธิภาพเท่ากับเสือ" แม้กระทั่งก่อนที่รายละเอียดทางเทคนิคจะถูกเปิดเผยอย่างเต็มที่นักพัฒนาและนักวิจัยก็กระตือรือร้นที่จะเข้าทดสอบเพื่อพยายามแตะศักยภาพที่เต็มไปด้วย "สัตว์ร้าย" นี้

ด้วยผลการตรวจสอบเพิ่มเติมที่ปล่อยออกมาไม่ว่า Deepseek-V3-0324 จะสามารถเขย่าภูมิทัศน์ AI ที่มีอยู่ได้อย่างแท้จริงหรือไม่ยังคงให้ความสนใจในอีกไม่กี่สัปดาห์ข้างหน้า เพื่อให้แน่ใจว่า Deepseek กำลังเคลื่อนไหวอย่างต่อเนื่องในการแข่งขัน AI ทั่วโลกในแบบที่ไม่เหมือนใคร