การพัฒนาอย่างรวดเร็วของ generative AI โดยเฉพาะโมเดลซีรีส์ GPT ได้นำความเป็นไปได้ใหม่ๆ มาสู่หลายสาขา จากการปรับปรุงที่สำคัญของคะแนนสอบเนติบัณฑิตไปจนถึงการใช้งานในสาขาธุรกิจ GPT-4 ได้แสดงให้เห็นถึงความสามารถอันทรงพลัง อย่างไรก็ตาม ผู้เชี่ยวชาญในอุตสาหกรรมบางคนตั้งคำถามถึงความสามารถในการทำความเข้าใจและความน่าเชื่อถือของ generative AI ในปัจจุบัน โดยเชื่อว่าความสามารถในการให้เหตุผลและความเข้าใจโลกยังคงไม่เพียงพอ และการพัฒนาในอนาคตยังคงเผชิญกับความท้าทายมากมาย บรรณาธิการของ Downcodes จะพาคุณไปสำรวจทิศทางการพัฒนาในอนาคตของ generative AI อย่างลึกซึ้ง รวมถึงโอกาสและความท้าทายที่อุตสาหกรรม generative AI ในประเทศต้องเผชิญ
ทิศทางการพัฒนา generative AI ในอนาคตอยู่ที่ไหน?
ไม่อาจปฏิเสธได้ว่า GPT-4 ในปัจจุบันได้รับการปรับปรุงอย่างมากในความสามารถหลายประการ เมื่อเทียบกับ GPT-3.5 ประสิทธิภาพของ GPT-4 ในสาขาวิชาชีพที่ซับซ้อนได้รับการปรับปรุงอย่างมาก และความสามารถในการให้เหตุผลเชิงตรรกะก็แข็งแกร่งขึ้นเช่นกัน ในการตรวจสอบคุณสมบัติบาร์ของสหรัฐอเมริกา คะแนนของ GPT-4 สามารถเข้าถึง 10% สูงสุด แต่ GPT-4 3.5 สามารถไปถึงระดับต่ำสุด 10% เท่านั้น

แหล่งที่มาของภาพ: เปิด AI
การปรับปรุงความสามารถที่สำคัญยังช่วยให้ Chat GPT เปิดสถานการณ์การใช้งานได้มากขึ้น ปัจจุบัน Open AI ได้จัดเตรียมสถานการณ์การใช้งานที่สำคัญหลายประการอย่างเป็นทางการ เช่น การเพิ่ม AI ลงใน Duolingo เพื่อแชทกับผู้ใช้ทุกวันเพื่อเร่งการเรียนรู้ภาษาของผู้ใช้ Morgan Stanley ใช้ GPT-4 เพื่อจัดการฐานความรู้เพื่อช่วยให้พนักงานเข้าถึงได้อย่างรวดเร็ว เนื้อหาที่คุณต้องการ
อย่างไรก็ตาม บริษัทยักษ์ใหญ่หลายแห่งมีข้อสงสัยเกี่ยวกับความสามารถในปัจจุบันของ GPT Stuart Russell ชี้ให้เห็นในสุนทรพจน์ของเขาว่า Chat GPT และ GPT-4 ไม่เข้าใจโลก และไม่ได้ "ตอบคำถาม" แบบจำลองภาษาขนาดใหญ่ในปัจจุบันเป็นเพียงส่วนหนึ่งของปริศนา สิ่งที่ขาดหายไปจากปริศนานี้และอะไร ในที่สุดก็จะมีลักษณะเช่นนี้ สิ่งเหล่านี้ไม่แน่นอน ข้อบกพร่องด้านความสามารถหลายประการยังกำหนดว่ายังมีหนทางอีกยาวไกลในการพัฒนาปัญญาประดิษฐ์ทั่วไป เนื่องจากมีข้อสงสัยหลายประการเกี่ยวกับความสามารถของ GPT-4 Stuart Russell จึงได้ปรับเปลี่ยน PPT ในระหว่างสุนทรพจน์ของ Sam Altman

แหล่งที่มาของภาพ: การประชุมภูมิปัญญา
ยังมีมุมมองแบบเดียวกับ Stuart Russell ก็คือ Yang Likun ผู้ชนะรางวัล Turing Award ซึ่งเป็นหนึ่งใน "Big Three of Deep Learning" และหัวหน้านักวิทยาศาสตร์ด้านปัญญาประดิษฐ์ของ Meta เขาเชื่อว่าโมเดล GPT แบบ autoregressive ในปัจจุบันยังขาดการวางแผน ซึ่งส่งผลให้ ความสามารถในการให้เหตุผล ปัจจุบันไม่สามารถทำได้ หากมีการสร้างแบบจำลองภาษาขนาดใหญ่ตามความน่าจะเป็น ก็เป็นไปไม่ได้เลยที่จะแก้ไขปัญหาข้อผิดพลาด เมื่อข้อความที่ป้อนเพิ่มขึ้น ความน่าจะเป็นของข้อผิดพลาดก็จะเพิ่มขึ้นแบบทวีคูณเช่นกัน
อันที่จริงข้อกล่าวหาของชายใหญ่สองคนต่อ GPT นั้นไม่ใช่เรื่องที่ไม่สมเหตุสมผล เนื่องจากอัลกอริทึม RLHF ที่ Chat GPT ใช้นั้นอาศัยการรับรู้ของมนุษย์ จึงช่วยให้โมเดลตัดสินคุณภาพของคำตอบของตัวเองและฝึกฝนตัวเองให้ค่อยๆ ให้คำตอบที่มีคุณภาพสูงขึ้นได้ หากคุณต้องการปรับปรุงความสามารถในการให้เหตุผลของโมเดล คุณต้องเสริมพารามิเตอร์จำนวนมากในฐานข้อมูลและทำซ้ำอัลกอริทึมอย่างต่อเนื่อง

ที่มา: หลักทรัพย์ตะวันตกเฉียงใต้
อย่างไรก็ตาม การมีอยู่ของความเสี่ยงต่างๆ ยังขัดขวางบริษัท AI จำนวนมากจากการพยายามอย่างง่ายดาย หาก generative AI สามารถบรรลุความสามารถในการให้เหตุผลในเรื่องและความสามารถในการสร้างอารมณ์ของตัวละครแบบเดียวกับนักเขียนนวนิยาย สิ่งนี้จะทำให้ AI กำเนิดอยู่เหนือการควบคุมของมนุษย์โดยสิ้นเชิงหรือไม่? แม้ว่าสิ่งนี้จะทำให้เกิดความตื่นตระหนกไปทั่วโลก แต่จะต้องเผชิญกับการกำกับดูแลอย่างเข้มงวดจากรัฐบาลท้องถิ่น ซึ่งจะทำให้การลงทุนใน generative AI ก่อนหน้านี้สูญเปล่าหรือไม่
สำหรับทิศทางการพัฒนาในอนาคตของ generative AI คำตอบของ Yang Likun คือโมเดลระดับโลก แบบจำลองโลกนี้ไม่เพียงแต่เลียนแบบสมองมนุษย์ในระดับประสาทเท่านั้น แต่ยังเป็นแบบจำลองโลกที่เหมาะกับการแบ่งส่วนสมองของมนุษย์ในแง่ของโมดูลการรับรู้ ความแตกต่างที่ใหญ่ที่สุดระหว่างแบบจำลองนี้กับแบบจำลองภาษาขนาดใหญ่ก็คือสามารถทำได้ มีความสามารถในการวางแผนและคาดการณ์ (แบบจำลองโลก) และความสามารถในการคิดต้นทุน (โมดูลต้นทุน)
ด้วยความช่วยเหลือของแบบจำลองโลก เราสามารถเข้าใจโลกได้ดีขึ้น และคาดการณ์และวางแผนอนาคตได้ ผ่านโมดูลการบัญชีต้นทุน รวมกับความต้องการที่เรียบง่าย (อนาคตจะต้องวางแผนตามตรรกะที่ช่วยประหยัดต้นทุนการดำเนินการได้มากที่สุด) สามารถกำจัดสารพิษที่อาจเกิดขึ้นและผลที่ตามมาที่ไม่จำเป็นได้

แหล่งที่มาของภาพ: การประชุมภูมิปัญญา
แต่ปัญหาคือพารามิเตอร์ อัลกอริธึม ต้นทุน ฯลฯ ของแบบจำลองโลกระหว่างการฝึกอบรม หยาง ลี่คุนเพียงแค่ให้แนวคิดเชิงกลยุทธ์บางอย่าง ตัวอย่างเช่น การใช้แบบจำลองที่มีการดูแลตนเองในการฝึกอบรมและสร้างแบบจำลองการคิดหลายระดับ ฯลฯ แต่ Yang Likun ไม่สามารถวางแผนที่สมบูรณ์เกี่ยวกับวิธีการนำไปปฏิบัติได้
ผู้เข้าร่วมรายอื่นไม่ได้เปิดเผยความคิดเห็นเกี่ยวกับทิศทางการพัฒนาในอนาคตของ generative AI ดังนั้น generative AI ที่ตามมาจะยังคงรักษาสถานการณ์ที่แต่ละบริษัท "ทำในสิ่งของตัวเอง" และ AI เจนเนอเรทีฟที่รวมเป็นหนึ่งเดียวทั่วโลกอาจอยู่ในขั้นตอนห้องปฏิบัติการเท่านั้น
03. การทำนาย AI กำเนิดในประเทศ
ศาสตราจารย์ Huang Tiejun ประธานสถาบันวิจัย Zhiyuan กล่าวในการให้สัมภาษณ์กับสื่อหลังการประชุมว่าปัญหาในปัจจุบันของโมเดล AI ขนาดใหญ่ในประเทศคืออุตสาหกรรมมีความร้อนมากเกินไป แต่ข้อมูลการฝึกอบรมมีขนาดเล็กเกินไป และข้อมูลนับหมื่นล้าน ของโมเดลต่างๆ ที่เพิ่งเกิดขึ้นเท่านั้น แม้ว่าจะมีความสามารถด้านเทคนิคอยู่บ้าง เนื่องจากความพยายามซ้ำแล้วซ้ำเล่า ในขณะที่ทรัพยากรในอุตสาหกรรมมีการกระจายตัวมากขึ้น แต่ก็ยังมีช่องว่างบางอย่างระหว่างระดับสติปัญญาและโมเดล AI ที่สร้างจากต่างประเทศขนาดใหญ่
ดังที่ศาสตราจารย์ Huang Tiejun กล่าว ให้ยกตัวอย่างโมเดลขนาดใหญ่ "Tongyi Qianwen" ของอาลีบาบา เนื่องจากข้อมูลที่ใช้สำหรับการฝึกอบรมโมเดลขนาดใหญ่นี้เป็นบทสนทนาและบทสนทนาภาษาจีนจำนวนมากที่ดึงมาจาก Taobao, Alipay, Tmall ของอาลีบาบา และอุตสาหกรรมอื่น ๆ จำนวนข้อมูลก่อนการฝึกสำหรับข้อมูลข้อความ รวมถึงข้อมูลข้อความจากแหล่งอื่นๆ มีจำนวนประมาณ 200 พันล้านคำ เทียบเท่ากับข้อมูลข้อความ 14TB
ปริมาณข้อมูลการฝึกอบรมของ Chat GPT อยู่ที่ประมาณ 4.5 พันล้านคำ ซึ่งเทียบเท่ากับข้อมูลข้อความขนาด 300GB ข้อมูลการฝึกอบรมค่อนข้างน้อย ดังนั้น "Tongyi Qianwen" ของอาลีบาบายังขาดความสามารถแบบหลายรูปแบบ ในแง่ของข้อความ ทั้งสองอย่างยังตามหลัง GPT-4 มาก
ตามข้อมูลจาก "รายงานการประเมินความสามารถที่ครอบคลุมของโมเดลภาษาขนาดใหญ่ปี 2023" ที่เผยแพร่โดยศูนย์วิจัย InfoQ ปัจจุบัน Chat GPT เป็นผู้นำผู้ผลิตโมเดลขนาดใหญ่อื่นๆ ในประเทศด้วยคะแนนครอบคลุม 77.13%

ที่มา: "รายงานการประเมินความสามารถที่ครอบคลุมของโมเดลภาษาขนาดใหญ่ปี 2023"
ในเวลาเดียวกัน ศาสตราจารย์ Huang Tiejun ยังชี้ให้เห็นว่าแบบจำลองขนาดใหญ่ในปัจจุบันเป็นผลิตภัณฑ์ขั้นกลางของการทำซ้ำทางเทคโนโลยี ด้วยการพัฒนาอุตสาหกรรมแบบจำลองขนาดใหญ่ในประเทศในเวลาต่อมา จำนวนระบบนิเวศแบบจำลองขนาดใหญ่ที่เหมาะสมที่สามารถอยู่รอดได้ในอนาคตคือประมาณสามตัว .
ดังที่ศาสตราจารย์ Huang Tiejun กล่าว Ma Huateng ชี้ให้เห็นในการประชุมระดับสูงภายใน Tencent ว่าเงินปันผลจากตลาด C-end จะหายไปในอีกสิบปีข้างหน้า ความหวังทั้งหมดอยู่ที่ตลาด ToB-end และครึ่งหลัง ของอินเทอร์เน็ตเป็นของอินเทอร์เน็ตอุตสาหกรรม ก่อนหน้านี้สถาบันวิจัยธุรกิจ Ali ชี้ให้เห็นว่าในอีก 10 ปีข้างหน้าจะเป็นโอกาสทองสำหรับการเปลี่ยนแปลงขององค์กรแบบดั้งเดิม
อย่างไรก็ตาม ในมุมมองของตลาด ToB โดยเอาตลาด SaaS ที่พัฒนามาหลายปีเป็นข้อมูลอ้างอิง หากโมเดลขนาดใหญ่ต้องการเปิดตลาด ToB อย่างแท้จริง หลักจะต้องนำคุณค่าของ "การลดต้นทุนและ การเพิ่มประสิทธิภาพ" ให้กับลูกค้า โดยเฉพาะอย่างยิ่งในยุคแห่งความไม่แน่นอนในปัจจุบัน โดยเฉพาะอย่างยิ่งเมื่อมีอุตสาหกรรมบางประเภทที่ยังคงมองข้ามโมเดลขนาดใหญ่ ขึ้นอยู่กับอุตสาหกรรมการผลิตแบบดั้งเดิม ปัญหาทั่วไปในปัจจุบันที่อุตสาหกรรมการผลิตแบบดั้งเดิมขนาดเล็กและขนาดกลางประสบคือคำสั่งซื้อที่ลดลง อุตสาหกรรมได้ต่อสู้ในสงครามราคา และวงจรการเรียกเก็บเงินขั้นปลายน้ำได้ยาวนานขึ้น การผลิตขนาดเล็กและขนาดกลางจำนวนมาก อุตสาหกรรมต่างๆ กำลังดิ้นรนเพื่อช่วยเหลือตัวเอง เพื่อหลีกเลี่ยงค่าใช้จ่ายในการลองผิดลองถูกที่สูง บริษัทผู้ผลิตขนาดเล็กและขนาดกลางจำนวนมากจึงไม่กล้าลองใช้โมเดลขนาดใหญ่โดยธรรมชาติ
และเมื่อพิจารณาจากประวัติการพัฒนาของอุตสาหกรรม SaaS อุตสาหกรรม SaaS ในประเทศมีการเติบโตสูงสุดในปี 2558 หลังจากประสบกับความสงบเป็นเวลา 10 ปีนับตั้งแต่ต้นปี 2547 นับตั้งแต่การแพร่ระบาดในปี 2020 โรคระบาดดังกล่าวได้เร่งให้เกิดการเปลี่ยนแปลงทางดิจิทัลขององค์กรต่างๆ และตลาด SaaS ในประเทศก็เข้าสู่ช่วงการเติบโตที่สำคัญ แต่ถึงกระนั้น ระบบนิเวศอุตสาหกรรม SaaS ในประเทศในปัจจุบันยังไม่สมบูรณ์และตลาดยังไม่เติบโตเต็มที่
แหล่งที่มาของภาพ: แฟลชคลาวด์
แน่นอนว่าการเปิดตลาด TOB สำหรับรุ่นใหญ่ไม่ได้เกิดขึ้นในชั่วข้ามคืน แต่เป็นกระบวนการที่ช้ามาก นอกจากนี้ ค่าใช้จ่ายที่เกิดจากอัลกอริธึม พลังการประมวลผล และข้อมูลในระหว่างการวนซ้ำแบบจำลอง รวมถึงการเปิดตัวฟังก์ชันต่างๆ ในเวลาต่อมา ทำให้บริษัทต้นแบบขนาดใหญ่ต้องลงทุนเงินทุนจำนวนมากอย่างต่อเนื่อง
การค้าขายใช้เวลานาน การลงทุนสูง และการทำกำไรในระยะสั้นเป็นเรื่องยาก ในอนาคต บริษัทที่ขาดกระแสเงินสดจะไม่มีทางเลือกอื่นนอกจากต้องปิดโมเดลขนาดใหญ่ของตนเองเมื่อเผชิญกับแรงกดดันทางการเงิน และทรัพยากรอุตสาหกรรมจะยิ่งยากขึ้น เน้นไปที่ผู้ผลิตรุ่นหัวใหญ่
เมื่อพิจารณาจากประสบการณ์ของหลายอุตสาหกรรม เช่น บริการเรียกรถโดยสารออนไลน์และการจัดส่งอาหาร หลังจากความวุ่นวายในอุตสาหกรรมเกิดใหม่มานานหลายปี มีเพียงประมาณ 3 บริษัทเท่านั้นที่สามารถพัฒนาได้อย่างแท้จริงในอนาคต และบริษัทอื่นๆ อีกหลายแห่งจมอยู่ใต้น้ำในประวัติศาสตร์ แม่น้ำสายยาว
โดยรวมแล้ว generative AI อยู่ในขั้นตอนของการพัฒนาอย่างรวดเร็ว โดยมีทั้งโอกาสและความท้าทาย ในอนาคต โมเดลโลกอาจกลายเป็นทิศทางการพัฒนาที่สำคัญ แต่การนำไปปฏิบัติยังคงประสบปัญหาทางเทคนิคและเชิงพาณิชย์มากมาย อุตสาหกรรม Generative AI ในประเทศยังจำเป็นต้องแก้ไขปัญหาต่างๆ เช่น ขนาดของข้อมูล และการใช้งานเชิงพาณิชย์ เพื่อให้โดดเด่นในการแข่งขันที่รุนแรง บรรณาธิการของ Downcodes จะยังคงให้ความสนใจกับแนวโน้มในสาขานี้และนำเสนอเนื้อหาที่น่าตื่นเต้นแก่ผู้อ่านมากขึ้น