ด้วยความรวดเร็วของสิ่งต่าง ๆ ที่เคลื่อนไหวในพื้นที่ Devai ซึ่งเป็นชวเลขสำหรับชุมชนนักพัฒนาซอฟต์แวร์ที่สร้างซอฟต์แวร์ด้วยความช่วยเหลือของแบบจำลองภาษาขนาดใหญ่ (LLMS) จึงเป็นเรื่องท้าทายที่จะทราบว่าจะใช้แบบจำลองใด
เราเริ่มต้นที่เก็บนี้ตามประสบการณ์ของเราซึ่งเป็นส่วนหนึ่งของชุมชนต่อ อย่าลังเลที่จะแนะนำการปรับปรุงและช่วยให้เรารักษาความทันสมัยโดยการเปิดคำขอดึง!
LLM มีจำนวนมาก เราตัดสินใจที่จะมุ่งเน้นไปที่สิ่งที่เราเห็นคนที่ใช้อยู่ตอนนี้:

คุณสามารถค้นหา CSV ที่มีโมเดลและข้อมูลเหล่านี้ทั้งหมดเกี่ยวกับพวกเขาได้ที่นี่
ตัวเลือกแรกที่คุณทำคือไม่ว่าคุณจะใช้ โอเพ่นซอร์ส หรือโมเดล เชิงพาณิชย์ :
หากคุณตัดสินใจที่จะใช้ LLM โอเพนซอร์ซ การตัดสินใจครั้งต่อไปของคุณคือการตั้งค่าโมเดลบนเครื่องในพื้นที่ของคุณหรือบนผู้ให้บริการโมเดลโฮสต์:
เรารักษาคำแนะนำเกี่ยวกับวิธีการปรับใช้รหัสโอเพนซอร์ซ LLM สำหรับทีมของคุณที่นี่
หากคุณตัดสินใจที่จะใช้ LLM เชิงพาณิชย์ โดยทั่วไปคุณจะได้รับปุ่ม API และเล่นกับหลาย ๆ ของพวกเขาเพื่อเปรียบเทียบ ทั้งคุณภาพของคำแนะนำและค่าใช้จ่ายในการใช้อาจเป็นเกณฑ์ที่สำคัญ
นี่คือรายการของ LLM โอเพนซอร์ส ที่นักพัฒนาใช้ขณะเข้ารหัสซึ่งได้รับคำสั่งจากความนิยมมากที่สุดจนถึงความนิยมน้อยที่สุด ณ เดือนตุลาคม 2566
Code Llama เป็น LLM ที่ได้รับการฝึกฝนโดย Meta สำหรับการสร้างและอภิปรายรหัส มันถูกสร้างขึ้นที่ด้านบนของ Llama 2 แม้ว่ามันจะอยู่ด้านล่าง WizardCoder และ Phind-Codellama บนลีดเดอร์บอร์ด Model Big Code มันเป็นรูปแบบพื้นฐานสำหรับทั้งคู่ นอกจากนี้ยังมีหลายขนาด: 7b, 13b และ 34b ซึ่งทำให้เป็นที่นิยมในการใช้กับเครื่องจักรในท้องถิ่นรวมถึงผู้ให้บริการที่โฮสต์ ณ จุดนี้มันเป็นรูปแบบฐานโอเพนซอร์ซที่รู้จักกันดีที่สุดสำหรับการเข้ารหัสและเป็นผู้นำความพยายามโอเพนซอร์ซในการสร้าง LLM ที่มีความสามารถในการเข้ารหัส
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder เป็น LLM ที่สร้างขึ้นบนรหัส Llama โดยทีม Wizardlm วิธีการที่มีการควบคุมแบบ Evol ถูกปรับให้เข้ากับการเข้ารหัสงานเพื่อสร้างชุดข้อมูลการฝึกอบรมซึ่งใช้ในการปรับแต่งรหัส Llama มันมีขนาดเท่ากันกับรหัส LLAMA: 7B, 13B และ 34B เป็นผลให้ LLM ที่ได้รับความนิยมมากที่สุดที่ได้รับความนิยมมากที่สุด
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama เป็น LLM ที่สร้างขึ้นบนรหัส Llama โดย Phind ชุดข้อมูลที่เป็นกรรมสิทธิ์ของปัญหาการเขียนโปรแกรมคุณภาพสูง ~ 80K ~ 80K ถูกใช้เพื่อปรับแต่งรหัส Llama แบบจำลองที่ปรับแต่งนั้นได้รับการปรับแต่งเพิ่มเติมในโทเค็นเพิ่มเติม 1.5B ปัจจุบันมันเป็นผู้นำใน LEADERBOARD MODEL BIG CODE อย่างไรก็ตามมีเฉพาะในรูปแบบพารามิเตอร์ 34B ดังนั้นจึงต้องใช้หน่วยความจำที่มีอยู่มากขึ้น
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
Mistral เป็นพารามิเตอร์ 7B LLM ที่ได้รับการฝึกฝนโดย Mistal AI มันเป็นรุ่นที่เพิ่งเปิดตัวล่าสุดในรายการนี้ลดลงเมื่อปลายเดือนกันยายน Mistal AI กล่าวว่ามัน“ เข้าใกล้การแสดง Codellama 7B บนรหัสในขณะที่ยังคงทำงานได้ดีในงานภาษาอังกฤษ” แม้จะมีเพียงแค่ขนาดเล็ก แต่ผู้คนก็ค่อนข้างตื่นเต้นกับมันในสองสามสัปดาห์แรกหลังจากเปิดตัว LLMs ที่ปรับแต่งครั้งแรกที่ใช้เป็นฐานของพวกเขากำลังเริ่มปรากฏขึ้นและเรามีแนวโน้มที่จะเห็นการก้าวไปข้างหน้ามากขึ้น
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
StarCoder เป็นพารามิเตอร์ 15B LLM ที่ได้รับการฝึกฝนโดย BigCode ซึ่งอยู่ข้างหน้าเวลาเมื่อมีการปล่อยตัวในเดือนพฤษภาคม มันได้รับการฝึกฝนเกี่ยวกับภาษาการเขียนโปรแกรม 80+ จากสแต็ก (v1.2) โดยไม่รวมคำขอยกเลิก ไม่ใช่รูปแบบคำสั่งและคำสั่งเช่น "เขียนฟังก์ชั่นที่คำนวณสแควร์รูท" ทำงานได้ไม่ดี อย่างไรก็ตามด้วยการใช้พรอมต์ผู้ช่วยเทคโนโลยีคุณสามารถทำให้มีประโยชน์มากขึ้น
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
Deepseek Coder เป็น LLM ที่ได้รับการฝึกฝนโดย Deepseek AI ใน 2 ล้านล้านโทเค็น ด้วยชุดข้อมูลที่มีมากกว่า 80 ภาษาการเขียนโปรแกรมมันเป็นรูปแบบใหม่ล่าสุดในรายการนี้และได้รับการรายงานว่ามีคะแนนค่อนข้างสูงในเกณฑ์มาตรฐานที่เกี่ยวข้องกับการเข้ารหัส
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
Llama 2 เป็น LLM ที่ได้รับการฝึกฝนโดย Meta ใน 2 ล้านล้านโทเค็น มันเป็น LLM โอเพนซอร์สที่ได้รับความนิยมมากที่สุดดังนั้นนักพัฒนาบางคนจึงใช้มันแม้ว่าจะไม่ดีเท่าโมเดลหลายรุ่นด้านบนในการแก้ไขรหัส นอกจากนี้ยังมีความสำคัญเนื่องจาก Code Llama ซึ่งเป็น LLM ที่ได้รับความนิยมมากที่สุดสำหรับการเข้ารหัสนั้นถูกสร้างขึ้นที่ด้านบนของมันซึ่งจะเป็นรากฐานสำหรับ WizardCoder และ Phind-Codellama
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
นี่คือรายการของ LLM เชิงพาณิชย์ ที่นักพัฒนาใช้ขณะเข้ารหัสซึ่งได้รับคำสั่งจากความนิยมมากที่สุดจนถึงความนิยมน้อยที่สุด ณ เดือนตุลาคม 2566
GPT-4 จาก OpenAI โดยทั่วไปถือว่าเป็น LLM ที่ดีที่สุดในการใช้งานขณะเข้ารหัส มันค่อนข้างมีประโยชน์เมื่อสร้างและอภิปรายรหัส อย่างไรก็ตามคุณต้องส่งรหัสไปยัง OpenAI ผ่าน API ของพวกเขาและอาจมีราคาค่อนข้างแพง อย่างไรก็ตามมันเป็น LLM ที่ได้รับความนิยมมากที่สุดสำหรับการเข้ารหัสโดยรวมและนักพัฒนาส่วนใหญ่ใช้ในขณะที่เขียนโค้ด ณ จุดนี้ ผู้ใช้ OpenAI API ทั้งหมดที่ชำระเงินได้สำเร็จ $ 1 หรือมากกว่าก่อนวันที่ 6 กรกฎาคม 2023 ได้รับการเข้าถึง GPT-4 และพวกเขาวางแผนที่จะเปิดการเข้าถึงนักพัฒนาทั้งหมดในไม่ช้า
GPT-4 Turbo จาก OpenAI นั้นถูกกว่าและเร็วกว่า GPT-4 มีการตัดความรู้ในเดือนเมษายน 2566 และมีหน้าต่างบริบท 128K ปัจจุบันอยู่ในพรีวิว ณ เดือนพฤศจิกายน 2566 แต่ทุกคนที่มีบัญชี OpenAI API และการเข้าถึง GPT-4 ที่มีอยู่สามารถใช้งานได้
GPT-3.5 Turbo จาก OpenAI นั้นถูกกว่าและเร็วกว่า GPT-4; อย่างไรก็ตามคำแนะนำของมันไม่ได้เป็นประโยชน์ นอกจากนี้ยังต้องการให้คุณส่งรหัสไปยัง OpenAI ผ่าน API ของพวกเขา มันเป็น LLM ที่ได้รับความนิยมมากเป็นอันดับสองสำหรับการเข้ารหัสโดยรวมจนถึงตอนนี้ นักพัฒนาทั้งหมดสามารถใช้งานได้ทันทีหลังจากลงทะเบียนสำหรับบัญชี OpenAI
Claude 2 เป็น LLM ที่ได้รับการฝึกฝนโดยมานุษยวิทยาซึ่งมีทักษะการเข้ารหัสที่ดีขึ้นอย่างมากเมื่อเทียบกับ Claude เวอร์ชันแรก โดยเฉพาะอย่างยิ่งมันเก่งเมื่อเทียบกับ LLM อื่น ๆ เมื่อคุณให้บริบทมากมาย คุณต้องส่งรหัสของคุณไปยังมานุษยวิทยาผ่าน API ของพวกเขา คุณต้องสมัครเพื่อเข้าถึง Claude 2 ณ จุดนี้
Palm 2 เป็น LLM ที่ได้รับการฝึกฝนโดย Google ในการทดลองใช้คุณต้องส่งรหัสของคุณไปยัง Google ผ่าน Palm API หลังจากได้รับรหัส API ผ่าน Makersuite ซึ่งทั้งสองอย่างนี้อยู่ในตัวอย่างสาธารณะ
หากคุณเห็นแบบจำลองที่ขาดหายไปหรือต้องการแบ่งปันความคิดเห็นเรายินดีต้อนรับคุณให้เปิดประชาสัมพันธ์หรือปัญหา! เราหวังว่าจะรักษาดัชนีที่ขับเคลื่อนด้วยชุมชนและทันสมัยของแบบจำลองภาษาที่มีประโยชน์มากที่สุดสำหรับการเข้ารหัส
หากคุณชอบโพสต์บล็อกนี้และต้องการอ่านเพิ่มเติมเกี่ยวกับ Devai - ชุมชนของผู้สร้างซอฟต์แวร์สร้างซอฟต์แวร์ด้วยความช่วยเหลือของ LLMS - ในอนาคตเข้าร่วมจดหมายข่าวรายเดือนของเราที่นี่