
โครงการนี้เป็นบทช่วยสอนเกี่ยวกับโมเดลเด็กจีนพิเศษสำหรับรุ่นโอเพนซอร์สสำหรับผู้เริ่มต้นในประเทศและขึ้นอยู่กับแพลตฟอร์ม Linux ให้คำแนะนำเต็มรูปแบบสำหรับโมเดลโอเพนซอร์สต่างๆรวมถึงการกำหนดค่าสิ่งแวดล้อมการปรับใช้ในท้องถิ่นการปรับแต่งที่มีประสิทธิภาพและทักษะอื่น ๆ ทำให้การปรับใช้การใช้งานและกระบวนการแอปพลิเคชันของแบบจำลองโอเพนซอร์สง่ายขึ้นทำให้นักเรียนและนักวิจัยทั่วไปใช้แบบจำลองโอเพนซอร์สได้ดีขึ้น
เนื้อหาหลักของโครงการนี้รวมถึง:
เนื้อหาหลักของโครงการคือการสอนเพื่อให้นักเรียนและผู้ปฏิบัติงานในอนาคตสามารถเข้าใจและทำความคุ้นเคยกับวิธีการกินแบบจำลองโอเพนซอร์สขนาดใหญ่! ทุกคนสามารถเสนอปัญหาหรือส่ง PR เพื่อสร้างและบำรุงรักษาโครงการนี้ร่วมกัน
นักเรียนที่ต้องการมีส่วนร่วมอย่างลึกซึ้งสามารถติดต่อเราและเราจะเพิ่มคุณในโครงการดูแลโครงการ
ข้อเสนอแนะการเรียนรู้: คำแนะนำการเรียนรู้สำหรับโครงการนี้คือการเรียนรู้การกำหนดค่าสภาพแวดล้อมก่อนจากนั้นเรียนรู้การปรับใช้และการใช้งานแบบจำลองและในที่สุดก็เรียนรู้การปรับแต่งอย่างละเอียด เนื่องจากการกำหนดค่าสภาพแวดล้อมเป็นพื้นฐานการปรับใช้และการใช้แบบจำลองเป็นพื้นฐานและการปรับแต่งเป็นขั้นสูง ผู้เริ่มต้นสามารถเลือก QWEN1.5, InternLM2, MINICPM และโมเดลอื่น ๆ เพื่อจัดลำดับความสำคัญการเรียนรู้
หมายเหตุ: หากนักเรียนต้องการเข้าใจองค์ประกอบของโมเดลของโมเดลขนาดใหญ่และงานเขียนเช่น RAG, Agent และ Eval จากศูนย์พวกเขาสามารถเรียนรู้โครงการอื่นของ Datawhale โมเดลขนาดใหญ่เป็นหัวข้อร้อนแรงในสาขาการเรียนรู้อย่างลึกซึ้งในปัจจุบัน แต่บทช่วยสอนขนาดใหญ่ที่มีอยู่ส่วนใหญ่มีเพียงการสอนวิธีเรียก APIs เพื่อให้การประยุกต์ใช้แบบจำลองขนาดใหญ่เสร็จสมบูรณ์และมีเพียงไม่กี่คนที่สามารถอธิบายโครงสร้างแบบจำลองผ้าขี้ริ้วตัวแทนและการประเมินจากระดับหลัก ดังนั้นที่เก็บจะให้ลายมือทั้งหมดและไม่ใช้รูปแบบของการโทร API เพื่อทำ RAG, Agent และงานประเมินของโมเดลขนาดใหญ่
หมายเหตุ: เมื่อพิจารณาว่านักเรียนบางคนหวังที่จะเรียนรู้ส่วนทฤษฎีของแบบจำลองขนาดใหญ่ก่อนที่จะศึกษาโครงการนี้หากพวกเขาต้องการศึกษาพื้นฐานทางทฤษฎีของ LLM และเข้าใจเพิ่มเติมและใช้ LLM บนพื้นฐานของทฤษฎี
หมายเหตุ: หากนักเรียนคนใดต้องการพัฒนาแอปพลิเคชั่นขนาดใหญ่ด้วยตัวเองหลังจากเรียนหลักสูตรนี้ นักเรียนสามารถอ้างถึงหลักสูตรการพัฒนาแอพพลิเคชั่นขนาดใหญ่ของ Datawhale ซึ่งเป็นแบบฝึกหัดการพัฒนาแอพพลิเคชั่นขนาดใหญ่สำหรับสามเณร มันมีจุดมุ่งหมายเพื่อนำเสนอกระบวนการพัฒนาแอปพลิเคชันขนาดใหญ่ให้กับนักเรียนตามเซิร์ฟเวอร์อาลีบาบาคลาวด์อย่างเต็มที่และรวมกับโครงการผู้ช่วยฐานความรู้ส่วนบุคคล
นางแบบขนาดใหญ่คืออะไร?
โมเดลขนาดใหญ่ (LLM) หมายถึงโมเดลการประมวลผลภาษาธรรมชาติ (NLP) ที่ได้รับการฝึกฝนตามอัลกอริทึมการเรียนรู้เชิงลึก พวกเขาส่วนใหญ่จะใช้ในสาขาต่าง ๆ เช่นความเข้าใจภาษาธรรมชาติและการสร้าง ในวงกว้างพวกเขายังรวมถึงรุ่น Machine Vision (CV) ขนาดใหญ่แบบจำลองขนาดใหญ่หลายรูปแบบและการคำนวณทางวิทยาศาสตร์แบบจำลองขนาดใหญ่
การต่อสู้ของโมเดลหลายร้อยรุ่นนั้นเต็มไปด้วยการแกว่งและ LLM โอเพนซอร์สก็เกิดขึ้นหลังจากนั้นอีก ทุกวันนี้ LLM โอเพ่นซอร์สที่ยอดเยี่ยมจำนวนมากได้ปรากฏตัวทั้งที่บ้านและต่างประเทศเช่น Llama และ Alpaca และในประเทศเช่น Chatglm, Baichuan, Internlm (Scholar Puyu) ฯลฯ โอเพ่นซอร์ส LLM สนับสนุนการปรับใช้ผู้ใช้ในท้องถิ่น ทุกคนสามารถสร้างโมเดลขนาดใหญ่ที่เป็นเอกลักษณ์ของตัวเองตาม Open Source LLM
อย่างไรก็ตามหากนักเรียนทั่วไปและผู้ใช้ต้องการใช้โมเดลขนาดใหญ่เหล่านี้พวกเขาจำเป็นต้องมีความสามารถทางเทคนิคบางอย่างเพื่อให้การปรับใช้และการใช้งานของแบบจำลองเสร็จสมบูรณ์ สำหรับโอเพนซอร์ส LLMS ที่เกิดขึ้นหลังจากนั้นเป็นงานที่ค่อนข้างท้าทายในการควบคุมวิธีแอปพลิเคชันของโอเพนซอร์ส LLM อย่างรวดเร็ว
โครงการนี้มีจุดมุ่งหมายที่จะตระหนักถึงการปรับใช้การใช้งานและการปรับแต่งการปรับแต่งของ LLM โอเพนซอร์สที่สำคัญในบ้านและต่างประเทศตามประสบการณ์ของผู้มีส่วนร่วมหลัก หลังจากตระหนักถึงส่วนที่เกี่ยวข้องของ LLM กระแสหลักเราหวังว่าจะรวบรวมผู้ร่วมสร้างอย่างเต็มที่เพื่อเสริมสร้างโลกแห่งโอเพ่นซอร์ส LLM และสร้างแบบฝึกหัดที่ครอบคลุมมากขึ้นสำหรับ LLMs พิเศษ ประกายไฟจุดมาบรรจบกันในทะเล
เราหวังว่าจะเป็นบันไดสำหรับ LLM และประชาชนทั่วไปและยอมรับโลก LLM ที่งดงามและกว้างใหญ่ยิ่งขึ้นด้วยจิตวิญญาณแห่งเสรีภาพและความเท่าเทียมกันของโอเพ่นซอร์ส
โครงการนี้เหมาะสำหรับผู้เรียนต่อไปนี้:
โครงการนี้วางแผนที่จะจัดระเบียบกระบวนการทั้งหมดของแอปพลิเคชัน LLM โอเพนซอร์สรวมถึงการกำหนดค่าและการใช้งานด้านสิ่งแวดล้อมการปรับใช้และแอปพลิเคชันการปรับแต่ง ฯลฯ แต่ละส่วนครอบคลุมกระแสหลักและคุณสมบัติ Open Source LLM:
Chat-Huanhuan: Chat-Zhen Huan เป็นรูปแบบภาษาแชทที่เลียนแบบน้ำเสียงของ Zhen Huan โดยใช้บรรทัดและประโยคทั้งหมดเกี่ยวกับ Zhen Huan ในสคริปต์ "The Legend of Zhen Huan" และการปรับแต่งตาม LLM
TIANJI: Tianji เป็นสถานการณ์ทางสังคมตามความรู้สึกของมนุษย์และสไตล์ทางโลกครอบคลุมกระบวนการทั้งหมดของวิศวกรรมคำที่รวดเร็วการผลิตร่างกายอัจฉริยะการเก็บข้อมูลและการปรับแต่งแบบจำลองการทำความสะอาดข้อมูล RAG ฯลฯ ฯลฯ
Qwen2.5-coder
QWEN2-VL
Qwen2.5
Apple Openelm
LLAMA3_1-8B-Instruct
Gemma-2-9b-it
yuan2.0
Yuan2.0-M32
DEEPSEEEK-CODER-V2
bilibili index-1.9b
Qwen2
GLM-4
Qwen 1.5
Google - Gemma
Phi-3
ตัวละคร-6b
Llama3-8b-Instruct
xverse-7b-chat
transnormerllm
Bluelm Vivo Blue Heart Model
internlm2
การค้นหาเชิงลึกลึก
MINICPM
Qwen-Audio
Qwen
หนึ่งพันสิ่ง
Baichuan ฉลาด
ผู้ฝึกงาน
Atom (Llama2)
chatglm3
Pip, Conda Change Source @ ไม่มีหัวหอม, ขิง, กระเทียม
Autodl Open Port @Don't Spicy Ginger and Garlic
ดาวน์โหลดรุ่น
ปัญหา && pr
หมายเหตุ: การจัดอันดับจะถูกจัดเรียงตามระดับการบริจาค
