ดาวน์โหลด Awesome Domain LLM - ดาวน์โหลดซอร์สโค้ด Awesome Domain LLM

โดเมนที่ยอดเยี่ยม LLM

เนื่องจากการเกิดขึ้นของรูปแบบภาษาขนาดใหญ่ที่แสดงโดย CHATGPT การวิจัยและแอปพลิเคชันรอบใหม่ได้ออกเดินทางและรุ่นทั่วไปมากมายรวมถึง Llama, Chatglm, Baichuan, Qwen ฯลฯ ได้เกิดขึ้น ต่อจากนั้นผู้ปฏิบัติงานจากเขตข้อมูลต่าง ๆ จะนำไปใช้กับสนามแนวตั้งผ่านการฝึกอบรมก่อนการฝึกอบรม/การเรียนการสอนอย่างต่อเนื่องตามแบบจำลองทั่วไป

โครงการนี้มีวัตถุประสงค์เพื่อรวบรวมและจัดเรียง โมเดลโอเพนซอร์ส ชุดข้อมูล และ มาตรฐานการประเมินผล ในเขตข้อมูลแนวตั้ง ทุกคนยินดีที่จะมีส่วนร่วมในรูปแบบโอเพ่นซอร์สชุดข้อมูลมาตรฐานการประเมินผลและเนื้อหาอื่น ๆ ที่ไม่รวมอยู่ในโครงการนี้และส่งเสริมการเสริมสร้างพลังอำนาจของโมเดลขนาดใหญ่ในทุกช่วงชีวิต!

- ต่ออายุ

[2023/11/26] การปรับปรุงความปลอดภัยของเครือข่ายขนาดใหญ่ Model Secgpt, Medical Model Model Chimed-GPT, Financial Big Model Tongyi-Finance-14B, มาตรฐานการประเมินทางการเงิน FinanceBench และ CFBenchmark
[2023/11/01] เพิ่ม DEVOPS Field Model Model ขนาดใหญ่ DevOps-Model และเกณฑ์มาตรฐานการประเมิน DevOps-Eval ที่ออกโดย Ant Group และ Peking University
[2023/10/28] เพิ่มรูปแบบทางการเงิน Disc-Finllm, Medical Model Alpacare และ MarineGpt Model ทางทะเล
[2023/10/19] แบบจำลองทางจิตวิทยา Mentalllama, โมเดลชีวการแพทย์สองภาษา Taiyi (Taiyi) และ Oceangpt Model Oceangpt
[2023/10/10] เพิ่มโมเดลนกฮูกขนาดใหญ่และเกณฑ์มาตรฐานนกฮูก-บัลลังก์สำหรับการดำเนินงานและการบำรุงรักษาที่พัฒนาร่วมกันโดยสถาบันวิจัยอัจฉริยะ Yunzhi และ Beihang เพิ่มเกณฑ์มาตรฐาน LAIW สำหรับการประเมินรูปแบบทางกฎหมายของจีน
[2023/10/05] การเพิ่มรูปแบบจิตวิทยา Chatpsychiatrist, รูปแบบทางการเงิน Investlm, รูปแบบการเกษตร Agrigpt และรูปแบบการแพทย์ Wingpt2
[2023/10/03] มีการเพิ่มเกณฑ์มาตรฐานการประเมินทางกฎหมายสองประการ ได้แก่ Lawbench สำหรับระบบกฎหมายของจีนและกฎหมายสำหรับระบบกฎหมายของสหรัฐอเมริกา
[2023/10/01] เพิ่ม Disc-Lawllm ซึ่งเป็นรูปแบบใหญ่ของสาขากฎหมายที่เปิดโดย Fudan University มีวัตถุประสงค์เพื่อให้บริการด้านกฎหมายมืออาชีพฉลาดและครอบคลุม เพิ่ม Finglm เพื่อสร้างโครงการสวัสดิการสาธารณะที่เปิดกว้างและโครงการทางการเงินที่ยั่งยืนและใช้โอเพ่นซอร์สเพื่อส่งเสริม "AI+Finance"
[2023/9/25] อัปเดต QWEN, เพิ่มรุ่น QWEN-14B และ QWEN-14B-Chat และอัปเดตรุ่น QWEN-7B และ QWEN-7B-Chat เมื่อเปรียบเทียบกับ QWEN-7B ดั้งเดิมเวอร์ชันใหม่ใช้ข้อมูลการฝึกอบรมเพิ่มเติม (2.4T โทเค็น) และความยาวลำดับได้ขยายออกจากปี 2048 เป็น 8192 ความสามารถและความสามารถของรหัสโดยรวมของจีนได้รับการปรับปรุงมาก
[2023/9/22] เพิ่ม Internlm (Scholar Puyu), ห้องปฏิบัติการเซี่ยงไฮ้ AI และเทคโนโลยี Sensetime ร่วมกับมหาวิทยาลัยจีนแห่งฮ่องกงและโมเดลโอเพ่นซอร์สของมหาวิทยาลัย Fudan
[2023/9/15] เพิ่ม Zhongjing-Llama (Zhongjing) รูปแบบการแพทย์จีนที่มีการฝึกอบรมก่อนการปรับแต่งการปรับแต่งและกระบวนการฝึกอบรมที่สมบูรณ์แบบ RLHF
[2023/9/14] เพิ่ม Weaverbird เพื่อเข้าถึงรูปแบบการสนทนาทางการเงินด้วยความรู้ในท้องถิ่นและความสามารถในการค้นหาออนไลน์
[2023/9/13] เพิ่ม Master Mingzha ซึ่งเป็นรูปแบบการพิจารณาคดีที่พัฒนาโดยมหาวิทยาลัยซานตง, Inspur Cloud และมหาวิทยาลัยรัฐศาสตร์และกฎหมายจีน

สารบัญ

- แบบอย่าง
- รูปแบบทั่วไป
- - โมเดลโดเมน
  - - ทางการแพทย์
  - ⚖ถูกกฎหมาย
  - - การเงิน
  - - ให้ความรู้
  - ➕คนอื่น ๆ
ชุดข้อมูล
- เกณฑ์มาตรฐานการประเมิน
- ภาคผนวก
- ชอบประวัติศาสตร์
- - ลิงค์ที่เป็นมิตร

- แบบอย่าง

รูปแบบทั่วไป

แบบจำลองโดเมนมักจะได้รับจากการฝึกอบรมก่อนการฝึกอบรมอย่างต่อเนื่องหรือปรับแต่งคำแนะนำตามแบบจำลองทั่วไป ที่นี่เราจัดระเบียบโมเดลทั่วไปโอเพ่นซอร์สที่ใช้กันทั่วไป

แบบอย่าง	ขนาด	กลไก	กระดาษ
Llama2	7b/7b-chat 13B/13B-Chat 70B/70B-Chat	เมตา	กระดาษ
chatglm3-6b	6b-base/6b/6b-32k	มหาวิทยาลัย Tsinghua	กระดาษ
Qwen	1.8b/1.8b-Chat 7b/7b-chat 14b/14b-Chat 72B/72B-Chat	Alibaba Cloud	กระดาษ
Baichuan2	7b/7b-chat 13B/13B-Chat	Baichuan ฉลาด	กระดาษ
ผู้ฝึกงาน	7b/7b-chat 20b/20b-Chat	ห้องปฏิบัติการเซี่ยงไฮ้ AI	กระดาษ

- โมเดลโดเมน

- ทางการแพทย์

chimed-gpt [กระดาษ]
- Chimed-GPT เป็นรูปแบบการแพทย์ของจีนที่ใช้ Ziya-V2 ขึ้นอยู่กับ Ziya-V2 การฝึกอบรมก่อนการปรับแต่งการปรับแต่ง (SFT) และการเรียนรู้การเสริมแรง (RLHF) จากข้อเสนอแนะของมนุษย์ได้ดำเนินการอย่างครอบคลุม
Alpacare [กระดาษ]
- โครงการเปิดแหล่งที่มาจากการเยาะเย้ยทางการแพทย์ Alpacare ซึ่งได้รับการปรับแต่งอย่างละเอียดเกี่ยวกับ Llama
Taiyi (Taiyi) [กระดาษ]
- โครงการโอเพ่นซอร์สของการเยาะเย้ยชีวการแพทย์ภาษาจีน-อังกฤษสองภาษา Taiyi (Taiyi) มีจุดมุ่งหมายเพื่อสำรวจความสามารถของการประมวลผลภาษาธรรมชาติสองภาษาในสาขาชีวการแพทย์
mentalllama [กระดาษ]
- โครงการโอเพนซอร์ส Mentallama Mongup Mockup ซึ่งสามารถใช้สำหรับการวิเคราะห์สุขภาพจิตที่ตีความได้บนโซเชียลมีเดีย
Wingpt2
- Wingpt เป็นแบบจำลองแนวตั้งทางการแพทย์ที่ใช้ GPT โดยมีวัตถุประสงค์เพื่อบูรณาการความรู้ทางการแพทย์ระดับมืออาชีพข้อมูลทางการแพทย์และข้อมูลให้บริการข้อมูลอัจฉริยะเช่นคำถามและคำตอบทางการแพทย์การสนับสนุนการวินิจฉัยและความรู้ทางการแพทย์เพื่อปรับปรุงการวินิจฉัยและประสิทธิภาพการรักษาและคุณภาพการบริการทางการแพทย์
Chatpsychiatrist [Paper]
- โครงการ Open Source Chatpsychiatrist ซึ่งเป็นแบบจำลองทางจิตวิทยาตามการปรับแต่ง LLAMA-7B สามารถระบุปัญหาทางจิตวิทยาได้อย่างรวดเร็วและให้คำแนะนำการรักษาแบบปรับแต่ง
Zhongjing-llama (Zhongjing) [Paper]
- โครงการเปิดให้บริการรูปแบบการแพทย์จีนครั้งแรกที่รวมถึงการฝึกอบรมก่อนการปรับแต่งการปรับแต่งและกระบวนการฝึกอบรมที่สมบูรณ์แบบ RLHF แสดงความสามารถทั่วไปที่ดีและแม้กระทั่งการเข้าใกล้ระดับมืออาชีพของแพทย์มืออาชีพในสถานการณ์การสนทนาบางอย่าง นอกจากนี้ชุดข้อมูลการสนทนาหลายรอบที่มี 70,000 ทั้งหมดจากการสนทนาแพทย์ผู้ป่วยจริงก็เปิดด้วย ชุดข้อมูลนี้มีประโยคการตั้งคำถามเชิงรุกของแพทย์จำนวนมากซึ่งช่วยปรับปรุงความสามารถในการสอบถามทางการแพทย์เชิงรุกของโมเดล
Doctorglm [กระดาษ]
- ขึ้นอยู่กับรูปแบบการให้คำปรึกษาของจีนของ Chatglm-6B การปรับแต่งและการปรับใช้ชุดข้อมูลการสนทนาทางการแพทย์ของจีนนั้นทำได้ผ่านการปรับแต่งและการปรับใช้ LORA, P-TuningV2 ฯลฯ
Bentsao (วัสดุสมุนไพร) [กระดาษ]
- โครงการเปิดแหล่งที่มาของชุดรูปแบบภาษาขนาดใหญ่ที่ได้รับการปรับแต่งอย่างประณีตโดยคำแนะนำทางการแพทย์ของจีนรวมถึง Llama, Alpaca-chinese, บาน, แบบจำลองประเภทที่เคลื่อนย้ายได้ ฯลฯ ตามกราฟความรู้ทางการแพทย์และวรรณกรรมทางการแพทย์
Med-Chatglm
- โครงการโอเพ่นซอร์ส Chatglm-6B ปรับแต่งโดยคำแนะนำทางการแพทย์ของจีนและข้อมูลการปรับจูนนั้นเหมือนกับ Bentsao
Bianque (Bianque) [กระดาษ]
- โครงการเปิดแหล่งที่มาของรูปแบบขนาดใหญ่ของสุขภาพพื้นที่อยู่อาศัย เมื่อรวมกับชุดข้อมูลคำถามและคำตอบทางการแพทย์ของจีนโอเพ่นซอร์ส (MedDialog-CN, IMCS-V2, ChIP-MDCFNPC, MedDG, CMEDQA2, การแพทย์-การแพทย์-การใช้ข้อมูลส่วนใหญ่ของ DAILAGE-DAILAGE มีการสร้างระดับหลายล้านระดับ จาก Bianque Health Big Data Bianquecorpus, Chatglm-6B ได้รับเลือกเป็นรูปแบบการเริ่มต้นและได้รับ Bianque ผ่านการฝึกอบรมการปรับแต่งการเรียนการสอนของพารามิเตอร์เต็ม
Huatuogpt (Hua Tuo) [Paper]
- โครงการเปิดให้บริการ Medical Big Model Huatuogpt รวมถึง Huatuogpt-7b ที่ผ่านการฝึกอบรมตาม Baichuan-7b และ Huatuogpt-13b ที่ผ่านการฝึกอบรมตาม Ziya-Llama-13b-Pretrain-V1
Qizhengpt
- โครงการนี้ใช้ชุดข้อมูลการเรียนการสอนทางการแพทย์ของจีนที่สร้างขึ้นโดยฐานความรู้ทางการแพทย์ Qizhen และจากนี้คำแนะนำได้รับการปรับแต่งอย่างละเอียดเกี่ยวกับรุ่นจีน-llama-plus-7b, Cama-13b และโมเดล chatglm-6b ปรับปรุงผลกระทบของรูปแบบในสถานการณ์ทางการแพทย์ของจีน
พูดคุย
- โครงการเปิดแหล่งข้อมูลการแพทย์ขนาดใหญ่ของจีน Chatmed-Consult ซึ่งใช้การให้คำปรึกษาออนไลน์ 50W + การตอบกลับการตอบกลับของชุดข้อมูลการให้คำปรึกษาทางการแพทย์ออนไลน์ของจีน CHATMED_CONSULT_DATASET เป็นชุดฝึกอบรมและได้รับการปรับแต่ง LORA ตาม LLAMA-7B
Shennong-TCM-LLM (Shennong)
- โครงการโอเพ่นซอร์สของจีนการแพทย์แผนจีนรุ่นใหญ่ Shennong-TCM-LLM ขึ้นอยู่กับกราฟความรู้ด้านการแพทย์แผนจีนโอเพ่นซอร์สมันใช้วิธีการสอนตนเองที่เน้นตัวเองเป็นศูนย์กลางและเรียกใช้ CHATGPT เพื่อให้ได้ชุดข้อมูลการสอนการแพทย์แผนจีน 2.6W+ ขึ้นอยู่กับชุดข้อมูลจะขึ้นอยู่กับ LLAMA และการปรับแต่งโดยใช้ LORA
xrayglm
- โครงการเปิดชุดข้อมูลและแบบจำลองทางการแพทย์หลายรูปแบบที่มาจากจีนซึ่งแสดงศักยภาพพิเศษในการวินิจฉัยการถ่ายภาพทางการแพทย์และบทสนทนาเชิงโต้ตอบหลายรอบ
แพทย์
- โครงการ Open Source Medical Modelgpt ซึ่งรวมถึงการฝึกอบรมล่วงหน้าที่เพิ่มขึ้น, การปรับแต่งการปรับแต่ง, RLHF (การสร้างแบบจำลองรางวัล, การฝึกอบรมการเรียนรู้การเสริมแรง) และ DPO (การเพิ่มประสิทธิภาพการตั้งค่าโดยตรง)
Sunsimiao (Sun Simiao)
- โครงการโอเพ่นซอร์สของจีนรูปแบบการแพทย์ของจีน Sunsimiao ซึ่งได้รับการปรับแต่งตามแบบจำลองฐาน Baichuan-7B และ Chatglm-6B ในข้อมูลการแพทย์จีนคุณภาพสูง 100,000
Caregpt
- โครงการโอเพ่นซอร์สการแพทย์แบบจำลอง CareGPT (CareGPT) ซึ่งรวบรวมชุดข้อมูลการปรับจูนทางการแพทย์ที่เปิดเผยต่อสาธารณะหลายสิบชุด
Disc-Medllm [กระดาษ]
- โครงการนี้เป็นรูปแบบการแพทย์ขนาดใหญ่และชุดข้อมูลที่ออกแบบมาสำหรับสถานการณ์การสนทนาทางการแพทย์และสุขภาพที่ออกโดย Fudan University แบบจำลองนี้ได้มาจากการปรับแต่งชุดข้อมูล DISC-MED-SFT ตามการสอน Baichuan-13b-base การจัดตำแหน่งการตั้งค่าของมนุษย์อย่างมีประสิทธิภาพในสถานการณ์ทางการแพทย์และลดช่องว่างระหว่างผลลัพธ์ของแบบจำลองภาษาทั่วไปและบทสนทนาทางการแพทย์ในโลกแห่งความเป็นจริง
PMC-llama [กระดาษ]
- โครงการ Open Source Mockup Mockup PMC-Llama รวมถึงรุ่น Medllama_13b รุ่นก่อนที่ได้รับการฝึกอบรมมาก่อนและรุ่น PMC_LLAMA_13B ที่ปรับแต่งได้อย่างละเอียด
chatdoctor [กระดาษ]
- โครงการ Open Source Medical Model Chatdoctor ซึ่งได้รับการฝึกฝนเกี่ยวกับ Llama
หมิง (Ming Medical)
- โครงการ Open Source Medical Mody Ming ซึ่งขึ้นอยู่กับการปรับแต่งการเรียนการสอนของ Bloomz-7B เพื่อให้ได้ Ming-7b และสนับสนุนการตอบคำถามทางการแพทย์การให้คำปรึกษาอัจฉริยะและฟังก์ชั่นอื่น ๆ
irigpt
- โครงการโอเพ่นซอร์สการแพทย์จำลอง Ivygpt ซึ่งได้รับการดูแลอย่างละเอียดเกี่ยวกับข้อมูลคำถามและคำตอบทางการแพทย์ที่มีคุณภาพสูงและได้รับการฝึกฝนโดยใช้การเรียนรู้การเสริมแรงจากความคิดเห็นของมนุษย์
ชีพจร
- โครงการโอเพนซอร์สแบบจำลองการแพทย์จีนแบบจำลองการแพทย์ซึ่งใช้ข้อมูลการปรับจูนแบบละเอียดประมาณ 4,000,000 คำสั่งจากการแพทย์แผนจีนและสาขาทั่วไปเพื่อสนับสนุนงานการประมวลผลภาษาธรรมชาติที่หลากหลายในสาขาการแพทย์รวมถึงการศึกษาด้านสุขภาพคำถามการสอบแพทย์การตีความรายงานบันทึกทางการแพทย์ที่มีโครงสร้างและการวินิจฉัยและการรักษาแบบจำลอง
Huangdi (จักรพรรดิ)
- โครงการเปิดแหล่งที่มาของการแพทย์แผนจีนรุ่นใหญ่ Huangdi (จักรพรรดิ) รูปแบบแรกเพิ่มตำราการแพทย์แผนจีนข้อมูลเว็บไซต์การแพทย์จีนและคลังข้อมูลอื่น ๆ บนพื้นฐานของรูปแบบฐาน Ziya-Llama-13b-V1 เพื่อฝึกอบรมรูปแบบการฝึกอบรมล่วงหน้าด้วยความเข้าใจเกี่ยวกับความรู้ด้านการแพทย์จีน จากนั้นบนพื้นฐานนี้จะได้รับการดูแลและปรับแต่งผ่านข้อมูลการสอนการสอนหนังสือเล่มโบราณและข้อมูลการเรียนการสอนทั่วไปจำนวนมากเพื่อให้แบบจำลองมีความสามารถในการตอบความรู้เกี่ยวกับการแพทย์จีนโบราณ
จงจิง (จงจิง)
- โครงการเปิดตัวรูปแบบการแพทย์แผนจีน Zhongjing (Zhongjing) ซึ่งมีวัตถุประสงค์เพื่อชี้แจงความรู้ที่ลึกซึ้งของการแพทย์แผนจีนสืบทอดภูมิปัญญาโบราณและนวัตกรรมทางเทคโนโลยีที่ทันสมัยและในที่สุดก็เป็นเครื่องมือที่น่าเชื่อถือและเป็นมืออาชีพสำหรับสาขาการแพทย์
tcmllm
- โครงการวางแผนที่จะตระหนักถึงงานของการวินิจฉัยทางคลินิกเสริมและการรักษายาแผนจีน (การวินิจฉัยโรคคำแนะนำตามใบสั่งแพทย์ ฯลฯ ) และคำถามและคำตอบการแพทย์แผนจีนอื่น ๆ ผ่านรูปแบบใหญ่และส่งเสริมการพัฒนาคำถามและคำตอบการแพทย์แผนจีน ในปัจจุบันในการตอบสนองต่องานแนะนำใบสั่งยาในการวินิจฉัยอัจฉริยะทางคลินิกและการรักษายาแผนจีนแผนการแพทย์แผนจีน TCMLLM-PR ของรูปแบบคำแนะนำการแพทย์แผนการแพทย์แผนจีนได้รับการปล่อยตัว ด้วยการบูรณาการบันทึกทางคลินิกในโลกแห่งความเป็นจริงคลาสสิกทางการแพทย์และตำราการแพทย์แผนจีนและข้อมูลอื่น ๆ ชุดข้อมูลคำแนะนำใบสั่งยาคำแนะนำการปรับจูนที่มีรายการข้อมูล 68K ถูกสร้างขึ้นและได้รับการปรับแต่งอย่างละเอียด
Mechat [กระดาษ]
- โครงการเปิดแหล่งที่มารูปแบบการสนทนาด้านสุขภาพจิตจีนและชุดข้อมูล โมเดลได้รับการปรับแต่งอย่างละเอียดโดยคำสั่ง chatglm-6b Lora 16 บิต ชุดข้อมูลใช้ CHATGPT เพื่อเขียน QA ความช่วยเหลือซึ่งกันและกันทางจิตวิทยาที่แท้จริงเพื่อรองรับบทสนทนาหลายรอบเพื่อสุขภาพจิตหลายรอบ ชุดข้อมูลมีบทสนทนาหลายรอบ 56K และชุดรูปแบบบทสนทนาคำศัพท์และความหมายของบทนั้นมีความสมบูรณ์ยิ่งขึ้นและมีความหลากหลายมากขึ้นซึ่งสอดคล้องกับสถานการณ์แอปพลิเคชันของบทสนทนาหลายรอบระยะยาว
Soulchat (หัวใจจิตวิญญาณ) [กระดาษ]
- โครงการเปิดแหล่งข้อมูลสุขภาพจิต Soulchat (จิตวิญญาณ) ซึ่งใช้ chatglm-6b เป็นรูปแบบการเริ่มต้นและได้รับการปรับแต่งโดยคำแนะนำร่วมกันของข้อความยาวในภาษาจีนในสาขาการให้คำปรึกษาด้านจิตวิทยาในระดับล้านและข้อมูลการสนทนาที่เอาใจใส่หลายรอบ
MindChat (เก็บถาวร)
- โครงการโอเพ่นซอร์สของโมเดลจิตวิทยา MindChat (อนิเมะพูดคุย) ซึ่งใช้ข้อมูลบทสนทนาทางจิตวิทยาที่มีคุณภาพสูงประมาณ 200,000 ข้อมูลด้วยตนเองสำหรับการฝึกอบรมครอบคลุมการทำงานครอบครัวการศึกษาชีวิตสังคมความปลอดภัยและด้านอื่น ๆ คาดว่าจะช่วยให้ผู้คนบรรเทาความเครียดทางจิตวิทยาและแก้ปัญหาความสับสนทางจิตวิทยาจากสี่มิติ: การให้คำปรึกษาด้านจิตวิทยาการประเมินทางจิตวิทยาการวินิจฉัยทางจิตวิทยาและการรักษาทางจิตวิทยาและปรับปรุงระดับสุขภาพจิตของพวกเขา
Qiaoban (王子)
- โอเพ่นซอร์สโครงการของบทสนทนาทางอารมณ์ของเด็ก Qiaoban โมเดลขนาดใหญ่ มันขึ้นอยู่กับโมเดลทั่วไปโอเพ่นซอร์สโดยใช้บทสนทนาของมนุษย์-คอมพิวเตอร์ทั่วไปข้อมูลการสอนล้อเดียวและข้อมูลการสนทนาทางอารมณ์ของเด็กเพื่อการปรับแต่งการปรับแต่งและพัฒนาแบบจำลองขนาดใหญ่ที่เหมาะสมสำหรับมิตรภาพทางอารมณ์ของเด็ก

⚖ถูกกฎหมาย

Disc-Lawllm [Paper]
- Disc-Lawllm เป็นรูปแบบใหญ่ของสาขากฎหมายที่ออกแบบมาเพื่อให้บริการด้านกฎหมายมืออาชีพฉลาดและครอบคลุม มันได้รับการพัฒนาและเปิดแหล่งข้อมูลข่าวกรองข้อมูลของ Fudan University และ Social Computing Laboratory (FUDAN-DISC) รวมถึงโมเดล DISC-LAWLLM-13B และชุดข้อมูล DISC-LAW-STF
LawGPT_ZH (Xiefeng)
- รูปแบบทั่วไปของกฎหมายโอเพนซอร์สจีนของโครงการนี้ได้มาจากการปรับแต่งการเรียนการสอน Chatglm-6B Lora 16 บิต ชุดข้อมูลรวมถึงชุดข้อมูลตอบคำถามทางกฎหมายที่มีอยู่และข้อความตอบคำถามทางกฎหมายคุณภาพสูงที่สร้างขึ้นตามโครงสร้างตนเองที่นำโดยกฎหมายและกรณีจริงปรับปรุงประสิทธิภาพของภาษาทั่วไปทั่วไปในสาขากฎหมายและปรับปรุงความน่าเชื่อถือและความเป็นมืออาชีพของคำตอบแบบจำลอง
ผู้ใช้กฎหมาย
- ขึ้นอยู่กับโมเดลแท่นจีนทั่วไป (เช่น Chinese-Llama, Chatglm ฯลฯ ) แบบจำลองชุดนี้จะขยายรายการคำศัพท์ที่เป็นกรรมสิทธิ์ในสาขากฎหมายและการฝึกอบรมทางกฎหมายของจีนก่อนหน้านี้ซึ่งช่วยเพิ่มความเข้าใจพื้นฐานของโมเดลขนาดใหญ่ในสาขากฎหมาย บนพื้นฐานนี้ชุดข้อมูลคำถามและคำตอบของภาคสนามกฎหมายและชุดข้อมูลการสอบตุลาการจีนถูกสร้างขึ้นเพื่อปรับแต่งคำแนะนำซึ่งปรับปรุงความเข้าใจของโมเดลและความสามารถในการบังคับใช้ของเนื้อหาทางกฎหมาย
Lexilaw
- Lexilaw เป็นรูปแบบทางกฎหมายของจีนที่ได้รับการปรับแต่งตามสถาปัตยกรรม Chatglm-6B ซึ่งช่วยให้สามารถให้ประสิทธิภาพและความเป็นมืออาชีพที่สูงขึ้นในการให้คำแนะนำทางกฎหมายและการสนับสนุนโดยการปรับแต่งในชุดข้อมูลในสาขากฎหมาย รูปแบบนี้ได้รับการออกแบบมาเพื่อให้บริการที่ปรึกษากฎหมายที่ถูกต้องและเชื่อถือได้แก่ผู้ปฏิบัติงานด้านกฎหมายนักเรียนและผู้ใช้ทั่วไป ไม่ว่าจะเป็นสิ่งจำเป็นในการปรึกษาปัญหาทางกฎหมายที่เฉพาะเจาะจงหรือสอบถามข้อกำหนดทางกฎหมายการวิเคราะห์กรณีและการตีความกฎระเบียบ Lexilaw สามารถให้คำแนะนำและคำแนะนำที่เป็นประโยชน์
ทนายความ Llama [กระดาษ]
- ข้อมูลการปรับแต่งการปรับแต่งของโครงการโอเพ่นซอร์สในสาขากฎหมายและทนายความเยาะเย้ยกฎหมายของจีน Llama ตามการฝึกอบรม Llama ทนายความ Llama ได้รับการฝึกอบรมล่วงหน้าก่อนเกี่ยวกับคลังกฎหมายขนาดใหญ่เพื่อให้สามารถเรียนรู้ระบบความรู้ด้านกฎหมายของจีนอย่างเป็นระบบ บนพื้นฐานนี้ ChatGPT ถูกนำมาใช้เพื่อรวบรวมชุดการวิเคราะห์คำถามวัตถุประสงค์ของการตรวจสอบคุณสมบัติวิชาชีพด้านกฎหมายที่เป็นเอกภาพของประเทศจีนและคำตอบสำหรับการให้คำปรึกษาทางกฎหมายและใช้ข้อมูลที่รวบรวมเพื่อปรับรูปแบบเพื่อให้แบบจำลองได้รับความสามารถในการใช้ความรู้ทางกฎหมายกับสถานการณ์ที่เฉพาะเจาะจง
Hanfei (Han Fei)
- Hanfei-1.0 (Han Fei) เป็นรูปแบบการฝึกอบรมแบบเต็มรูปแบบครั้งแรกในประเทศจีน มันมีปริมาณพารามิเตอร์ 7b ฟังก์ชั่นหลักของมัน ได้แก่ : Q&A ทางกฎหมาย, บทสนทนาหลายรอบ, การเขียนบทความ, การค้นหา, ฯลฯ
chatlaw [กระดาษ]
- ชุดของรูปแบบทางกฎหมายที่เปิดโดยมหาวิทยาลัยปักกิ่งใช้ข้อความต้นฉบับจำนวนมากเช่นข่าวกฎหมายฟอรัมกฎหมายกฎหมายการตีความตุลาการการให้คำปรึกษาทางกฎหมายคำถามการตรวจสอบทางกฎหมายเอกสารการตัดสิน ฯลฯ รวมถึง Chatlaw-13b และ Chatlaw-33b ที่ผ่านการฝึกอบรมโดย Jiang Ziya-13b นอกจากนี้ Chatlaw-text2vec ยังเปิดแหล่งที่มาและรูปแบบการจับคู่ความคล้ายคลึงกันได้รับการฝึกฝนตาม Bert ซึ่งสามารถจับคู่ข้อมูลคำถามผู้ใช้กับกฎหมายที่เกี่ยวข้อง
Lychee (Lu Zhi)
- กฎหมายตุลาการของจีนขนาดใหญ่ Law-GLM-10B เปิดให้บริการตามรูปแบบ GLM-10B และคำแนะนำในการปรับจูนจะได้รับจากข้อมูลทางกฎหมายของจีน 30GB
Wisdominterrogatory (Zhihai-Luwen)
- รูปแบบทางกฎหมายร่วมกันออกแบบและพัฒนาโดยมหาวิทยาลัยเจ้อเจียง, อาลีบาบาดาโมและสถาบันการศึกษาของจีนมีพื้นฐานมาจาก Baichuan-7b และการฝึกอบรมก่อนการฝึกอบรมและการปรับแต่งข้อมูลทางกฎหมายอย่างละเอียด
ลูกขุน
- โครงการฝึกอบรมแบบจำลองภาษาตามคลังกฎหมายของจีนรวมถึง: 1) รูปแบบการทำนายการตัดสินทางกฎหมายที่ตีความได้ซึ่งได้รับการฝึกฝนเพิ่มเติมโดย GPT2 ในคลังกฎหมายและการปรับแต่งโดยรูปแบบการประยุกต์ทางกฎหมาย ไม่เพียง แต่สามารถให้ผลการตัดสินเท่านั้น แต่ยังให้มุมมองศาลที่สอดคล้องกัน 2) รูปแบบการให้คำปรึกษาด้านกฎหมายอัจฉริยะ AI นักกฎหมายใช้การเรียนรู้อย่างแข็งขันเพื่อปรับแต่งข้อมูลจำนวนเล็กน้อยและสามารถตอบคำถามตามการให้คำปรึกษาของผู้ใช้
Master Mingcha
- รูปแบบการพิจารณาคดีของ Mingcha Mingcha เป็นรูปแบบการพิจารณาคดีของจีนที่พัฒนาร่วมกันโดยมหาวิทยาลัยซานตง, Inspur Cloud และมหาวิทยาลัยรัฐศาสตร์และกฎหมายจีน มันขึ้นอยู่กับคลังตุลาการของจีนจำนวนมาก (รวมถึงเอกสารการตัดสินต่าง ๆ กฎหมายและข้อบังคับ ฯลฯ ) และข้อมูลการปรับจูนตุลาการภายใต้การดูแล (รวมถึงคำถามและคำตอบทางกฎหมายการค้นหากรณี) รูปแบบนี้สนับสนุนการดึงข้อมูลทางกฎหมายการวิเคราะห์กรณีการใช้เหตุผลและการตัดสินและการสนทนาทางตุลาการและมีจุดมุ่งหมายเพื่อให้ผู้ใช้ได้รับการปรึกษาหารือทางกฎหมายที่ครอบคลุมและถูกต้อง

- การเงิน

Tongyi-Finance-14b
- Tongyi Finance-14b (Tongyi-Finance-14b) เป็นรูปแบบภาษาขนาดใหญ่ที่เปิดตัวสำหรับอุตสาหกรรมการเงิน มันขึ้นอยู่กับรูปแบบพื้นฐานของ Tongyi Qianwen เพื่อดำเนินการเรียนรู้ที่เพิ่มขึ้นของคลังข้อมูลอุตสาหกรรมเสริมสร้างความสามารถในการใช้ความรู้และสถานการณ์ในด้านการเงินและครอบคลุมความสามารถของจตุภาคเช่นคำถามและคำตอบทางการเงินการจำแนกข้อความการสกัดข้อมูลการสร้างข้อความการอ่านความเข้าใจ
Disc-Finllm [Paper]
- Disc-Finllm เป็นรูปแบบภาษาขนาดใหญ่ในด้านการเงิน มันเป็นระบบการเงินอัจฉริยะหลายระดับประกอบด้วยสี่โมดูลสำหรับสถานการณ์ทางการเงินที่แตกต่างกัน: การให้คำปรึกษาทางการเงิน, การวิเคราะห์ข้อความทางการเงิน, การคำนวณทางการเงินและคำถามและคำตอบการดึงความรู้ทางการเงิน โมดูลเหล่านี้แสดงให้เห็นถึงข้อได้เปรียบที่ชัดเจนในการประเมินสี่ครั้งรวมถึงงาน NLP ทางการเงินคำถามการทดสอบของมนุษย์การวิเคราะห์ข้อมูลและการวิเคราะห์กิจการในปัจจุบันพิสูจน์ให้เห็นว่า Disc-Finllm สามารถให้การสนับสนุนที่แข็งแกร่งสำหรับสาขาการเงินที่หลากหลาย
Investlm [กระดาษ]
- โครงการเปิดแหล่งข้อมูลทางการเงินภาษาอังกฤษโดยใช้การปรับแต่ง Llama-65B
การใช้งาน
- เรามุ่งมั่นที่จะสร้างโครงการรูปแบบที่เปิดกว้างสาธารณะและโครงการทางการเงินที่ยั่งยืนและใช้โอเพนซอร์สและการเปิดกว้างเพื่อส่งเสริม "AI+Financial"
Weaverbird (Weaverbird) [Paper]
- โอเพนซอร์สโครงการเป็นรูปแบบการสนทนาขนาดใหญ่ในสาขาการเงินโดยพิจารณาจากการปรับแต่งคลังข้อมูลด้านการเงินสองภาษาจีน-อังกฤษและยังสามารถเข้าถึงฐานความรู้ท้องถิ่นและเครื่องมือค้นหาออนไลน์
BBT-finicuation-applications [Paper]
- โครงการเปิดแหล่งข้อมูลภาคสนามทางการเงินของจีน BBT-Fincorpus ซึ่งเป็นรุ่นใหญ่ที่เพิ่มความรู้ BBT-Fint5 และมาตรฐานการประเมิน CFLEB
Cornucopia (cornery of cornucopia)
- โครงการสร้างชุดข้อมูลการเรียนการสอนตามข้อมูลคำถามและคำตอบทางการเงินของจีนและคลานและบนพื้นฐานนี้ให้ปรับคำแนะนำเกี่ยวกับรูปแบบระบบ Llama ปรับปรุงผลตอบคำถามของ Llama ในด้านการเงิน
Xuanyuan (Xuanyuan) [กระดาษ]
- Xuanyuan เป็นรูปแบบการสนทนาภาษาจีนโอเพ่นซอร์สแห่งแรกที่มีรูปแบบการสนทนาจีนระดับพันล้านในประเทศจีนและยังเป็นรูปแบบการสนทนาภาษาจีนโอเพนซอร์สแห่งแรกที่ได้รับการปรับให้เหมาะกับสาขาการเงินของจีน จาก Bloom-176b, Xuanyuan ได้ดำเนินการกำหนดเป้าหมายก่อนการฝึกอบรมและการปรับแต่งสำหรับสาขาทั่วไปและสาขาการเงินของจีน ไม่เพียง แต่จัดการกับปัญหาในสาขาทั่วไป แต่ยังตอบคำถามที่เกี่ยวข้องกับการเงินต่างๆให้ผู้ใช้ได้รับข้อมูลและข้อเสนอแนะทางการเงินที่ถูกต้องและครอบคลุม
pixiu (pixiu) [กระดาษ]
- โครงการโอเพ่นซอร์สของชุดข้อมูลการปรับแต่งฟิลด์การปรับแต่งชุดข้อมูลการปรับแต่งพอดี, FINMA แบบจำลองขนาดใหญ่และเปลวไฟเกณฑ์มาตรฐานการประเมินผล
Fingpt [Paper1] [Paper2]
- โครงการเปิดให้มีรูปแบบทางการเงินหลายแบบรวมถึง ChatglM2-6B+LORA และ LLAMA2-7B+LORA และรวบรวมข้อมูลการฝึกอบรมภาษาจีนและภาษาอังกฤษรวมถึงข่าวการเงินสื่อสังคมออนไลน์รายงานทางการเงิน ฯลฯ
Flang [กระดาษ]
- โครงการเปิดแหล่งข้อมูลทางการเงินและการประเมินผลมาตรฐาน

- ให้ความรู้

Taoli (Taoli)
- โครงการเปิดแหล่งที่มาของรูปแบบขนาดใหญ่ที่เหมาะสมสำหรับสาขาการศึกษาระหว่างประเทศของจีน ขึ้นอยู่กับตำราการศึกษาและการสอนของจีนมากกว่า 500 เล่มคำถามทดสอบความสามารถของจีนและพจนานุกรมผู้เรียนภาษาจีน ฯลฯ ปัจจุบันหมุนเวียนอยู่ในสาขาการศึกษาระหว่างประเทศของจีนซึ่งเป็นห้องสมุดทรัพยากรการศึกษาระหว่างประเทศของจีน คำถามการศึกษาและคำตอบระหว่างประเทศที่มีคุณภาพสูงทั้งหมด 88,000 ชุดถูกสร้างขึ้นผ่านคำแนะนำในรูปแบบต่าง ๆ และข้อมูลที่รวบรวมได้ถูกนำมาใช้เพื่อปรับแต่งคำแนะนำเพื่อให้แบบจำลองได้รับความสามารถในการใช้ความรู้ด้านการศึกษาของจีนระหว่างประเทศกับสถานการณ์ที่เฉพาะเจาะจง
educhat [กระดาษ]
- โครงการเปิดแหล่งที่มาของแบบจำลองบทสนทนาสำหรับสาขาการศึกษาแนวตั้งส่วนใหญ่ศึกษาเทคโนโลยีที่เกี่ยวข้องกับแบบจำลองการสนทนาการศึกษาตามแบบจำลองที่ผ่านการฝึกอบรมมาก่อนรวมข้อมูลภาคสนามการศึกษาที่หลากหลายเสริมด้วยวิธีการเช่นการปรับแต่งการเรียนการสอนและการจัดเรียงการศึกษา ครูนักเรียนและผู้ปกครองและช่วยให้การศึกษาที่ชาญฉลาดซึ่งเป็นไปตามความถนัดความยุติธรรมเพียงแค่และอบอุ่น

➕คนอื่น ๆ

แม่แบบ devops
- โครงการโอเพนซอร์ส DevOps-Model ซึ่งเป็นแบบจำลองภาคสนาม DevOps ที่พัฒนาโดย Ant Group และ Peking University
นกฮูก [กระดาษ]
- โครงการโอเพ่นซอร์สเป็นแบบจำลองการดำเนินงานและการบำรุงรักษาที่ชาญฉลาด (AIOPS) รูปแบบภาษาขนาดใหญ่ที่พัฒนาร่วมกันโดยสถาบันวิจัยข่าวกรองอัจฉริยะคลาวด์และมหาวิทยาลัย Beihang ซึ่งได้รับการฝึกฝนเกี่ยวกับข้อมูลการผลิตนกฮูกที่รวบรวมได้ นอกจากนี้เนื่องจากการขาดเกณฑ์มาตรฐานรูปแบบภาษาขนาดใหญ่ในสาขาการดำเนินงานและการบำรุงรักษาอัจฉริยะจึงมีการจัดตั้งเกณฑ์มาตรฐานการประเมินนกฮูก
Marinegpt [กระดาษ]
- โครงการเปิดให้บริการรูปแบบภาษาภาพแรกคือ Marinegpt ออกแบบมาโดยเฉพาะสำหรับสนามทางทะเล
Oceangpt [กระดาษ]
- โครงการโอเพนซอร์ส OceanGPT ซึ่งเป็นแบบจำลองขนาดใหญ่สำหรับสมุทรศาสตร์
agrigpt
- โครงการเปิดแหล่งที่มาจากการเยาะเย้ยการเกษตร Mediagpt
สื่อกลาง
- โครงการเปิดแหล่ง MediaGpt รุ่นใหญ่ของจีน ก่อนอื่นจะดำเนินการฝึกอบรมก่อนการฝึกอบรมอย่างต่อเนื่องในคลังข้อมูลตัวเองขนาดใหญ่เพื่อเรียนรู้ระบบความรู้ของสื่อตนเองอย่างเป็นระบบ จากนั้นด้วยความช่วยเหลือของ CHATGPT ชุดของการวิเคราะห์และคำตอบเกี่ยวกับปัญหาความรู้ในสาขาต่าง ๆ เช่นการดำเนินการ douyin การสร้างวิดีโอสั้น ๆ การปรับใช้ Qianchuan จำนวนมากการดำเนินการถ่ายทอดสดและทักษะการพูดออกอากาศสดถูกรวบรวม
ecomgpt [กระดาษ]
- โครงการเปิดให้บริการ ECOMGPT รุ่นใหญ่อีคอมเมิร์ซซึ่งใช้ชุดข้อมูลการปรับแต่งการปรับแต่งของ Bloomz ในสาขาอีคอมเมิร์ซและการประเมินด้วยตนเองในชุดข้อมูลการประเมินผล e-commerce 12 ชุด
Starwhisper (ดาว)
- ด้วยการสนับสนุนของพันธมิตรทางวิทยาศาสตร์ทางดาราศาสตร์แพลตฟอร์มวรรณคดี Jisipu และวิศวกรรม Sitian ตามประสบการณ์การพัฒนาของ Starglm รุ่นใหญ่ทางดาราศาสตร์เราได้ฝึกอบรมรุ่น Starwhisper Series (รวมถึง 6B, 7B, 13B, 14B, 20B) เพื่อที่จะบรรเทาปรากฏการณ์ภาพหลอนของความรู้ทั่วไปเกี่ยวกับแบบจำลองขนาดใหญ่ในด้านดาราศาสตร์มันวางรากฐานสำหรับสมอง Sitian ซึ่งสามารถจัดการงานทางดาราศาสตร์หลายรูปแบบและนำไปใช้ในอาเรย์กล้องโทรทรรศน์
K2 [กระดาษ]
- โอเพ่นซอร์สโครงการ Earth Science Mockup K2 ซึ่งได้รับการฝึกอบรมล่วงหน้าโดยใช้วรรณกรรมธรณีศาสตร์และข้อมูล Wikipedia ตาม Llama จากนั้นปรับแต่งการเรียนการสอนโดยใช้ชุดข้อมูล GeoSignal
Transgpt (Zhiyuan)
- โครงการเปิดแหล่งข้อมูลการขนส่ง TransGPT (Zhiyuan) ซึ่งส่วนใหญ่มุ่งมั่นที่จะใช้ประโยชน์จากมูลค่าจริงในอุตสาหกรรมการขนส่งจริง มันสามารถตระหนักถึงการทำนายสถานการณ์การจราจรผู้ช่วยที่ปรึกษาอัจฉริยะบริการขนส่งสาธารณะการวางแผนการจราจรและการออกแบบการศึกษาความปลอดภัยการจราจรการจัดการความช่วยเหลือการรายงานอุบัติเหตุและการวิเคราะห์การจราจรระบบช่วยเหลือการขับขี่แบบอิสระและฟังก์ชั่นอื่น ๆ ในฐานะที่เป็นรูปแบบการขนส่งสามัญสำนึกทั่วไป TransGPT สามารถให้สามัญสำนึกสำหรับอุตสาหกรรมต่าง ๆ เช่นวิศวกรรมถนนวิศวกรรมสะพานวิศวกรรมอุโมงค์การขนส่งทางถนนการขนส่งทางน้ำการขนส่งสาธารณะในเมืองเศรษฐกิจการขนส่งความปลอดภัยการขนส่ง ฯลฯ จากสิ่งนี้คุณสามารถมุ่งเน้นไปที่สถานการณ์การจราจรที่เฉพาะเจาะจง
secgpt
- โครงการเปิดแหล่งข้อมูลความปลอดภัยเครือข่ายขนาดใหญ่ Secgpt รุ่นนี้ใช้ LORA สำหรับการฝึกอบรมก่อนการฝึกอบรมและการฝึกอบรม SFT ตาม Baichuan-13b และยังเปิดการฝึกอบรมก่อนการฝึกอบรมและชุดข้อมูลการปรับแต่งการเรียนการสอน
การตรวจสอบอัตโนมัติ
- โครงการเปิดแหล่งข้อมูลการตรวจสอบความปลอดภัยทางไซเบอร์ mockup โดยมีเป้าหมายในการให้ความสามารถในการประมวลผลภาษาธรรมชาติที่แข็งแกร่งสำหรับการตรวจสอบความปลอดภัยและการป้องกันเครือข่าย มันมีหน้าที่ของการวิเคราะห์รหัสที่เป็นอันตรายตรวจจับการโจมตีทางไซเบอร์และการทำนายช่องโหว่ด้านความปลอดภัยให้การสนับสนุนที่แข็งแกร่งแก่ผู้เชี่ยวชาญด้านความปลอดภัย
TechGPT
- โมเดลเทคโนโลยีโอเพ่นซอร์สของโครงการ TechGPT ซึ่งมีจุดมุ่งหมายมากกว่าสิบสาขาวิชาชีพแนวตั้งเช่นวิทยาศาสตร์คอมพิวเตอร์วัสดุเครื่องจักรโลหะวิทยาการเงินและการบินและอวกาศครอบคลุมความเข้าใจภาษาธรรมชาติที่หลากหลายและความสามารถในการสร้าง ข้อเสนอแนะคำถามและคำตอบการสร้างคำโฆษณาการแปลภาษาจีน-อังกฤษและการสร้างรหัสง่าย ๆ ฯลฯ
Mozi (Mozi) [กระดาษ]
- โครงการเปิดแหล่งข้อมูลทางวิทยาศาสตร์ MOCKUP MOZI (MOZI) ซึ่งสามารถใช้สำหรับคำถามและคำตอบและการสนับสนุนทางอารมณ์ของวรรณกรรมทางวิทยาศาสตร์และเทคโนโลยี
OpenBiomed [Paper1] [Paper2] [Paper3]
- โครงการ Open Sourced แบบจำลองชีวการแพทย์หลายแบบหลายแบบรวมถึง BiomedGPT แบบจำลองทางชีวการแพทย์แบบหลายโมเดล, โมเลกุลพื้นฐานขนาดเล็กหลายโมเดลโมเดล DrugFM และ MOLFM, โมเดลการเรียนรู้การเป็นตัวแทนของเซลล์ ฯลฯ celllm ฯลฯ
Yayi (Yayi)
- โครงการโอเพ่นซอร์สของโครงการ Multi-Field Yayi (Yayi) ซึ่งได้รับการปรับแต่งอย่างละเอียดเกี่ยวกับข้อมูลภาคสนามคุณภาพสูงที่สร้างขึ้นโดยผู้คนนับล้านเทียม ข้อมูลการฝึกอบรมครอบคลุมห้าสาขาที่สำคัญเช่นการประชาสัมพันธ์สื่อการวิเคราะห์ความคิดเห็นสาธารณะความปลอดภัยสาธารณะการควบคุมความเสี่ยงทางการเงินและการกำกับดูแลเมืองและงานด้านภาษาธรรมชาติหลายร้อย

ชุดข้อมูล

- เกณฑ์มาตรฐานการประเมิน

c-eval [กระดาษ]
- C-EVAL เป็นเกณฑ์มาตรฐานการประเมินแบบจำลองพื้นฐานของจีนที่ออกโดยมหาวิทยาลัยเซี่ยงไฮ้ Jiaotong มันมีคำถามแบบปรนัย 13,948 คำถามครอบคลุมสี่ทิศทางสำคัญ: มนุษยศาสตร์สังคมศาสตร์วิทยาศาสตร์และวิศวกรรมและวิชาเอกอื่น ๆ 52 วิชาตั้งแต่โรงเรียนมัธยมจนถึงนักศึกษาระดับบัณฑิตศึกษาของมหาวิทยาลัยและการสอบสายอาชีพ
Agieval [กระดาษ]
- Agieval เป็นเกณฑ์มาตรฐานการประเมินที่เปิดตัวโดย Microsoft เพื่อประเมินประสิทธิภาพของแบบจำลองขนาดใหญ่ในงานเกี่ยวกับความรู้ความเข้าใจของมนุษย์ มันรวมถึง 20 อย่างเป็นทางการ, เปิด, การรับเข้าเรียนที่ได้มาตรฐานสูงและการตรวจสอบคุณสมบัติสำหรับผู้สมัครสามัญรวมถึงการสอบเข้ามหาวิทยาลัยทั่วไป (การสอบเข้าวิทยาลัยจีนและการสอบของสหรัฐอเมริกา SAT), การสอบเข้าโรงเรียนกฎหมาย, การแข่งขันทางคณิตศาสตร์
Xiezhi (Xiezhi) [Paper]
- Xiezhi เป็นมาตรฐานการประเมินความรู้ภาคสนามที่ครอบคลุมโดยอัตโนมัติและได้รับการปรับปรุงโดยอัตโนมัติโดยมหาวิทยาลัย Fudan รวมถึง 13 สาขาวิชา: ปรัชญา, เศรษฐศาสตร์, กฎหมาย, การศึกษา, วรรณกรรม, ประวัติศาสตร์, วิทยาศาสตร์ธรรมชาติ, วิศวกรรม, การเกษตร, การแพทย์, ทหาร, การจัดการและศิลปะ, 516 สาขาวิชาเฉพาะและ 249,587 คำถาม
cmmlu [กระดาษ]
- CMMLU เป็นเกณฑ์มาตรฐานการประเมินของจีนที่ครอบคลุมซึ่งใช้โดยเฉพาะเพื่อประเมินความรู้และความสามารถในการใช้เหตุผลของแบบจำลองภาษาในบริบทของจีน CMMLU ครอบคลุม 67 หัวข้อจากสาขาวิชาพื้นฐานไปจนถึงระดับมืออาชีพขั้นสูง ซึ่งรวมถึง: วิทยาศาสตร์ธรรมชาติที่ต้องมีการคำนวณและการใช้เหตุผลมนุษยศาสตร์และสังคมศาสตร์ที่ต้องการความรู้และกฎการขับขี่จีนที่ต้องใช้สามัญสำนึกในชีวิต นอกจากนี้งานจำนวนมากใน CMMLU มีคำตอบเฉพาะภาษาจีนและอาจไม่สามารถใช้ได้ในระดับสากลในภูมิภาคหรือภาษาอื่น ๆ Therefore, it is a completely Chinese test benchmark.
MMCU [paper]
- MMCU是一个综合性的中文评测基准，包括来自医学、法律、心理学和教育等四大领域的测试。
CG-Eval [paper]
- CG-Eval是一个由甲骨易AI研究院与LanguageX AI Lab联合发布的针对中文大模型生成能力的评测基准。包含了科技与工程、人文与社会科学、数学计算、医师资格考试、司法考试、注册会计师考试等六个大科目类别下的55个子科目的11000道不同类型问题。CG-Eval包含一套复合的打分系统：对于非计算题，每一道名词解释题和简答题都有标准参考答案，采用多个标准打分然后加权求和；对于计算题目，会提取最终计算结果和解题过程，然后综合打分。
CBLUE [paper]
- CBLUE是一个中文医学语言理解评测基准，包含8个中文医疗语言理解任务。
PromptCBLUE [paper]
- PromptCBLUE是一个面向中文医疗场景的评测基准，通过对CBLUE基准进行二次开发，将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务。
LAiW [paper]
- LAiW 是一个中文法律大模型评测基准，针对3大能力设计13个基础任务：1）法律NLP 基础能力：评测法律基础任务、 NLP 基础任务和法律信息抽取的能力，包括法条推送、要素识别、命名实体识别、司法要点摘要和案件识别5 个基础任务；2）法律基础应用能力：评测大模型对法律领域知识的基础应用能力，包括争议焦点挖掘、类案匹配、刑事裁判预测、民事裁判预测和法律问答5 个基础任务；3）法律复杂应用能力：评测大模型对法律领域知识的复杂应用能力，包括司法说理生成、案情理解和法律咨询3 个基础任务。
LawBench [paper]
- LawBench 是一个面向中国法律体系的法律评测基准。LawBench 模拟了司法认知的三个维度，并选择了20个任务来评估大模型的能力。与一些仅有多项选择题的现有基准相比，LawBench 包含了更多与现实世界应用密切相关的任务类型，如法律实体识别、阅读理解、犯罪金额计算和咨询等。
LegalBench [paper]
- LegalBench 是一个面向美国法律体系的法律评测基准，包含162个法律推理任务。
LEXTREME [paper]
- LEXTREME是一个多语言的法律评测基准，包含了24种语言11个评测数据集。
LexGLUE [paper]
- LexGLUE是一个英文法律评测基准。
CFBenchmark [paper]
- CFBenchmark是一个旨在评估大语言模型在中文金融场景下辅助工作的评测基准。CFBenchmark的基础版本包括3917个金融文本涵盖三个方面和八个任务，从金融识别、金融分类、金融生成三个方面进行组织。
FinanceBench [paper]
- FinanceBench是一个用于评估开放式金融问题问答的评测基准，包含10,231 个有关上市公司的问题，以及相应的答案。
FinEval [paper]
- FinEval是一个金融知识评测基准，包含了4,661个高质量的多项选择题，涵盖金融、经济、会计和证书等领域，34个不同的学术科目。
FLARE [paper]
- FLARE是一个金融评测基准，包含了金融知识理解和预测等任务。
CFLEB [paper]
- CFLEB是一个中文金融评测基准，包含两项语言生成任务和四项语言理解任务。
FLUE [paper]
- FLUE是一个金融评测基准，包含5个金融领域数据集。
GeoGLUE [paper]
- GeoGLUE是一个由阿里巴巴达摩院与高德联合发布的地理语义理解能力评测基准，旨在推动地理相关文本处理技术和社区的发展。本榜单提炼了其中多个典型场景：地图搜索、电商物流、政府登记、金融交通，并设计了六个核心任务：门址地址要素解析、地理实体对齐、Query-POI库召回、Query-POI相关性排序、地址Query成分分析、WhereWhat切分。
OWL-Bench [paper]
- OWL-Bench 是一个面向运维领域的双语评测基准。它包含317 个问答题和1000 个多选题，涵盖了该领域的众多现实工业场景，包括信息安全、应用、系统架构、软件架构、中间件、网络、操作系统、基础设施和数据库这九个不同的子领域。以确保OWL-Bench 能够展现出多样性。
DevOps-Eval
- DevOps-Eval是由蚂蚁集团联合北京大学发布的面向DevOps领域的大语言模型评测基准。

- Appendix

点赞历史

- ลิงค์ที่เป็นมิตร

Awesome Code LLM
- 该项目收集了代码大模型相关论文，并整理出一篇综述。
CodeFuse-ChatBot
- CodeFuse-ChatBot是由蚂蚁CodeFuse团队开发的开源AI智能助手，致力于简化和优化软件开发生命周期中的各个环节。
Awesome AIGC Tutorials
- 该项目收集了关于AIGC的各种精选教程和资源，既适合初学者也适合进阶AI爱好者。
Awesome Tool Learning
- 该项目收集了关于工具学习的资源，包括论文、框架和应用。
Awesome LLM reasoning
- 该项目收集了关于大语言模型推理方面的资源，包括论文、数据集等。

ขยาย

Awesome Domain LLM

โดเมนที่ยอดเยี่ยม LLM

- ต่ออายุ

สารบัญ

- แบบอย่าง

รูปแบบทั่วไป

- โมเดลโดเมน

- ทางการแพทย์

⚖ถูกกฎหมาย

- การเงิน

- ให้ความรู้

➕คนอื่น ๆ

ชุดข้อมูล

- เกณฑ์มาตรฐานการประเมิน

- Appendix

点赞历史

- ลิงค์ที่เป็นมิตร

awesome citygml

TensorRT LLM

awesome swift

เกมปีศาจที่ยอดเยี่ยม

โดเมนไบนารี

โฆษณาสุดเจ๋ง

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express