โดเมนที่ยอดเยี่ยม LLM
เนื่องจากการเกิดขึ้นของรูปแบบภาษาขนาดใหญ่ที่แสดงโดย CHATGPT การวิจัยและแอปพลิเคชันรอบใหม่ได้ออกเดินทางและรุ่นทั่วไปมากมายรวมถึง Llama, Chatglm, Baichuan, Qwen ฯลฯ ได้เกิดขึ้น ต่อจากนั้นผู้ปฏิบัติงานจากเขตข้อมูลต่าง ๆ จะนำไปใช้กับสนามแนวตั้งผ่านการฝึกอบรมก่อนการฝึกอบรม/การเรียนการสอนอย่างต่อเนื่องตามแบบจำลองทั่วไป

โครงการนี้มีวัตถุประสงค์เพื่อรวบรวมและจัดเรียง โมเดลโอเพนซอร์ส ชุดข้อมูล และ มาตรฐานการประเมินผล ในเขตข้อมูลแนวตั้ง ทุกคนยินดีที่จะมีส่วนร่วมในรูปแบบโอเพ่นซอร์สชุดข้อมูลมาตรฐานการประเมินผลและเนื้อหาอื่น ๆ ที่ไม่รวมอยู่ในโครงการนี้และส่งเสริมการเสริมสร้างพลังอำนาจของโมเดลขนาดใหญ่ในทุกช่วงชีวิต!
- ต่ออายุ
- [2023/11/26] การปรับปรุงความปลอดภัยของเครือข่ายขนาดใหญ่ Model Secgpt, Medical Model Model Chimed-GPT, Financial Big Model Tongyi-Finance-14B, มาตรฐานการประเมินทางการเงิน FinanceBench และ CFBenchmark
- [2023/11/01] เพิ่ม DEVOPS Field Model Model ขนาดใหญ่ DevOps-Model และเกณฑ์มาตรฐานการประเมิน DevOps-Eval ที่ออกโดย Ant Group และ Peking University
- [2023/10/28] เพิ่มรูปแบบทางการเงิน Disc-Finllm, Medical Model Alpacare และ MarineGpt Model ทางทะเล
- [2023/10/19] แบบจำลองทางจิตวิทยา Mentalllama, โมเดลชีวการแพทย์สองภาษา Taiyi (Taiyi) และ Oceangpt Model Oceangpt
- [2023/10/10] เพิ่มโมเดลนกฮูกขนาดใหญ่และเกณฑ์มาตรฐานนกฮูก-บัลลังก์สำหรับการดำเนินงานและการบำรุงรักษาที่พัฒนาร่วมกันโดยสถาบันวิจัยอัจฉริยะ Yunzhi และ Beihang เพิ่มเกณฑ์มาตรฐาน LAIW สำหรับการประเมินรูปแบบทางกฎหมายของจีน
- [2023/10/05] การเพิ่มรูปแบบจิตวิทยา Chatpsychiatrist, รูปแบบทางการเงิน Investlm, รูปแบบการเกษตร Agrigpt และรูปแบบการแพทย์ Wingpt2
- [2023/10/03] มีการเพิ่มเกณฑ์มาตรฐานการประเมินทางกฎหมายสองประการ ได้แก่ Lawbench สำหรับระบบกฎหมายของจีนและกฎหมายสำหรับระบบกฎหมายของสหรัฐอเมริกา
- [2023/10/01] เพิ่ม Disc-Lawllm ซึ่งเป็นรูปแบบใหญ่ของสาขากฎหมายที่เปิดโดย Fudan University มีวัตถุประสงค์เพื่อให้บริการด้านกฎหมายมืออาชีพฉลาดและครอบคลุม เพิ่ม Finglm เพื่อสร้างโครงการสวัสดิการสาธารณะที่เปิดกว้างและโครงการทางการเงินที่ยั่งยืนและใช้โอเพ่นซอร์สเพื่อส่งเสริม "AI+Finance"
- [2023/9/25] อัปเดต QWEN, เพิ่มรุ่น QWEN-14B และ QWEN-14B-Chat และอัปเดตรุ่น QWEN-7B และ QWEN-7B-Chat เมื่อเปรียบเทียบกับ QWEN-7B ดั้งเดิมเวอร์ชันใหม่ใช้ข้อมูลการฝึกอบรมเพิ่มเติม (2.4T โทเค็น) และความยาวลำดับได้ขยายออกจากปี 2048 เป็น 8192 ความสามารถและความสามารถของรหัสโดยรวมของจีนได้รับการปรับปรุงมาก
- [2023/9/22] เพิ่ม Internlm (Scholar Puyu), ห้องปฏิบัติการเซี่ยงไฮ้ AI และเทคโนโลยี Sensetime ร่วมกับมหาวิทยาลัยจีนแห่งฮ่องกงและโมเดลโอเพ่นซอร์สของมหาวิทยาลัย Fudan
- [2023/9/15] เพิ่ม Zhongjing-Llama (Zhongjing) รูปแบบการแพทย์จีนที่มีการฝึกอบรมก่อนการปรับแต่งการปรับแต่งและกระบวนการฝึกอบรมที่สมบูรณ์แบบ RLHF
- [2023/9/14] เพิ่ม Weaverbird เพื่อเข้าถึงรูปแบบการสนทนาทางการเงินด้วยความรู้ในท้องถิ่นและความสามารถในการค้นหาออนไลน์
- [2023/9/13] เพิ่ม Master Mingzha ซึ่งเป็นรูปแบบการพิจารณาคดีที่พัฒนาโดยมหาวิทยาลัยซานตง, Inspur Cloud และมหาวิทยาลัยรัฐศาสตร์และกฎหมายจีน
สารบัญ
- - แบบอย่าง
- รูปแบบทั่วไป
- - โมเดลโดเมน
- - ทางการแพทย์
- ⚖ถูกกฎหมาย
- - การเงิน
- - ให้ความรู้
- ➕คนอื่น ๆ
- ชุดข้อมูล
- - เกณฑ์มาตรฐานการประเมิน
- - ภาคผนวก
- ชอบประวัติศาสตร์
- - ลิงค์ที่เป็นมิตร
- แบบอย่าง
รูปแบบทั่วไป
แบบจำลองโดเมนมักจะได้รับจากการฝึกอบรมก่อนการฝึกอบรมอย่างต่อเนื่องหรือปรับแต่งคำแนะนำตามแบบจำลองทั่วไป ที่นี่เราจัดระเบียบโมเดลทั่วไปโอเพ่นซอร์สที่ใช้กันทั่วไป
| แบบอย่าง | ขนาด | กลไก | กระดาษ |
|---|
| Llama2 | 7b/7b-chat 13B/13B-Chat 70B/70B-Chat | เมตา | กระดาษ |
| chatglm3-6b | 6b-base/6b/6b-32k | มหาวิทยาลัย Tsinghua | กระดาษ |
| Qwen | 1.8b/1.8b-Chat 7b/7b-chat 14b/14b-Chat 72B/72B-Chat | Alibaba Cloud | กระดาษ |
| Baichuan2 | 7b/7b-chat 13B/13B-Chat | Baichuan ฉลาด | กระดาษ |
| ผู้ฝึกงาน | 7b/7b-chat 20b/20b-Chat | ห้องปฏิบัติการเซี่ยงไฮ้ AI | กระดาษ |
- โมเดลโดเมน
- ทางการแพทย์
chimed-gpt [กระดาษ]
- Chimed-GPT เป็นรูปแบบการแพทย์ของจีนที่ใช้ Ziya-V2 ขึ้นอยู่กับ Ziya-V2 การฝึกอบรมก่อนการปรับแต่งการปรับแต่ง (SFT) และการเรียนรู้การเสริมแรง (RLHF) จากข้อเสนอแนะของมนุษย์ได้ดำเนินการอย่างครอบคลุม
Alpacare [กระดาษ]
- โครงการเปิดแหล่งที่มาจากการเยาะเย้ยทางการแพทย์ Alpacare ซึ่งได้รับการปรับแต่งอย่างละเอียดเกี่ยวกับ Llama
Taiyi (Taiyi) [กระดาษ]
- โครงการโอเพ่นซอร์สของการเยาะเย้ยชีวการแพทย์ภาษาจีน-อังกฤษสองภาษา Taiyi (Taiyi) มีจุดมุ่งหมายเพื่อสำรวจความสามารถของการประมวลผลภาษาธรรมชาติสองภาษาในสาขาชีวการแพทย์
mentalllama [กระดาษ]
- โครงการโอเพนซอร์ส Mentallama Mongup Mockup ซึ่งสามารถใช้สำหรับการวิเคราะห์สุขภาพจิตที่ตีความได้บนโซเชียลมีเดีย
Wingpt2
- Wingpt เป็นแบบจำลองแนวตั้งทางการแพทย์ที่ใช้ GPT โดยมีวัตถุประสงค์เพื่อบูรณาการความรู้ทางการแพทย์ระดับมืออาชีพข้อมูลทางการแพทย์และข้อมูลให้บริการข้อมูลอัจฉริยะเช่นคำถามและคำตอบทางการแพทย์การสนับสนุนการวินิจฉัยและความรู้ทางการแพทย์เพื่อปรับปรุงการวินิจฉัยและประสิทธิภาพการรักษาและคุณภาพการบริการทางการแพทย์
Chatpsychiatrist [Paper]
- โครงการ Open Source Chatpsychiatrist ซึ่งเป็นแบบจำลองทางจิตวิทยาตามการปรับแต่ง LLAMA-7B สามารถระบุปัญหาทางจิตวิทยาได้อย่างรวดเร็วและให้คำแนะนำการรักษาแบบปรับแต่ง
Zhongjing-llama (Zhongjing) [Paper]
- โครงการเปิดให้บริการรูปแบบการแพทย์จีนครั้งแรกที่รวมถึงการฝึกอบรมก่อนการปรับแต่งการปรับแต่งและกระบวนการฝึกอบรมที่สมบูรณ์แบบ RLHF แสดงความสามารถทั่วไปที่ดีและแม้กระทั่งการเข้าใกล้ระดับมืออาชีพของแพทย์มืออาชีพในสถานการณ์การสนทนาบางอย่าง นอกจากนี้ชุดข้อมูลการสนทนาหลายรอบที่มี 70,000 ทั้งหมดจากการสนทนาแพทย์ผู้ป่วยจริงก็เปิดด้วย ชุดข้อมูลนี้มีประโยคการตั้งคำถามเชิงรุกของแพทย์จำนวนมากซึ่งช่วยปรับปรุงความสามารถในการสอบถามทางการแพทย์เชิงรุกของโมเดล
Doctorglm [กระดาษ]
- ขึ้นอยู่กับรูปแบบการให้คำปรึกษาของจีนของ Chatglm-6B การปรับแต่งและการปรับใช้ชุดข้อมูลการสนทนาทางการแพทย์ของจีนนั้นทำได้ผ่านการปรับแต่งและการปรับใช้ LORA, P-TuningV2 ฯลฯ
Bentsao (วัสดุสมุนไพร) [กระดาษ]
- โครงการเปิดแหล่งที่มาของชุดรูปแบบภาษาขนาดใหญ่ที่ได้รับการปรับแต่งอย่างประณีตโดยคำแนะนำทางการแพทย์ของจีนรวมถึง Llama, Alpaca-chinese, บาน, แบบจำลองประเภทที่เคลื่อนย้ายได้ ฯลฯ ตามกราฟความรู้ทางการแพทย์และวรรณกรรมทางการแพทย์
Med-Chatglm
- โครงการโอเพ่นซอร์ส Chatglm-6B ปรับแต่งโดยคำแนะนำทางการแพทย์ของจีนและข้อมูลการปรับจูนนั้นเหมือนกับ Bentsao
Bianque (Bianque) [กระดาษ]
- โครงการเปิดแหล่งที่มาของรูปแบบขนาดใหญ่ของสุขภาพพื้นที่อยู่อาศัย เมื่อรวมกับชุดข้อมูลคำถามและคำตอบทางการแพทย์ของจีนโอเพ่นซอร์ส (MedDialog-CN, IMCS-V2, ChIP-MDCFNPC, MedDG, CMEDQA2, การแพทย์-การแพทย์-การใช้ข้อมูลส่วนใหญ่ของ DAILAGE-DAILAGE มีการสร้างระดับหลายล้านระดับ จาก Bianque Health Big Data Bianquecorpus, Chatglm-6B ได้รับเลือกเป็นรูปแบบการเริ่มต้นและได้รับ Bianque ผ่านการฝึกอบรมการปรับแต่งการเรียนการสอนของพารามิเตอร์เต็ม
Huatuogpt (Hua Tuo) [Paper]
- โครงการเปิดให้บริการ Medical Big Model Huatuogpt รวมถึง Huatuogpt-7b ที่ผ่านการฝึกอบรมตาม Baichuan-7b และ Huatuogpt-13b ที่ผ่านการฝึกอบรมตาม Ziya-Llama-13b-Pretrain-V1
Qizhengpt
- โครงการนี้ใช้ชุดข้อมูลการเรียนการสอนทางการแพทย์ของจีนที่สร้างขึ้นโดยฐานความรู้ทางการแพทย์ Qizhen และจากนี้คำแนะนำได้รับการปรับแต่งอย่างละเอียดเกี่ยวกับรุ่นจีน-llama-plus-7b, Cama-13b และโมเดล chatglm-6b ปรับปรุงผลกระทบของรูปแบบในสถานการณ์ทางการแพทย์ของจีน
พูดคุย
- โครงการเปิดแหล่งข้อมูลการแพทย์ขนาดใหญ่ของจีน Chatmed-Consult ซึ่งใช้การให้คำปรึกษาออนไลน์ 50W + การตอบกลับการตอบกลับของชุดข้อมูลการให้คำปรึกษาทางการแพทย์ออนไลน์ของจีน CHATMED_CONSULT_DATASET เป็นชุดฝึกอบรมและได้รับการปรับแต่ง LORA ตาม LLAMA-7B
Shennong-TCM-LLM (Shennong)
- โครงการโอเพ่นซอร์สของจีนการแพทย์แผนจีนรุ่นใหญ่ Shennong-TCM-LLM ขึ้นอยู่กับกราฟความรู้ด้านการแพทย์แผนจีนโอเพ่นซอร์สมันใช้วิธีการสอนตนเองที่เน้นตัวเองเป็นศูนย์กลางและเรียกใช้ CHATGPT เพื่อให้ได้ชุดข้อมูลการสอนการแพทย์แผนจีน 2.6W+ ขึ้นอยู่กับชุดข้อมูลจะขึ้นอยู่กับ LLAMA และการปรับแต่งโดยใช้ LORA
xrayglm
- โครงการเปิดชุดข้อมูลและแบบจำลองทางการแพทย์หลายรูปแบบที่มาจากจีนซึ่งแสดงศักยภาพพิเศษในการวินิจฉัยการถ่ายภาพทางการแพทย์และบทสนทนาเชิงโต้ตอบหลายรอบ
แพทย์
- โครงการ Open Source Medical Modelgpt ซึ่งรวมถึงการฝึกอบรมล่วงหน้าที่เพิ่มขึ้น, การปรับแต่งการปรับแต่ง, RLHF (การสร้างแบบจำลองรางวัล, การฝึกอบรมการเรียนรู้การเสริมแรง) และ DPO (การเพิ่มประสิทธิภาพการตั้งค่าโดยตรง)
Sunsimiao (Sun Simiao)
- โครงการโอเพ่นซอร์สของจีนรูปแบบการแพทย์ของจีน Sunsimiao ซึ่งได้รับการปรับแต่งตามแบบจำลองฐาน Baichuan-7B และ Chatglm-6B ในข้อมูลการแพทย์จีนคุณภาพสูง 100,000
Caregpt
- โครงการโอเพ่นซอร์สการแพทย์แบบจำลอง CareGPT (CareGPT) ซึ่งรวบรวมชุดข้อมูลการปรับจูนทางการแพทย์ที่เปิดเผยต่อสาธารณะหลายสิบชุด
Disc-Medllm [กระดาษ]
- โครงการนี้เป็นรูปแบบการแพทย์ขนาดใหญ่และชุดข้อมูลที่ออกแบบมาสำหรับสถานการณ์การสนทนาทางการแพทย์และสุขภาพที่ออกโดย Fudan University แบบจำลองนี้ได้มาจากการปรับแต่งชุดข้อมูล DISC-MED-SFT ตามการสอน Baichuan-13b-base การจัดตำแหน่งการตั้งค่าของมนุษย์อย่างมีประสิทธิภาพในสถานการณ์ทางการแพทย์และลดช่องว่างระหว่างผลลัพธ์ของแบบจำลองภาษาทั่วไปและบทสนทนาทางการแพทย์ในโลกแห่งความเป็นจริง
PMC-llama [กระดาษ]
- โครงการ Open Source Mockup Mockup PMC-Llama รวมถึงรุ่น Medllama_13b รุ่นก่อนที่ได้รับการฝึกอบรมมาก่อนและรุ่น PMC_LLAMA_13B ที่ปรับแต่งได้อย่างละเอียด
chatdoctor [กระดาษ]
- โครงการ Open Source Medical Model Chatdoctor ซึ่งได้รับการฝึกฝนเกี่ยวกับ Llama
หมิง (Ming Medical)
- โครงการ Open Source Medical Mody Ming ซึ่งขึ้นอยู่กับการปรับแต่งการเรียนการสอนของ Bloomz-7B เพื่อให้ได้ Ming-7b และสนับสนุนการตอบคำถามทางการแพทย์การให้คำปรึกษาอัจฉริยะและฟังก์ชั่นอื่น ๆ
irigpt
- โครงการโอเพ่นซอร์สการแพทย์จำลอง Ivygpt ซึ่งได้รับการดูแลอย่างละเอียดเกี่ยวกับข้อมูลคำถามและคำตอบทางการแพทย์ที่มีคุณภาพสูงและได้รับการฝึกฝนโดยใช้การเรียนรู้การเสริมแรงจากความคิดเห็นของมนุษย์
ชีพจร
- โครงการโอเพนซอร์สแบบจำลองการแพทย์จีนแบบจำลองการแพทย์ซึ่งใช้ข้อมูลการปรับจูนแบบละเอียดประมาณ 4,000,000 คำสั่งจากการแพทย์แผนจีนและสาขาทั่วไปเพื่อสนับสนุนงานการประมวลผลภาษาธรรมชาติที่หลากหลายในสาขาการแพทย์รวมถึงการศึกษาด้านสุขภาพคำถามการสอบแพทย์การตีความรายงานบันทึกทางการแพทย์ที่มีโครงสร้างและการวินิจฉัยและการรักษาแบบจำลอง
Huangdi (จักรพรรดิ)
- โครงการเปิดแหล่งที่มาของการแพทย์แผนจีนรุ่นใหญ่ Huangdi (จักรพรรดิ) รูปแบบแรกเพิ่มตำราการแพทย์แผนจีนข้อมูลเว็บไซต์การแพทย์จีนและคลังข้อมูลอื่น ๆ บนพื้นฐานของรูปแบบฐาน Ziya-Llama-13b-V1 เพื่อฝึกอบรมรูปแบบการฝึกอบรมล่วงหน้าด้วยความเข้าใจเกี่ยวกับความรู้ด้านการแพทย์จีน จากนั้นบนพื้นฐานนี้จะได้รับการดูแลและปรับแต่งผ่านข้อมูลการสอนการสอนหนังสือเล่มโบราณและข้อมูลการเรียนการสอนทั่วไปจำนวนมากเพื่อให้แบบจำลองมีความสามารถในการตอบความรู้เกี่ยวกับการแพทย์จีนโบราณ
จงจิง (จงจิง)
- โครงการเปิดตัวรูปแบบการแพทย์แผนจีน Zhongjing (Zhongjing) ซึ่งมีวัตถุประสงค์เพื่อชี้แจงความรู้ที่ลึกซึ้งของการแพทย์แผนจีนสืบทอดภูมิปัญญาโบราณและนวัตกรรมทางเทคโนโลยีที่ทันสมัยและในที่สุดก็เป็นเครื่องมือที่น่าเชื่อถือและเป็นมืออาชีพสำหรับสาขาการแพทย์
tcmllm
- โครงการวางแผนที่จะตระหนักถึงงานของการวินิจฉัยทางคลินิกเสริมและการรักษายาแผนจีน (การวินิจฉัยโรคคำแนะนำตามใบสั่งแพทย์ ฯลฯ ) และคำถามและคำตอบการแพทย์แผนจีนอื่น ๆ ผ่านรูปแบบใหญ่และส่งเสริมการพัฒนาคำถามและคำตอบการแพทย์แผนจีน ในปัจจุบันในการตอบสนองต่องานแนะนำใบสั่งยาในการวินิจฉัยอัจฉริยะทางคลินิกและการรักษายาแผนจีนแผนการแพทย์แผนจีน TCMLLM-PR ของรูปแบบคำแนะนำการแพทย์แผนการแพทย์แผนจีนได้รับการปล่อยตัว ด้วยการบูรณาการบันทึกทางคลินิกในโลกแห่งความเป็นจริงคลาสสิกทางการแพทย์และตำราการแพทย์แผนจีนและข้อมูลอื่น ๆ ชุดข้อมูลคำแนะนำใบสั่งยาคำแนะนำการปรับจูนที่มีรายการข้อมูล 68K ถูกสร้างขึ้นและได้รับการปรับแต่งอย่างละเอียด
Mechat [กระดาษ]
- โครงการเปิดแหล่งที่มารูปแบบการสนทนาด้านสุขภาพจิตจีนและชุดข้อมูล โมเดลได้รับการปรับแต่งอย่างละเอียดโดยคำสั่ง chatglm-6b Lora 16 บิต ชุดข้อมูลใช้ CHATGPT เพื่อเขียน QA ความช่วยเหลือซึ่งกันและกันทางจิตวิทยาที่แท้จริงเพื่อรองรับบทสนทนาหลายรอบเพื่อสุขภาพจิตหลายรอบ ชุดข้อมูลมีบทสนทนาหลายรอบ 56K และชุดรูปแบบบทสนทนาคำศัพท์และความหมายของบทนั้นมีความสมบูรณ์ยิ่งขึ้นและมีความหลากหลายมากขึ้นซึ่งสอดคล้องกับสถานการณ์แอปพลิเคชันของบทสนทนาหลายรอบระยะยาว
Soulchat (หัวใจจิตวิญญาณ) [กระดาษ]
- โครงการเปิดแหล่งข้อมูลสุขภาพจิต Soulchat (จิตวิญญาณ) ซึ่งใช้ chatglm-6b เป็นรูปแบบการเริ่มต้นและได้รับการปรับแต่งโดยคำแนะนำร่วมกันของข้อความยาวในภาษาจีนในสาขาการให้คำปรึกษาด้านจิตวิทยาในระดับล้านและข้อมูลการสนทนาที่เอาใจใส่หลายรอบ
MindChat (เก็บถาวร)
- โครงการโอเพ่นซอร์สของโมเดลจิตวิทยา MindChat (อนิเมะพูดคุย) ซึ่งใช้ข้อมูลบทสนทนาทางจิตวิทยาที่มีคุณภาพสูงประมาณ 200,000 ข้อมูลด้วยตนเองสำหรับการฝึกอบรมครอบคลุมการทำงานครอบครัวการศึกษาชีวิตสังคมความปลอดภัยและด้านอื่น ๆ คาดว่าจะช่วยให้ผู้คนบรรเทาความเครียดทางจิตวิทยาและแก้ปัญหาความสับสนทางจิตวิทยาจากสี่มิติ: การให้คำปรึกษาด้านจิตวิทยาการประเมินทางจิตวิทยาการวินิจฉัยทางจิตวิทยาและการรักษาทางจิตวิทยาและปรับปรุงระดับสุขภาพจิตของพวกเขา
Qiaoban (王子)
- โอเพ่นซอร์สโครงการของบทสนทนาทางอารมณ์ของเด็ก Qiaoban โมเดลขนาดใหญ่ มันขึ้นอยู่กับโมเดลทั่วไปโอเพ่นซอร์สโดยใช้บทสนทนาของมนุษย์-คอมพิวเตอร์ทั่วไปข้อมูลการสอนล้อเดียวและข้อมูลการสนทนาทางอารมณ์ของเด็กเพื่อการปรับแต่งการปรับแต่งและพัฒนาแบบจำลองขนาดใหญ่ที่เหมาะสมสำหรับมิตรภาพทางอารมณ์ของเด็ก
⚖ถูกกฎหมาย
- การเงิน
Tongyi-Finance-14b
- Tongyi Finance-14b (Tongyi-Finance-14b) เป็นรูปแบบภาษาขนาดใหญ่ที่เปิดตัวสำหรับอุตสาหกรรมการเงิน มันขึ้นอยู่กับรูปแบบพื้นฐานของ Tongyi Qianwen เพื่อดำเนินการเรียนรู้ที่เพิ่มขึ้นของคลังข้อมูลอุตสาหกรรมเสริมสร้างความสามารถในการใช้ความรู้และสถานการณ์ในด้านการเงินและครอบคลุมความสามารถของจตุภาคเช่นคำถามและคำตอบทางการเงินการจำแนกข้อความการสกัดข้อมูลการสร้างข้อความการอ่านความเข้าใจ
Disc-Finllm [Paper]
- Disc-Finllm เป็นรูปแบบภาษาขนาดใหญ่ในด้านการเงิน มันเป็นระบบการเงินอัจฉริยะหลายระดับประกอบด้วยสี่โมดูลสำหรับสถานการณ์ทางการเงินที่แตกต่างกัน: การให้คำปรึกษาทางการเงิน, การวิเคราะห์ข้อความทางการเงิน, การคำนวณทางการเงินและคำถามและคำตอบการดึงความรู้ทางการเงิน โมดูลเหล่านี้แสดงให้เห็นถึงข้อได้เปรียบที่ชัดเจนในการประเมินสี่ครั้งรวมถึงงาน NLP ทางการเงินคำถามการทดสอบของมนุษย์การวิเคราะห์ข้อมูลและการวิเคราะห์กิจการในปัจจุบันพิสูจน์ให้เห็นว่า Disc-Finllm สามารถให้การสนับสนุนที่แข็งแกร่งสำหรับสาขาการเงินที่หลากหลาย
Investlm [กระดาษ]
- โครงการเปิดแหล่งข้อมูลทางการเงินภาษาอังกฤษโดยใช้การปรับแต่ง Llama-65B
การใช้งาน
- เรามุ่งมั่นที่จะสร้างโครงการรูปแบบที่เปิดกว้างสาธารณะและโครงการทางการเงินที่ยั่งยืนและใช้โอเพนซอร์สและการเปิดกว้างเพื่อส่งเสริม "AI+Financial"
Weaverbird (Weaverbird) [Paper]
- โอเพนซอร์สโครงการเป็นรูปแบบการสนทนาขนาดใหญ่ในสาขาการเงินโดยพิจารณาจากการปรับแต่งคลังข้อมูลด้านการเงินสองภาษาจีน-อังกฤษและยังสามารถเข้าถึงฐานความรู้ท้องถิ่นและเครื่องมือค้นหาออนไลน์
BBT-finicuation-applications [Paper]
- โครงการเปิดแหล่งข้อมูลภาคสนามทางการเงินของจีน BBT-Fincorpus ซึ่งเป็นรุ่นใหญ่ที่เพิ่มความรู้ BBT-Fint5 และมาตรฐานการประเมิน CFLEB
Cornucopia (cornery of cornucopia)
- โครงการสร้างชุดข้อมูลการเรียนการสอนตามข้อมูลคำถามและคำตอบทางการเงินของจีนและคลานและบนพื้นฐานนี้ให้ปรับคำแนะนำเกี่ยวกับรูปแบบระบบ Llama ปรับปรุงผลตอบคำถามของ Llama ในด้านการเงิน
Xuanyuan (Xuanyuan) [กระดาษ]
- Xuanyuan เป็นรูปแบบการสนทนาภาษาจีนโอเพ่นซอร์สแห่งแรกที่มีรูปแบบการสนทนาจีนระดับพันล้านในประเทศจีนและยังเป็นรูปแบบการสนทนาภาษาจีนโอเพนซอร์สแห่งแรกที่ได้รับการปรับให้เหมาะกับสาขาการเงินของจีน จาก Bloom-176b, Xuanyuan ได้ดำเนินการกำหนดเป้าหมายก่อนการฝึกอบรมและการปรับแต่งสำหรับสาขาทั่วไปและสาขาการเงินของจีน ไม่เพียง แต่จัดการกับปัญหาในสาขาทั่วไป แต่ยังตอบคำถามที่เกี่ยวข้องกับการเงินต่างๆให้ผู้ใช้ได้รับข้อมูลและข้อเสนอแนะทางการเงินที่ถูกต้องและครอบคลุม
pixiu (pixiu) [กระดาษ]
- โครงการโอเพ่นซอร์สของชุดข้อมูลการปรับแต่งฟิลด์การปรับแต่งชุดข้อมูลการปรับแต่งพอดี, FINMA แบบจำลองขนาดใหญ่และเปลวไฟเกณฑ์มาตรฐานการประเมินผล
Fingpt [Paper1] [Paper2]
- โครงการเปิดให้มีรูปแบบทางการเงินหลายแบบรวมถึง ChatglM2-6B+LORA และ LLAMA2-7B+LORA และรวบรวมข้อมูลการฝึกอบรมภาษาจีนและภาษาอังกฤษรวมถึงข่าวการเงินสื่อสังคมออนไลน์รายงานทางการเงิน ฯลฯ
Flang [กระดาษ]
- โครงการเปิดแหล่งข้อมูลทางการเงินและการประเมินผลมาตรฐาน
- ให้ความรู้
Taoli (Taoli)
- โครงการเปิดแหล่งที่มาของรูปแบบขนาดใหญ่ที่เหมาะสมสำหรับสาขาการศึกษาระหว่างประเทศของจีน ขึ้นอยู่กับตำราการศึกษาและการสอนของจีนมากกว่า 500 เล่มคำถามทดสอบความสามารถของจีนและพจนานุกรมผู้เรียนภาษาจีน ฯลฯ ปัจจุบันหมุนเวียนอยู่ในสาขาการศึกษาระหว่างประเทศของจีนซึ่งเป็นห้องสมุดทรัพยากรการศึกษาระหว่างประเทศของจีน คำถามการศึกษาและคำตอบระหว่างประเทศที่มีคุณภาพสูงทั้งหมด 88,000 ชุดถูกสร้างขึ้นผ่านคำแนะนำในรูปแบบต่าง ๆ และข้อมูลที่รวบรวมได้ถูกนำมาใช้เพื่อปรับแต่งคำแนะนำเพื่อให้แบบจำลองได้รับความสามารถในการใช้ความรู้ด้านการศึกษาของจีนระหว่างประเทศกับสถานการณ์ที่เฉพาะเจาะจง
educhat [กระดาษ]
- โครงการเปิดแหล่งที่มาของแบบจำลองบทสนทนาสำหรับสาขาการศึกษาแนวตั้งส่วนใหญ่ศึกษาเทคโนโลยีที่เกี่ยวข้องกับแบบจำลองการสนทนาการศึกษาตามแบบจำลองที่ผ่านการฝึกอบรมมาก่อนรวมข้อมูลภาคสนามการศึกษาที่หลากหลายเสริมด้วยวิธีการเช่นการปรับแต่งการเรียนการสอนและการจัดเรียงการศึกษา ครูนักเรียนและผู้ปกครองและช่วยให้การศึกษาที่ชาญฉลาดซึ่งเป็นไปตามความถนัดความยุติธรรมเพียงแค่และอบอุ่น
➕คนอื่น ๆ
ชุดข้อมูล
- เกณฑ์มาตรฐานการประเมิน
c-eval [กระดาษ]
- C-EVAL เป็นเกณฑ์มาตรฐานการประเมินแบบจำลองพื้นฐานของจีนที่ออกโดยมหาวิทยาลัยเซี่ยงไฮ้ Jiaotong มันมีคำถามแบบปรนัย 13,948 คำถามครอบคลุมสี่ทิศทางสำคัญ: มนุษยศาสตร์สังคมศาสตร์วิทยาศาสตร์และวิศวกรรมและวิชาเอกอื่น ๆ 52 วิชาตั้งแต่โรงเรียนมัธยมจนถึงนักศึกษาระดับบัณฑิตศึกษาของมหาวิทยาลัยและการสอบสายอาชีพ
Agieval [กระดาษ]
- Agieval เป็นเกณฑ์มาตรฐานการประเมินที่เปิดตัวโดย Microsoft เพื่อประเมินประสิทธิภาพของแบบจำลองขนาดใหญ่ในงานเกี่ยวกับความรู้ความเข้าใจของมนุษย์ มันรวมถึง 20 อย่างเป็นทางการ, เปิด, การรับเข้าเรียนที่ได้มาตรฐานสูงและการตรวจสอบคุณสมบัติสำหรับผู้สมัครสามัญรวมถึงการสอบเข้ามหาวิทยาลัยทั่วไป (การสอบเข้าวิทยาลัยจีนและการสอบของสหรัฐอเมริกา SAT), การสอบเข้าโรงเรียนกฎหมาย, การแข่งขันทางคณิตศาสตร์
Xiezhi (Xiezhi) [Paper]
- Xiezhi เป็นมาตรฐานการประเมินความรู้ภาคสนามที่ครอบคลุมโดยอัตโนมัติและได้รับการปรับปรุงโดยอัตโนมัติโดยมหาวิทยาลัย Fudan รวมถึง 13 สาขาวิชา: ปรัชญา, เศรษฐศาสตร์, กฎหมาย, การศึกษา, วรรณกรรม, ประวัติศาสตร์, วิทยาศาสตร์ธรรมชาติ, วิศวกรรม, การเกษตร, การแพทย์, ทหาร, การจัดการและศิลปะ, 516 สาขาวิชาเฉพาะและ 249,587 คำถาม
cmmlu [กระดาษ]
- CMMLU เป็นเกณฑ์มาตรฐานการประเมินของจีนที่ครอบคลุมซึ่งใช้โดยเฉพาะเพื่อประเมินความรู้และความสามารถในการใช้เหตุผลของแบบจำลองภาษาในบริบทของจีน CMMLU ครอบคลุม 67 หัวข้อจากสาขาวิชาพื้นฐานไปจนถึงระดับมืออาชีพขั้นสูง ซึ่งรวมถึง: วิทยาศาสตร์ธรรมชาติที่ต้องมีการคำนวณและการใช้เหตุผลมนุษยศาสตร์และสังคมศาสตร์ที่ต้องการความรู้และกฎการขับขี่จีนที่ต้องใช้สามัญสำนึกในชีวิต นอกจากนี้งานจำนวนมากใน CMMLU มีคำตอบเฉพาะภาษาจีนและอาจไม่สามารถใช้ได้ในระดับสากลในภูมิภาคหรือภาษาอื่น ๆ Therefore, it is a completely Chinese test benchmark.
MMCU [paper]
- MMCU是一个综合性的中文评测基准,包括来自医学、法律、心理学和教育等四大领域的测试。
CG-Eval [paper]
- CG-Eval是一个由甲骨易AI研究院与LanguageX AI Lab联合发布的针对中文大模型生成能力的评测基准。包含了科技与工程、人文与社会科学、数学计算、医师资格考试、司法考试、注册会计师考试等六个大科目类别下的55个子科目的11000道不同类型问题。CG-Eval包含一套复合的打分系统:对于非计算题,每一道名词解释题和简答题都有标准参考答案,采用多个标准打分然后加权求和;对于计算题目,会提取最终计算结果和解题过程,然后综合打分。
CBLUE [paper]
- CBLUE是一个中文医学语言理解评测基准,包含8个中文医疗语言理解任务。
PromptCBLUE [paper]
- PromptCBLUE是一个面向中文医疗场景的评测基准,通过对CBLUE基准进行二次开发,将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务。
LAiW [paper]
- LAiW 是一个中文法律大模型评测基准,针对3大能力设计13个基础任务:1)法律NLP 基础能力:评测法律基础任务、 NLP 基础任务和法律信息抽取的能力,包括法条推送、要素识别、命名实体识别、司法要点摘要和案件识别5 个基础任务;2)法律基础应用能力:评测大模型对法律领域知识的基础应用能力,包括争议焦点挖掘、类案匹配、刑事裁判预测、民事裁判预测和法律问答5 个基础任务;3)法律复杂应用能力:评测大模型对法律领域知识的复杂应用能力,包括司法说理生成、案情理解和法律咨询3 个基础任务。
LawBench [paper]
- LawBench 是一个面向中国法律体系的法律评测基准。LawBench 模拟了司法认知的三个维度,并选择了20个任务来评估大模型的能力。与一些仅有多项选择题的现有基准相比,LawBench 包含了更多与现实世界应用密切相关的任务类型,如法律实体识别、阅读理解、犯罪金额计算和咨询等。
LegalBench [paper]
- LegalBench 是一个面向美国法律体系的法律评测基准,包含162个法律推理任务。
LEXTREME [paper]
- LEXTREME是一个多语言的法律评测基准,包含了24种语言11个评测数据集。
LexGLUE [paper]
CFBenchmark [paper]
- CFBenchmark是一个旨在评估大语言模型在中文金融场景下辅助工作的评测基准。CFBenchmark的基础版本包括3917个金融文本涵盖三个方面和八个任务,从金融识别、金融分类、金融生成三个方面进行组织。
FinanceBench [paper]
- FinanceBench是一个用于评估开放式金融问题问答的评测基准,包含10,231 个有关上市公司的问题,以及相应的答案。
FinEval [paper]
- FinEval是一个金融知识评测基准,包含了4,661个高质量的多项选择题,涵盖金融、经济、会计和证书等领域,34个不同的学术科目。
FLARE [paper]
- FLARE是一个金融评测基准,包含了金融知识理解和预测等任务。
CFLEB [paper]
- CFLEB是一个中文金融评测基准,包含两项语言生成任务和四项语言理解任务。
FLUE [paper]
- FLUE是一个金融评测基准,包含5个金融领域数据集。
GeoGLUE [paper]
- GeoGLUE是一个由阿里巴巴达摩院与高德联合发布的地理语义理解能力评测基准,旨在推动地理相关文本处理技术和社区的发展。本榜单提炼了其中多个典型场景:地图搜索、电商物流、政府登记、金融交通,并设计了六个核心任务:门址地址要素解析、地理实体对齐、Query-POI库召回、Query-POI相关性排序、地址Query成分分析、WhereWhat切分。
OWL-Bench [paper]
- OWL-Bench 是一个面向运维领域的双语评测基准。它包含317 个问答题和1000 个多选题,涵盖了该领域的众多现实工业场景,包括信息安全、应用、系统架构、软件架构、中间件、网络、操作系统、基础设施和数据库这九个不同的子领域。以确保OWL-Bench 能够展现出多样性。
DevOps-Eval
- DevOps-Eval是由蚂蚁集团联合北京大学发布的面向DevOps领域的大语言模型评测基准。
- Appendix
点赞历史
- ลิงค์ที่เป็นมิตร
- Awesome Code LLM
- 该项目收集了代码大模型相关论文,并整理出一篇综述。
- CodeFuse-ChatBot
- CodeFuse-ChatBot是由蚂蚁CodeFuse团队开发的开源AI智能助手,致力于简化和优化软件开发生命周期中的各个环节。
- Awesome AIGC Tutorials
- 该项目收集了关于AIGC的各种精选教程和资源,既适合初学者也适合进阶AI爱好者。
- Awesome Tool Learning
- 该项目收集了关于工具学习的资源,包括论文、框架和应用。
- Awesome LLM reasoning
- 该项目收集了关于大语言模型推理方面的资源,包括论文、数据集等。