Bulletin Release: Rime Chinese Grammar Model และ Thesaurus Construction บนพื้นฐานของคลังขนาดใหญ่ 32GB
—— แบบจำลองไวยากรณ์วิสัยทัศน์, พจนานุกรมอะตอมวิสัยทัศน์
การแนะนำโครงการ
- จากคลังข้อมูลจีนขนาดใหญ่และหลากหลายเราได้สร้างแบบจำลองไวยากรณ์ของจีนที่มีประสิทธิภาพที่ยอดเยี่ยมและครอบคลุมกว้างและคำศัพท์ที่มีประสิทธิภาพ รูปแบบไวยากรณ์และอรรถาภิธานเปิดตัวในเวลานี้รวมเนื้อหาจากคำถามและคำตอบของชุมชน, การโต้ตอบกับบล็อก, บัญชีอย่างเป็นทางการ, รายการสารานุกรม, รายงานข่าว, เนื้อเพลง, วรรณกรรมบทกวี, สำนวน, ลิ้นบิดลิ้น, บทวิจารณ์ของโรงแรม คลังข้อมูลโดยรวมคือสเกล 32G ซึ่งมีความสมดุลและพิถีพิถันมากขึ้นในการทำความสะอาด วิสัยทัศน์ของโครงการ มุ่งมั่นที่จะให้ฐานพื้นฐานที่แข็งแกร่งที่สุดของ Rime ทำให้มีคำอธิบายประกอบการออกเสียงที่แม่นยำที่สุดทำให้สถิติความถี่คำที่แม่นยำที่สุดคือฐานข้อมูลการแบ่งส่วนคำที่เหมาะสมที่สุดและสร้างอัตราการเข้าชมที่สูงและโมเดลอินพุตที่แม่นยำตามเงื่อนไขที่มีอยู่
- ในเวลาเดียวกันพจนานุกรมพินอินคำเดียวที่เก็บรักษาไว้ในโครงการครอบคลุมพื้นที่พื้นฐาน CJK ไปยังพื้นที่ G ที่ขยายและพื้นที่หัวรุนแรง Kangxi มันยังคงการออกเสียงมากขึ้นด้วยตนเองตามพจนานุกรมฮันซึ่งอาจครอบคลุมมากขึ้นในพจนานุกรมข้อความเดียว
- lexicons rime ทั้งหมดในโครงการใช้การตรวจคัดกรอง AI-Assisted และการพิสูจน์อักษรด้วยตนเองเพื่อเลือกวลีคุณภาพสูง ห้องสมุดคำศัพท์เต็มไปด้วยการสะกดคำด้วยน้ำเสียงและความถี่คำทั้งหมดขึ้นอยู่กับวลีและพินอินคีย์คู่ ความแตกต่างเช่น: "อยู่ที่ไหน" สำหรับความถี่คำเดียวในสถานการณ์ที่คล้ายกันแทนที่จะรวมอยู่ในพินอินของนา ความถี่คำเดียวคือการรวมกันของคำเดียวและพินอินที่สอดคล้องกันในประโยควลี ดังนั้นความถี่คำเดียวก็แตกต่างจากอักขระโพลีโฟนิก เนื่องจากคลังขนาดใหญ่หลายคำหลายคำได้มาถึงระดับ 1 พันล้าน คำว่าความถี่นั้นได้รับการทำให้เป็นจริงซึ่งทำให้ความถี่ของคำสั้นลงและง่ายต่อการบำรุงรักษาและไฟล์เก็บไบต์น้อยลง วิธีการโยกย้ายไปยังแผนของคุณ? คลิกเพื่อโยกย้ายคำศัพท์
ดาวน์โหลดรุ่น | คำแนะนำการกำหนดค่าแบบจำลอง รายละเอียดการใช้งานและการสอนการก่อสร้าง
- รุ่นไฟล์รุ่นคำอธิบาย: v คือหมายเลขเวอร์ชัน n คือระดับรุ่น M คือขนาด 100 เมกะไบต์
| ขนาดไฟล์ | รุ่นระดับ 2 | รุ่นระดับ 3 |
|---|
| 100 เมตร | V1N2M1 | V1N3M1 |
| 200m | V1N2M2 | V1N3M2 |
| 300m | V1N2M3 | V1N3M3 |
- คำแนะนำที่เกี่ยวข้องสำหรับไฟล์ฐานข้อมูล:
ตัวอย่างโครงการ:
Vientiane Pinyin Enhanced Version - การรวมกันของรหัสเสริมโดยตรงหลายมิติและรูปแบบ Pinyin ใด ๆ | Vientiane Pinyin Basic Version - Pinyin Full Double Pinyin เวอร์ชันเสริมทางอ้อม
| ราพย์ | ชื่อไฟล์ | อธิบาย |
|---|
| โต๊ะขนาดใหญ่ | large.dict | มีการออกเสียงทั้งหมดในพื้นที่พื้นฐานของห้องสมุด CJK Font โดยไม่คำนึงถึง 43324 คำหลายคำ |
| อรรถาภิธานพื้นฐาน | base.dict | มีวลี 2-3 คำ |
| อรรถาภิธานขยาย | ext.dict | มีวลีที่ใช้กันทั่วไป |
| ตารางคำเต็ม | full.dict | รวมถึงตัวละครทั้งหมดด้วย CJK อักขระภาษาจีนที่สมบูรณ์ |
เพียงใส่ส่วนของเนื้อหานี้ในไฟล์ Scheme ดาวน์โหลดโมเดลไปยังไดเรกทอรีผู้ใช้ของ Rime และเปลี่ยนภาษา: AMZ-V2N3M1-ZH-HANS เป็นชื่อไฟล์ที่คุณดาวน์โหลด (ไม่รวมคำต่อท้าย)
__include: octagram #启用语法模型
#语法模型
octagram:
__patch:
grammar:
language: amz-v2n3m1-zh-hans
collocation_max_length: 5
collocation_min_length: 2
translator/contextual_suggestions: true
translator/max_homophones: 7
translator/max_homographs: 7