ตัวอย่างการแปลกราฟความรู้สามัญสำนึกภาษาอังกฤษและจีนของเหตุการณ์ญี่ปุ่นของมหาวิทยาลัย Waseda
เป็นภาษาอังกฤษ
การให้เหตุผลสามัญสำนึกประจำวันในชีวิตสามารถรับได้ผ่านความสัมพันธ์ความรู้การอนุมานหนาแน่นบางอย่างดังแสดงในรูปด้านล่าง:

มหาวิทยาลัย Waseda ติดแท็กชุดข้อมูล NLP-Waseda/Comet-atomic-ja ในญี่ปุ่นและศึกษาว่าแบบจำลองสามารถเรียนรู้ว่าสามัญสำนึกในการอนุมานเหตุการณ์ที่ไม่เคยเห็นมาก่อนหรือไม่ พวกเขาสำรวจรุ่น GPT2 และ T5 ตามลำดับ (เมื่อได้รับวลีเหตุการณ์ E และมิติการอนุมาน C โมเดลจะสร้างเป้าหมาย t = fθ (e, c)) สิ่งนี้สามารถทำได้อย่างง่ายดายด้วยความช่วยเหลือของวิธีการสร้างปัญหาการเรียนรู้การเรียนรู้คิวในปัจจุบัน
จุดสนใจของโครงการนี้คือการแปลคลังข้อมูลของพวกเขาเป็นภาษาอังกฤษและจีนและฝึกอบรมรูปแบบสไตล์ T5 เพื่อตรวจสอบความสามารถในการปรับตัวของการเรียนรู้ที่รวดเร็วเพื่อจัดการกับปัญหาดังกล่าวในภาษาอังกฤษและจีน
ตัวอย่างโครงสร้าง JSON
{ 'event': {'event': 'Xがパチンコ屋へ行く', 'mental_state': 'Xがパチンコ屋へ行く' },
'inference': {'event': {'before': ['Xが小遣いをもらう',
'Xがパチンコで勝つ',
'Xが金を用意する',
'Xがギャンブル依存症だと自覚する',
'Xが車を運転する',
'Xが金を稼ぐ',
'Xが金を持っている',
'Xが時間的余裕を持つ'],
'after': ['Xが負ける']},
'mental_state': {'before': ['時間をつぶしたい',
'ギャンブルがしたい',
'何か面白いことないかな',
'時間つぶしだ',
'暇だ',
'お金が欲しい',
'お金を儲ける',
'ストレス発散したい'],
'after': ['お金を失う',
'お金がなくなった',
'お金をたくさん使う',
'もう少ししたら帰る',
'お金が減る',
'また負けた',
'当たりそうだ',
'勝ったら嬉しい',
'負けて帰ってくる',
'お金がなくなる']}}} ตัวอย่างโครงสร้าง JSON
{ 'en_event': {'event': 'X is going to the pachinko parlor',
'mental_state': 'X is going to the pachinko parlor' },
'en_inference': {'event': {'before': ['X gets an allowance',
'X wins at pachinko.',
'X gets the money.',
'Realize X has a gambling problem',
'X drives a car',
'X makes money',
'X has money',
'X has time to spare'],
'after': ['X will lose']},
'mental_state': {'before': ['X wants to kill time',
'X wants to gamble',
'I need something fun to do',
'X is killing time',
" I'm not busy " ,
'I want money',
'Make some money',
'I want to relieve stress'],
'after': ['Lose money',
'Money is running out',
'Spend a lot of money',
" I'll be home in a little while " ,
'X will have less money',
'I lost again.',
" I think I'm going to win. " ,
" I'll be happy if I win " ,
'X comes home defeated',
'X runs out of money']}}} ตัวอย่างโครงสร้าง JSON
{ 'zh_event': {'event': 'X要去柏青哥店。', 'mental_state': 'X要去柏青哥店。' },
'zh_inference': {'event': {'before': ['X得到一笔津贴',
'X在弹子机上赢了。',
'X拿到钱',
'X意识到自己有赌博问题',
'X驾驶汽车',
'X 挣钱',
'X有钱了',
'X有时间'],
'after': ['X输了一场比赛']},
'mental_state': {'before': ['X想打发时间',
'X想赌博',
'我需要一些有趣的事情来做',
'X在打发时间',
'我不忙。',
'我想要钱',
'赚点钱',
'我想缓解压力'],
'after': ['失去了金钱。',
'我已经没有钱了',
'我花了很多钱',
'我一会儿就回家了',
'X有更少的钱',
'我又输了。',
'我想我要赢了。',
'如果我赢了,我会很高兴。',
'X败兴而归',
'X钱用完了']}}} ฉันปรับแต่งโมเดล T5 และ Lora ที่ใช้ในภาษาอังกฤษและภาษาจีน (ด้วยความช่วยเหลือจาก Peft) บนกราฟที่ฉันสร้างขึ้น
ข้อมูลเพิ่มเติมและตัวอย่างเกี่ยวกับ LORA สามารถดูได้ใน https://github.com/svjack/controllora-chinese แอปพลิเคชั่นควบคุม LORA ในโดเมนการแพร่กระจายที่เสถียรสำหรับการควบคุมเอาต์พุตภาพผ่านตัวควบคุมที่ใช้ LORA
pip install -r requirements.txtรุ่นที่มีอยู่ใน HuggingFace:
| ชื่อ | ลิงค์โมเดล HuggingFace | ลิงค์ Space HuggingFace |
|---|---|---|
| Atomic ดาวหางภาษาอังกฤษ? | https://huggingface.co/svjack/comet-atomic-en | https://huggingface.co/spaces/svjack/english-comet-atomic |
| อะตอมของดาวหางจีน | https://huggingface.co/svjack/comet-atomic-zh | https://huggingface.co/spaces/svjack/chinese-comet-atomic |
| ดาวหางจีนอะตอม T5 Lora | https://huggingface.co/svjack/mt0-large-comet-atomic-zh-peft-early-cpu | https://huggingface.co/spaces/svjack/chinese-comet-atomic-t5-large-lora |
คุณสามารถใช้งานออนไลน์หรือขึ้นอยู่กับการ์ดรุ่น
svjack - [email protected] - [email protected]
ลิงค์โครงการ: https: //github.com/svjack/comet-atomic-en-zh