ทรัพยากรการวิจัยสลับรหัส
นี่คือรายการของบทเรียนการประชุมเชิงปฏิบัติการเอกสารและทรัพยากรเกี่ยวกับวิธีการเชิงภาษาที่คำนวณเพื่อการวิจัยการสลับรหัส รายการจะได้รับการอัปเดตตลอดเวลา คุณสามารถส่งคำขอดึงสำหรับการอัปเดตรายการและเป็นหนึ่งในผู้มีส่วนร่วม!
- ฉันวางแผนที่จะรวบรวมวิทยานิพนธ์และหนังสือเกี่ยวกับการสลับรหัสและแสดงรายการที่นี่ หากคุณมีหนึ่งอย่าลังเลที่จะติดต่อฉันหรือสร้างคำขอดึง!
สารบัญ
- ไฮไลท์
- - เวิร์กช็อป
- - งานวิจัย
- กระดาษสำรวจ
- รูปแบบภาษาขนาดใหญ่
- การระบุภาษาและการติดแท็ก POS
- คอร์ปัส
- การสร้างแบบจำลองภาษาและการรู้จำเสียงพูด
- วาทกรรม
- รุ่น
- การสังเคราะห์คำพูด
- ตัวชี้วัด
- การเรียนรู้การเป็นตัวแทน
- การแปลเครื่องจักร
- การแปลคำพูด
- ความเข้าใจภาษาธรรมชาติ
- การจดจำเอนทิตีชื่อ
- ภาษาศาสตร์
- การคำนวณทางอารมณ์
- บทสนทนาและระบบการสนทนา
- วาทกรรม
- ไวยากรณ์
- การโจมตีของฝ่ายตรงข้าม
- ภาษาศาสตร์สังคม
- เกณฑ์มาตรฐาน
- โซเชียลมีเดีย
- การทำให้เป็นมาตรฐาน
- ชุดเครื่องมือ
- หนังสือ
- วิทยานิพนธ์
ไฮไลท์
- เราจะจัดเวิร์กช็อปการสลับรหัสที่ NAACL 2025! เราจะอัปเดตเว็บไซต์ในไม่ช้า! [เว็บไซต์]
- หากคุณใหม่เกี่ยวกับการสลับรหัสหรือมองหาทิศทางการวิจัยใหม่เราได้เขียนรายงานการสำรวจที่ครอบคลุมเกี่ยวกับการสลับรหัส: ความคืบหน้าทศวรรษที่ผ่านมาในการวิจัยการสลับรหัสใน NLP: การสำรวจอย่างเป็นระบบเกี่ยวกับแนวโน้มและความท้าทาย [กระดาษ] อย่าลังเลที่จะอ่านและแจ้งให้เราทราบหากคุณมีข้อเสนอแนะ! ขอบคุณ Alham Fikri Aji, Zheng-Xin Yong และ Thamar Solorio ที่จะทำให้สิ่งนี้เป็นไปได้หรือไม่?
- เราจัดเวิร์กช็อปการสลับรหัสที่ EMNLP 2023! [เว็บไซต์]
- เรา (I, Marina Zhukova และ Sudipta Kar) จัดเซสชันนก-ขนนกที่ EMNLP 2022 ในอาบูดาบี เรามีคนเข้าร่วมประมาณ 30 คน (ด้วยตนเองและออนไลน์) ขอบคุณที่มา!
- - มีการสอนที่ครอบคลุมเกี่ยวกับการผสมรหัสโดย Microsoft Research (Monojit Choudhury, Kalika Bali, Anirudh Srinivasan และ Sandipan Dandapat) ที่ EMNLP 2019 คุณสามารถตรวจสอบลิงค์ต่อไปนี้
- เวิร์กช็อป
นี่คือรายการของซีรี่ส์เวิร์กช็อปสลับรหัส:
- การประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับวิธีการคำนวณในการสลับรหัส, EMNLP 2014 [เว็บไซต์]
- การประชุมเชิงปฏิบัติการครั้งที่สองเกี่ยวกับวิธีการคำนวณในการสลับรหัส EMNLP 2016
- การประชุมเชิงปฏิบัติการครั้งที่สามเกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัสภาษา ACL 2018 [เว็บไซต์]
- การประชุมเชิงปฏิบัติการครั้งที่สี่เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, LREC 2020 [เว็บไซต์]
- การประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับเทคโนโลยีการพูดสำหรับการสลับรหัสในชุมชนหลายภาษา Interspeech 2020 [เว็บไซต์]
- การประชุมเชิงปฏิบัติการครั้งที่ห้าเกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, NAACL 2021 [เว็บไซต์]
- การประชุมเชิงปฏิบัติการครั้งที่หกเกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัสภาษา EMNLP 2023 [เว็บไซต์]
- การประชุมเชิงปฏิบัติการครั้งที่เจ็ดเกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, NAACL 2025 [เว็บไซต์ (จะเปิดเร็ว ๆ นี้)]
- งานวิจัย
กระดาษสำรวจ
- Winata และคณะ (2023) ความคืบหน้าทศวรรษที่ผ่านมาในการวิจัยการสลับรหัสใน NLP: การสำรวจอย่างเป็นระบบเกี่ยวกับแนวโน้มและความท้าทาย การค้นพบ ACL [กระดาษ]
- Doğruöz, et al (2021) การสำรวจการสลับรหัส: มุมมองทางภาษาและสังคมสำหรับเทคโนโลยีภาษา ACL [กระดาษ]
- Jose, et al. (2020) การสำรวจชุดข้อมูลปัจจุบันสำหรับการวิจัยการสลับรหัส การประชุมนานาชาติเกี่ยวกับการคำนวณขั้นสูงและระบบการสื่อสาร (ICACCS) [กระดาษ]
- Sitaram และคณะ (2019) การสำรวจคำพูดและการประมวลผลภาษาสลับรหัส arxiv [กระดาษ]
รูปแบบภาษาขนาดใหญ่
- Winata และคณะ (2024) คนงานเหมือง: โมเดลภาษาหลายภาษาเป็นตัวดึงความหมาย การค้นพบ EMNLP [กระดาษ] [รหัส]
- Yoo, et al. (2024) การสลับโค้ดสีแดง-ทีม: การประเมิน LLM เพื่อความปลอดภัยและความเข้าใจหลายภาษา arxiv [กระดาษ]
- Leon, et al., (2024) โพรบผสมโค้ดแสดงให้เห็นว่าโมเดลที่ผ่านการฝึกอบรมมาก่อนเป็นเรื่องทั่วไปบนข้อความสลับรหัส LREC [กระดาษ] [รหัส]
- Huzaifah และคณะ (2024) การประเมินการแปลการสลับรหัสด้วยโมเดลภาษาขนาดใหญ่ LREC-COLING [PAPER]
- ยงและคณะ (2023) กระตุ้นให้โมเดลภาษาขนาดใหญ่สร้างข้อความผสมรหัส: กรณีของภาษาเอเชียตะวันออกเฉียงใต้ calcs, emnlp [กระดาษ]
การระบุภาษาและการติดแท็ก POS
- Burchell และคณะ (2024) การระบุภาษาสลับรหัสนั้นยากกว่าที่คุณคิด EACL [กระดาษ]
- Igor Sterner และ Simone Teufel (2023) Tangueswitcher: การระบุการสลับรหัสภาษาเยอรมัน-อังกฤษอย่างละเอียด calcs, emnlp [กระดาษ]
- Ostapenko และคณะ (2022) ข้อมูลลำโพงสามารถเป็นแนวทางในการสร้างแบบจำลองที่ดีขึ้น: กรณีศึกษาเกี่ยวกับการทำนายการสลับรหัส ACL [กระดาษ]
- เหงียนและคณะ (2021) การระบุภาษาอัตโนมัติในข้อความสื่อสังคมออนไลน์ที่เปลี่ยนรหัสภาษาฮินดู-อังกฤษ วารสารข้อมูลมนุษยศาสตร์เปิด [กระดาษ]
- Tarunesh และคณะ (2021) จากการแปลของเครื่องเป็นการสลับรหัส: การสร้างข้อความสลับรหัสคุณภาพสูง ACL [กระดาษ]
- Gustavo Aguilar และ Thamar Solorio (2020) จากภาษาอังกฤษถึงการสลับรหัส: ถ่ายโอนการเรียนรู้ด้วยเบาะแสทางสัณฐานวิทยาที่แข็งแกร่ง ACL [กระดาษ] [รหัส]
- Mager, et al. (2019) การระบุภาษาระดับย่อยสำหรับการสลับรหัสภายในคำ naacl [กระดาษ]
- จางและคณะ (2018) แบบจำลองที่รวดเร็วกะทัดรัดและแม่นยำสำหรับการระบุภาษาของข้อความ codemixed emnlp [กระดาษ]
- Kelsey Ball และ Dan Garrette (2018) การติดแท็กส่วนหนึ่งของคำพูดสำหรับการสลับรหัสข้อความที่ถูกถอดออกโดยไม่มีการระบุภาษาที่ชัดเจน emnlp [กระดาษ]
- Zeynep Yirmibesoglu และ Gulsen Eryigit (2018) การตรวจจับการสลับรหัสระหว่างคู่ภาษาตุรกี-อังกฤษ เวิร์กช็อป w-nut, emnlp [กระดาษ]
- Mavem, et al. (2018) การระบุภาษาและการวิเคราะห์ข้อความโซเชียลมีเดียสลับรหัส การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Victor Soto และ Julia Hirschberg (2018) การติดแท็ก ID ส่วนของการพูดและภาษาร่วมกันสำหรับข้อมูลสลับรหัส การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Bullock และคณะ (2018) ทำนายการมีอยู่ของภาษาเมทริกซ์ในการสลับรหัส การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Soto, et al. (2018) บทบาทของคำพูด, แท็ก POS และการขึ้นรถไฟในการสลับรหัส Interspeech [Paper]
- Barman และคณะ (2016) การติดแท็กส่วนหนึ่งของเนื้อหาโซเชียลมีเดียที่ผสมรหัส: การสร้างโมเดลการจัดซ้อนและการสร้างแบบจำลองร่วม การประชุมเชิงปฏิบัติการครั้งที่ 2 เกี่ยวกับวิธีการคำนวณเพื่อสลับรหัส ACL [Paper]
- Vyas, et al. (2014) การติดแท็ก POS ของเนื้อหาโซเชียลมีเดียที่ผสมรหัสภาษาอังกฤษ-ฮินดี emnlp [กระดาษ]
- Heba Elfardy และ Mona Diab (2012) การระบุระดับโทเค็นของการสลับรหัสภาษาศาสตร์ coling [กระดาษ]
- Thamar Solorio และ Yang Liu (2008) การเรียนรู้ที่จะทำนายจุดเปลี่ยนรหัส emnlp [กระดาษ]
- Dau-Cheng Lyu และ Ren-Yuan Lyu (2008) การระบุภาษาเกี่ยวกับคำพูดเปลี่ยนรหัสโดยใช้หลายตัวชี้นำ Interspeech [Paper]
คอร์ปัส
- Kuwanto และคณะ (2024) ทฤษฎีภาษาศาสตร์เป็นไปตาม LLM: การสร้างข้อความสลับรหัสผ่านแบบจำลองภาษาขนาดใหญ่ที่มีข้อ จำกัด เทียบเท่า arxiv [กระดาษ] [รหัส] [ชุดข้อมูล]
- Ruochen Zhang และ Carsten Eickhoff (2024) Crocosum: ชุดข้อมูลมาตรฐานสำหรับการสรุปการสลับรหัสข้ามภาษา LREC [กระดาษ] [ชุดข้อมูล]
- ทำเนียบขาวและคณะ (2022) EntityCs: การปรับปรุงการถ่ายโอนข้ามภาษาแบบไม่มีการยิงด้วยการสลับรหัสเอนทิตีเป็นศูนย์กลาง emnlp [กระดาษ] [รหัส]
- โลเวเนียและคณะ (2022) Ascend: ชุดข้อมูลภาษาจีน-อังกฤษที่เกิดขึ้นเองสำหรับการสลับรหัสในการสนทนาหลายครั้ง LREC [กระดาษ] [ชุดข้อมูล]
- เหงียนและคณะ (2020) CANVEC-The Canberra Vietnamese-English Switching Corpus คำพูดธรรมชาติ LREC [กระดาษ]
- Umapathy และคณะ (2020) การตรวจสอบเทคนิคการสร้างแบบจำลองสำหรับการอนุมานภาษาธรรมชาติในบทสนทนาสลับรหัสในภาพยนตร์บอลลีวูด การประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับเทคโนโลยีการพูดสำหรับการสลับรหัสในชุมชนหลายภาษา Interspeech 2020 [ชุดข้อมูล]
- Xiang และคณะ (2020) คำที่เป็นตัวอักษรของ Sina Mandarin: ทรัพยากรคำศัพท์การผสมโค้ดที่ขับเคลื่อนด้วยเว็บ AACL-IJCNLP [TBC]
- Chakravarthi และคณะ (2020) การสร้างคลังข้อมูลสำหรับการวิเคราะห์ความเชื่อมั่นในข้อความภาษาทมิฬ-ภาษาอังกฤษผสมรหัส เทคโนโลยีการพูดภาษาสำหรับภาษาที่มีทรัพยากรต่ำกว่า) และ CCURL (การทำงานร่วมกันและการคำนวณสำหรับการประชุมเชิงปฏิบัติการภาษาที่มีทรัพยากรต่ำ
- Khanuja และคณะ (2020) ชุดข้อมูลใหม่สำหรับการอนุมานภาษาธรรมชาติจากการสนทนาผสมโค้ด การประชุมเชิงปฏิบัติการครั้งที่ 4 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, LREC [กระดาษ]
- Barik และคณะ (2019) การทำให้เป็นมาตรฐานของข้อมูล Twitter ที่ผสมรหัสภาษาอินโดนีเซีย-ภาษาอังกฤษ w-nut, emnlp [กระดาษ] [ชุดข้อมูล]
- ซิงห์และคณะ (2018) Twitter Corpus สำหรับ Hindi-English Code Mixed POS Tagging การประชุมเชิงปฏิบัติการนานาชาติครั้งที่หกเกี่ยวกับการประมวลผลภาษาธรรมชาติสำหรับโซเชียลมีเดีย ACL [กระดาษ]
- Li, et al. (2012) คลังข้อมูลการสลับรหัสภาษาจีนกลางภาษาอังกฤษ LREC [กระดาษ]
- Lyu, et al. (2010) Seame: คลังคำพูดเปลี่ยนรหัสภาษาจีนกลาง-อังกฤษในเอเชียตะวันออกเฉียงใต้ Interspeech [Paper]
- Lyu, et al. (2010) การวิเคราะห์คลังคำพูดเปลี่ยนรหัสภาษาจีนกลาง-อังกฤษ: Seame อายุ [กระดาษ]
การสร้างแบบจำลองภาษาและการรู้จำเสียงพูด
- Yu, et al. (2023) การสร้างการสร้างข้อความและการฉีดข้อความใน ASR ภาษาจีนกลาง-อังกฤษ ICASSP [กระดาษ]
- Tolúlopéและคณะ (2023) การเป็นตัวแทนการพูดที่พูดตนเองหลายภาษาช่วยปรับปรุงการรู้จำเสียงพูดของภาษาแอฟริกันที่มีทรัพยากรต่ำด้วยรหัส การประชุมเชิงปฏิบัติการครั้งที่หกเกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัสภาษาศาสตร์ [กระดาษ]
- Kumar และคณะ (2020) การสร้างแบบจำลองภาษาที่ใช้การเรียนรู้ของเครื่องของข้อมูลที่สลับรหัส การประชุมระหว่างประเทศเกี่ยวกับอิเล็กทรอนิกส์และระบบการสื่อสารที่ยั่งยืน (ICESC) [กระดาษ]
- Madhumani และคณะ (2020) การเรียนรู้ที่จะไม่แยกแยะ: การเรียนรู้ที่ไม่เชื่อเรื่องพระเจ้าสำหรับการปรับปรุงการรู้จำเสียงพูดแบบ monolingual และ switched arxiv [กระดาษ]
- ชาห์และคณะ (2020) การเรียนรู้ที่จะรับรู้คำพูดเปลี่ยนรหัสโดยไม่ลืมการจดจำเสียงพูดภาษาเดียว arxiv [กระดาษ]
- Winata และคณะ (2020) การเรียนรู้การถ่ายทอดเมตาสำหรับการรู้จำเสียงพูดเปลี่ยนรหัส ACL [กระดาษ] [รหัส]
- Chandu และคณะ (2020) การเปลี่ยนแปลงสไตล์เป็นจุดได้เปรียบสำหรับการสลับรหัส arxiv [กระดาษ]
- Ganji Sreeram และ Rohit Sinha (2020) การสำรวจกรอบการทำงานแบบ end-to-end สำหรับงานจดจำคำพูดเปลี่ยนรหัส: ความท้าทายและการปรับปรุง การเข้าถึง IEEE [กระดาษ]
- Winata และคณะ (2019) โมเดลภาษาสลับรหัสโดยใช้ข้อมูลสังเคราะห์ที่ใช้ระบบประสาทจากประโยคคู่ขนาน conll [กระดาษ]
- Hila Gonen และ Yoav Goldberg (2019) การสร้างแบบจำลองภาษาสำหรับการสลับรหัส: การประเมินผลการรวมข้อมูล monolingual และการฝึกอบรมการเลือกปฏิบัติ emnlp [กระดาษ]
- Lee, et al. (2019) การเพิ่มข้อมูลแบบขนานทางภาษาสำหรับการสร้างแบบจำลองภาษาสลับรหัส Interspeech [Paper]
- Victor Soto และ Julia Hirschberg (2019) ปรับปรุงประสิทธิภาพการสร้างแบบจำลองภาษาสลับรหัสโดยใช้คุณลักษณะของ Cognate Interspeech [Paper]
- Chang, et al. (2019) การสร้างประโยคสลับรหัสโดยเครือข่ายฝ่ายตรงข้ามกำเนิดและแอปพลิเคชันเพื่อเพิ่มข้อมูล Interspeech [Paper]
- Zeng, et al. (2019) ในการแก้ปัญหาแบบ end-to-end เพื่อการรู้จำเสียงพูดเปลี่ยนรหัสภาษาจีน-ภาษาอังกฤษ Interspeech [Paper]
- Taneja และคณะ (2019) การใช้ประโยชน์จาก Monolingual Speech Corpora สำหรับการรู้จำเสียงพูดที่ผสมรหัส Interspeech [Paper]
- Shan, et al. (2019) การตรวจสอบการรู้จำเสียงพูดแบบ end-to-end สำหรับการสลับรหัสภาษาจีนกลาง-อังกฤษ การประชุมนานาชาติ IEEE เรื่องอคูสติกการพูดและการประมวลผลสัญญาณ (ICASSP) [กระดาษ]
- Grandee Lee, Haizhou Li (2019) การฝังพื้นที่ทั่วไปของ Word and Class สำหรับการสร้างแบบจำลองภาษาสวิตช์รหัส การประชุมนานาชาติ IEEE เรื่องอคูสติกการพูดและการประมวลผลสัญญาณ (ICASSP) [กระดาษ]
- Hamed, et al. (2019) การสร้างแบบจำลองภาษาสลับรหัสด้วยการฝังคำสองภาษา: กรณีศึกษาสำหรับอียิปต์อาหรับ-อังกฤษ การประชุมนานาชาติเรื่องการพูดและคอมพิวเตอร์ [กระดาษ]
- Winata และคณะ (2018) เรียนรู้ที่จะเปลี่ยนรหัส: การเพิ่มข้อมูลโดยใช้กลไกการคัดลอกในการสร้างแบบจำลองภาษา arxiv [กระดาษ]
- Winata และคณะ (2018) ไปสู่การจดจำคำพูดเปลี่ยนรหัสอัตโนมัติแบบครบวงจร arxiv [กระดาษ]
- Nakayama, et al. (2018) ห่วงโซ่คำพูดสำหรับการเรียนรู้แบบกึ่งผู้ดูแลของ ASR และ TTS การสลับรหัสภาษาญี่ปุ่น-อังกฤษ การประชุมเชิงปฏิบัติการเทคโนโลยีภาษาพูดภาษา IEEE (SLT) [กระดาษ]
- Jesse Emond, Bhuwana Ramabhadran, Brian Roark, Pedro Moreno และ Min Ma (2018) แนวทางการถอดความเพื่อปรับปรุงประสิทธิภาพการรู้จำเสียงพูดสลับรหัส , การประชุมเชิงปฏิบัติการเทคโนโลยีภาษา IEEE พูด (SLT) [กระดาษ]
- Ganji Sreeram และ Rohit Sinha (2018) การใช้ประโยชน์จากส่วนหนึ่งของคำพูดเพื่อปรับปรุงการสร้างแบบจำลองข้อความของข้อมูลสลับรหัส 2018 การประชุมระดับชาติที่ยี่สิบสี่เรื่องการสื่อสาร (NCC) [กระดาษ]
- Garg, et al. (2018) โมเดลภาษาสลับรหัสโดยใช้คู่ RNN และการเตรียมการที่มาจากแหล่งเดียวกัน emnlp [กระดาษ]
- Ewald van der Westhuizen และ Thomas R. Niesler (2018) synthesized bigrams โดยใช้ Word Embeddings สำหรับ ASR สลับรหัสของคู่ภาษาแอฟริกาใต้สี่คู่ คำพูดคอมพิวเตอร์และภาษา [กระดาษ]
- Biswal และคณะ (2018) การสร้างแบบจำลองอะคูสติกเครือข่ายประสาทหลายภาษาสำหรับ ASR ของคำพูดเปลี่ยนรหัสภาษาอังกฤษ-ไอโซซูลุ Interspeech [Paper]
- Winata และคณะ (2018) การสร้างแบบจำลองภาษาสลับรหัสโดยใช้การเรียนรู้หลายงานที่รับรู้ไวยากรณ์ การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษา ACL [กระดาษ] [รหัส]
- Chandu และคณะ (2018) การสร้างแบบจำลองที่ได้รับการบอกกล่าวภาษาของข้อความสลับรหัส การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Pratapa และคณะ (2018) การสร้างแบบจำลองภาษาสำหรับการผสมโค้ด: บทบาทของข้อมูลสังเคราะห์ตามทฤษฎีทางทฤษฎี ACL [กระดาษ]
- Sivasankaran และคณะ (2018) การรวมโทรศัพท์สำหรับการจดจำคำพูดสลับรหัส การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Garg, et al. (2018) โมเดลภาษาคู่สำหรับการรู้จำเสียงสวิตช์รหัส Interspeech [Paper]
- Baheti และคณะ (2017) การออกแบบหลักสูตรสำหรับการสลับรหัส: การทดลองกับการระบุภาษาและการสร้างแบบจำลองภาษาด้วยเครือข่ายประสาทลึก ไอคอน [กระดาษ]
- Adel, et al. (2015) คุณสมบัติทางไวยากรณ์และความหมายสำหรับการเปลี่ยนรหัสแบบจำลองภาษาแฟคทอร์ การทำธุรกรรม IEEE เกี่ยวกับเสียงการพูดและการประมวลผลภาษา [กระดาษ]
- Ying Li และ Pascale Fung (2014) การสร้างแบบจำลองภาษาสลับรหัสด้วยข้อ จำกัด ด้านหัว ICASSP [กระดาษ]
- Ying Li และ Pascale Fung (2014) การสร้างแบบจำลองภาษาที่มีข้อ จำกัด ด้านหัวสำหรับการใช้งานการรู้จำเสียงพูด emnlp [กระดาษ]
- Adel, et al. (2013) การรวมกันของเครือข่ายประสาทที่เกิดขึ้นซ้ำและแบบจำลองภาษาที่เป็นแฟคทอร์สำหรับการสร้างแบบจำลองภาษาสลับรหัส ACL [กระดาษ]
- Adel, et al. (2013) การสร้างแบบจำลองภาษาเครือข่ายประสาทที่เกิดขึ้นซ้ำสำหรับการสลับคำพูดการสนทนา ICASSP [กระดาษ]
- Vu, et al. (2012) ระบบการรู้จำเสียงพูดครั้งแรกสำหรับคำพูดการสนทนาการสนทนาสวิทช์รหัสแมนดาริน-อังกฤษ ICASSP [กระดาษ]
- Ying Li และ Pascale Fung (2012) รูปแบบภาษาสวิตช์รหัสที่มีข้อ จำกัด การผกผันสำหรับการรู้จำเสียงพูดภาษาผสม coling [กระดาษ]
- Li, et al. (2011) การสร้างแบบจำลองอะคูสติกแบบไม่สมมาตรของคำพูดภาษาผสม ICASSP [กระดาษ]
วาทกรรม
- Sravani และคณะ (2021) การวิเคราะห์วาทกรรมทางการเมือง: กรณีศึกษาการผสมรหัสและการสลับรหัสในการกล่าวสุนทรพจน์ทางการเมือง การดำเนินการประชุมเชิงปฏิบัติการครั้งที่ 5 เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส (CALCs), NAACL [กระดาษ]
รุ่น
- Gupta, et al. (2020) วิธีการกึ่งผู้ดูแลเพื่อสร้างข้อความผสมรหัสโดยใช้เข้ารหัสที่ผ่านการฝึกอบรมมาก่อนและถ่ายโอนการเรียนรู้ ผลการวิจัยของ EMNLP [กระดาษ]
- Bryan Gregorius และ Takeshi Okadome (2022) สร้างข้อความสลับรหัสจากข้อความภาษาเดียวที่มีต้นไม้พึ่งพา การประชุมเชิงปฏิบัติการประจำปีครั้งที่ 20 ของสมาคมเทคโนโลยีภาษาออสเตรเลีย [กระดาษ] [รหัส]
การสังเคราะห์คำพูด
- Sai Krishna Rallabandi และ Alan W Black (2019) ความสนใจที่หลากหลายโดยใช้นักบวชที่เปล่งออกมาเพื่อสร้างรหัสคำพูดผสมโดยใช้ corpora monolingual Interspeech [Paper]
- Sai Krishna Rallabandi และ Alan W Black (2017) ในการสร้างระบบการสังเคราะห์คำพูดภาษาผสม Interspeech [Paper]
- Chandu และคณะ (2017) การสังเคราะห์คำพูดสำหรับคำแนะนำการนำทางภาษาแบบผสม Interspeech [Paper]
ตัวชี้วัด
- Guzman, et al. (2017) ตัวชี้วัดสำหรับการสร้างแบบจำลองการสลับรหัสข้าม Corpora Interspeech [Paper]
การเรียนรู้การเป็นตัวแทน
- Adilazuarda และคณะ (2023) Indorobusta: ไปสู่ความทนทานต่อภาษาท้องถิ่นที่มีรหัสผสมผสานที่หลากหลาย การดำเนินการประชุมเชิงปฏิบัติการครั้งแรกในการปรับขนาดการประเมินหลายภาษา AACL [กระดาษ] [รหัส]
- Prasad และคณะ (2021) ประสิทธิผลของการฝึกอบรมระดับกลางสำหรับการทำความเข้าใจภาษาธรรมชาติสลับรหัส การประชุมเชิงปฏิบัติการครั้งที่ 1 เกี่ยวกับการเรียนรู้การเป็นตัวแทนหลายภาษา EMNLP [PAPER]
- Winata และคณะ (2021) โมเดลหลายภาษามีประสิทธิภาพในการสลับรหัสหรือไม่? - การดำเนินการประชุมเชิงปฏิบัติการครั้งที่ 5 เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส (CALCs), NAACL [กระดาษ]
- Rizal, et al. (2020) การประเมินการฝังคำสำหรับข้อความผสมรหัสภาษาอินโดนีเซีย-ภาษาอังกฤษตามข้อมูลสังเคราะห์ การดำเนินการประชุมเชิงปฏิบัติการครั้งที่ 4 เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส (CALCs), LREC [กระดาษ]
- Winata และคณะ (2019) meta-embedings แบบลำดับชั้นสำหรับการสลับรหัสชื่อการรับรู้เอนทิตี emnlp [กระดาษ] [รหัส]
- Pratapa และคณะ (2018) การฝังคำสำหรับการประมวลผลภาษาผสมรหัส emnlp [กระดาษ]
การแปลเครื่องจักร
- Pengpun และคณะ (2024) เกี่ยวกับการสร้างการแปลเครื่องจักรสลับรหัสภาษาอังกฤษ-ไทยในโดเมนการแพทย์ emnlp [กระดาษ]
- Gaser, et al. (2023) การสำรวจวิธีการแบ่งส่วนสำหรับการแปลเครื่องประสาทของข้อความภาษาอียิปต์-ภาษาอังกฤษ-ภาษาอังกฤษสลับ EACL [กระดาษ]
- Kuwanto และคณะ (2021) หลักสูตรการฝึกอบรมการแปลเครื่องจักรที่มีทรัพยากรต่ำเหมาะสมสำหรับภาษาที่มีทรัพยากรต่ำ arxiv [กระดาษ]
- Vivek Srivastava และ Mayank Singh (2020) PHINC: คลังข้อมูลโซเชียลมีเดียแบบผสมผสานแบบคู่ขนานสำหรับการแปลด้วยเครื่อง w-nut, emnlp [กระดาษ] [ชุดข้อมูล]
- Thoudam Doren Singh และ Thamar Solorio (2017) ไปสู่การแปลความคิดเห็นแบบผสมผสานจากโซเชียลมีเดีย cicling [กระดาษ]
การแปลคำพูด
- Alastruey, et al. (2023) สู่การแปลคำพูดสตรีมมิ่งในโลกแห่งความเป็นจริงสำหรับคำพูดสลับรหัส calcs, emnlp [กระดาษ]
ความเข้าใจภาษาธรรมชาติ
- Krishnan และคณะ (2021) การสลับรหัสหลายภาษาสำหรับการทำนายความตั้งใจข้ามภาษาแบบไม่ใช้ภาษาและการเติมสล็อต mrl, emnlp [กระดาษ]
การจดจำเอนทิตีชื่อ
- Priyadharshini และคณะ (2020) การรับรู้เอนทิตีสำหรับคลังข้อมูลอินเดียผสมรหัสโดยใช้การฝังเมตา การประชุมนานาชาติครั้งที่ 6 เกี่ยวกับระบบคอมพิวเตอร์และการสื่อสารขั้นสูง (ICACCS) [กระดาษ]
- Winata และคณะ (2019) การเรียนรู้ meta-embedings หลายภาษาสำหรับการสลับรหัสชื่อการรับรู้เอนทิตี repl4nlp, acl [กระดาษ] [รหัส]
- Aguilar, et al. (2018) การรับรู้เอนทิตีที่มีชื่อว่าข้อมูลสลับรหัส: ภาพรวมของงาน CALL 2018 ที่ใช้ร่วมกัน การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- วังและคณะ (2018) การเปลี่ยนรหัสชื่อการรับรู้เอนทิตีด้วยการฝังความสนใจ การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Winata และคณะ (2018) การเป็นตัวแทนอักขระสองภาษาสำหรับการจัดการกับคำที่ไม่ได้ใช้คำพูดในการเปลี่ยนรหัสชื่อการจดจำเอนทิตี การประชุมเชิงปฏิบัติการครั้งที่ 3 ของแนวทางการคำนวณเพื่อการสลับรหัสภาษาศาสตร์, ACL [กระดาษ]
- Aguilar, et al. (2017) วิธีการหลายงานสำหรับการรับรู้เอนทิตีที่มีชื่อในข้อมูลโซเชียลมีเดีย การประชุมเชิงปฏิบัติการครั้งที่ 3 เกี่ยวกับข้อความที่ผู้ใช้สร้างขึ้นที่มีเสียงดัง EMNLP [กระดาษ]
ภาษาศาสตร์
- Li Nyuyen (2018) การยืมหรือสลับรหัส? ร่องรอยของบรรทัดฐานชุมชนในการพูดภาษาเวียดนาม-อังกฤษ วารสารภาษาศาสตร์ออสเตรเลีย 38.4 (2018): 443-466 [กระดาษ]
- Fairchild, Sarah และ Janet G. Van Hell (2017) การเปลี่ยนรหัสคำนามคำนามคำนามในลำโพงมรดกสเปน การใช้สองภาษา: ภาษาและความรู้ความเข้าใจ 20.1 (2017): 150-161 [กระดาษ]
- Bhatt, Rakesh M. , และ Agnes Bolonyai (2011) การสลับรหัสและไวยากรณ์ที่ดีที่สุดของการใช้ภาษาสองภาษา การใช้สองภาษา: ภาษาและความรู้ความเข้าใจ 14.4 (2011): 522-546 [กระดาษ]
- Lipski (2005) การสลับรหัสหรือการยืม? ไม่มีséดังนั้นไม่มี puedo decir คุณรู้ไหม การประชุมเชิงปฏิบัติการครั้งที่สองเกี่ยวกับภาษาศาสตร์ภาษาสเปน [กระดาษ]
- Roberto R. Heredia และ Jeanette Altarriba (2001) การผสมภาษาสองภาษา: ทำไมการสลับรหัสสองภาษา? Sage Publications [Paper]
- Belazi และคณะ (1994) การสลับรหัสและทฤษฎี X-Bar: ข้อ จำกัด ด้านหัวการทำงาน การสอบถามภาษาศาสตร์ฉบับที่ 25 No.2 Spring [Paper]
- Shana Poplack (1980) บางครั้งฉันจะเริ่มประโยคในภาษาสเปน y termino en espanol: ไปสู่ประเภทของการสลับรหัส 1 ภาษาศาสตร์ 18 (7-8) [กระดาษ]
- Pfaff, Carol W. (1979) ข้อ จำกัด เกี่ยวกับการผสมภาษา: การสลับรหัสและการยืมในภาษาสเปน/อังกฤษ ภาษา: 291-318 [กระดาษ]
- Shana Poplack (1978) โครงสร้างวากยสัมพันธ์และฟังก์ชั่นทางสังคมของการสลับรหัส ฉบับ 2. Centro de Estudios Puertorriqueños, City University of New York [Paper]
- Gumperz, JJ, & Hernandez, E. (1969) แง่มุมทางปัญญาของการสื่อสารสองภาษา สถาบันการศึกษานานาชาติมหาวิทยาลัยแคลิฟอร์เนีย [กระดาษ]
การคำนวณทางอารมณ์
- Chakravarthi และคณะ (2021) DravidianCodemix: การวิเคราะห์ความเชื่อมั่นและชุดข้อมูลการระบุภาษาที่ไม่เหมาะสมสำหรับภาษา Dravidian ในข้อความผสมรหัส arxiv [กระดาษ] [รหัสและชุดข้อมูล]
- Siddharth Yadav (2020) การวิเคราะห์ความเชื่อมั่นที่ไม่ได้รับการดูแลสำหรับข้อมูลผสมรหัส arxiv [กระดาษ] [รหัส]
- วังและคณะ (2017) การวิเคราะห์อารมณ์ในข้อความสลับรหัสด้วยโมเดลกราฟปัจจัยร่วม ธุรกรรม IEEE/ACM เกี่ยวกับเสียงการพูดและการประมวลผลภาษา [กระดาษ]
- วังและคณะ (2016) เครือข่ายความสนใจสองภาษาสำหรับการทำนายอารมณ์สลับรหัส coling [กระดาษ]
- Sophia Lee และ Zhongqing Wang (2015) อารมณ์ในข้อความสลับรหัส: การก่อสร้างและการวิเคราะห์คลังข้อมูล การประชุมเชิงปฏิบัติการ Sighan ครั้งที่แปดเกี่ยวกับการประมวลผลภาษาจีน [กระดาษ]
- วังและคณะ (2015) การตรวจจับอารมณ์ในข้อความสลับรหัสผ่านข้อมูลสองภาษาและข้อมูลทางอารมณ์ ACL [กระดาษ]
บทสนทนาและระบบการสนทนา
- Gupta, et al. (2018) การเปิดเผยความท้าทายที่ผสมโค้ด: กรอบสำหรับการสร้างคำถามที่ขับเคลื่อนด้วยภาษาและการตอบคำถามด้วยระบบประสาท conll [กระดาษ]
วาทกรรม
- Sravani และคณะ (2021) การวิเคราะห์วาทกรรมทางการเมือง: กรณีศึกษาการผสมรหัสและการสลับรหัสในการกล่าวสุนทรพจน์ทางการเมือง CALL การดำเนินการประชุมเชิงปฏิบัติการครั้งที่ 5 เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส (CALCs), NAACL [กระดาษ]
ไวยากรณ์
- Kodali และคณะ (2022) Symcom-การวัดวากยสัมพันธ์ของรหัสผสมการศึกษาการผสมโค้ดภาษาอังกฤษ-ฮินดี ผลการวิจัยของ ACL [กระดาษ]
- Özlemçetinogluและçagrıçöltekin (2019) ความท้าทายในการใส่คำอธิบายประกอบการสลับรหัส Treebank SyntaxFest [Paper]
การโจมตีของฝ่ายตรงข้าม
- Samson Tan และ Shafiq Joty (2021) การผสมโค้ดบน Sesame Street: รุ่งอรุณของ Pollothots ฝ่ายตรงข้าม naacl [กระดาษ]
ภาษาศาสตร์สังคม
- Bolock, et al. (2020) ใครเมื่อใดและทำไม: 3 Ws ของการสลับรหัส การประชุมนานาชาติเกี่ยวกับการใช้งานจริงของตัวแทนและระบบหลายตัวแทน [กระดาษ]
- Yoder, et al. (2017) การสลับรหัสเป็นการกระทำทางสังคม: กรณีของหน้าคุยภาษาอาหรับวิกิพีเดีย การดำเนินการประชุมเชิงปฏิบัติการครั้งที่สองเกี่ยวกับการประมวลผลภาษาธรรมชาติและสังคมศาสตร์การคำนวณ ACL [Paper]
- Agrawal, et al. (2017) Agarwal, Prabhat, et al. ฉันอาจพูดเป็นภาษาอังกฤษ แต่ Gaali Toh Hindi Mein Hi Denge: การศึกษาการสลับรหัสภาษาอังกฤษ-ฮินดิและรูปแบบการสบถบนเครือข่ายสังคมออนไลน์ การประชุมนานาชาติเกี่ยวกับระบบการสื่อสารและเครือข่าย (COMSNETS) [กระดาษ]
เกณฑ์มาตรฐาน
- Khanuja และคณะ (2020) GLUECOS: มาตรฐานการประเมินผลสำหรับ NLP สลับรหัส ACL [กระดาษ]
- Aguilar, et al. (2020) Lince: เกณฑ์มาตรฐานส่วนกลางสำหรับการประเมินการสลับรหัสภาษาศาสตร์ LREC [กระดาษ]
โซเชียลมีเดีย
- บาหลีและคณะ (2014) “ ฉันยืมการผสมของคุณ?” การวิเคราะห์การผสมรหัสภาษาอังกฤษ-ฮินดีใน Facebook การดำเนินการประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส [กระดาษ]
การทำให้เป็นมาตรฐาน
- Dwija Parikh และ Thamar Solorio (2021) การทำให้เป็นมาตรฐานและการแปลย้อนกลับสำหรับข้อมูลการสลับรหัส CALL การดำเนินการประชุมเชิงปฏิบัติการครั้งที่ 5 เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส (CALCs), NAACL [กระดาษ]
ชุดเครื่องมือ
ชุดเครื่องมือสร้างข้อมูลสังเคราะห์
- Jayanthi และคณะ (2021) CodemixedNLP: ชุดเครื่องมือ NLP ที่ขยายได้และเปิดสำหรับการผสมโค้ด CALL การดำเนินการประชุมเชิงปฏิบัติการครั้งที่ 5 เกี่ยวกับวิธีการคำนวณเพื่อการสลับรหัส (CALCs), NAACL [กระดาษ] [รหัส]
- Rizvi และคณะ (2021) GCM: ชุดเครื่องมือสำหรับการสร้างข้อความผสมรหัสสังเคราะห์ EACL (การสาธิตระบบ) [กระดาษ] [รหัส]
ชุดเครื่องมือคำอธิบายประกอบ
- ชาห์และคณะ (2019) COSSAT: เครื่องมือคำอธิบายประกอบคำพูดเปลี่ยนรหัส การดำเนินการประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับการรวมและวิเคราะห์คำอธิบายประกอบ crowdsourced สำหรับ NLP [กระดาษ]
การสรุป
- Mehnaz และคณะ (2021) Gapshup: สรุปการสนทนาที่สลับรหัสแบบเปิดโดเมน emnlp
ตอบคำถาม
- Gupta, et al. (2020) เฟรมเวิร์กแบบครบวงจรสำหรับการตอบคำถามด้วยภาพหลายภาษาและการผสมรหัส aacl-ijcnlp [tba]
บทสนทนาและระบบการสนทนา
- Bawa และคณะ (2020) ผู้ใช้หลายภาษาชอบแชทบ็อตที่ผสมรหัสหรือไม่? ลองตะโกนและค้นหา! - ACM เกี่ยวกับปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ [กระดาษ]
- Banerjee และคณะ (2018) ชุดข้อมูลสำหรับการสร้างระบบการสนทนาที่มุ่งเน้นเป้าหมายรหัส coling [กระดาษ]
วางกระดาษ
- เหงียนและคณะ (2022) การสร้างเทคโนโลยีการศึกษาสำหรับการสลับรหัส: การปฏิบัติในปัจจุบันความยากลำบากและทิศทางในอนาคต ภาษา [กระดาษ]
หนังสือ
- Caciullos และ Travis (2018) การใช้สองภาษาในชุมชน สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์
วิทยานิพนธ์
- Genta Indra Winata (2021) การถ่ายโอนหลายภาษาการเรียนรู้การเรียนรู้หลายภาษาสำหรับภาษาสลับรหัสและการสร้างแบบจำลองระบบประสาท [วิทยานิพนธ์]
- Gustavo Aguilar (2020) การติดฉลากลำดับระบบประสาทบนข้อความโซเชียลมีเดีย [วิทยานิพนธ์]
- Victor Soto Martinez (2020) ระบุและสร้างแบบจำลองภาษาสลับรหัส [วิทยานิพนธ์]