코드 전환 연구 리소스
이것은 코드 전환 연구에 대한 계산 언어 접근법에 대한 튜토리얼, 워크샵, 논문 및 리소스 목록입니다. 목록은 시간이 지남에 따라 업데이트됩니다. 목록 업데이트를위한 풀 요청을 보내고 기고자 중 하나가 될 수 있습니다!
? 나는 코드 전환에 관한 논문과 책을 수집하고 여기에 나열 할 계획이다. 당신이 하나가 있다면, 주저하지 말고 나에게 연락하거나 풀 요청을 만드십시오!
목차
- 하이라이트
- ? 워크샵
- ? 연구 논문
- 설문 조사 논문
- 큰 언어 모델
- 언어 식별 및 POS 태깅
- 신체
- 언어 모델링 및 음성 인식
- 담화
- 세대
- 음성 합성
- 메트릭
- 표현 학습
- 기계 번역
- 연설 번역
- 자연어 이해
- 지명 된 엔티티 인식
- 언어학
- 정서적 컴퓨팅
- 대화 및 대화 시스템
- 담화
- 통사론
- 대적 공격
- 사회 언어학
- 기준
- 소셜 미디어
- 텍스트 정규화
- 툴킷
- 서적
- 논문
하이라이트
- 우리는 NAACL 2025에서 코드 전환 워크숍을 조직 할 것입니다! 우리는 곧 웹 사이트를 업데이트 할 것입니다! [웹 사이트]
- 코드 전환 또는 새로운 연구 방향을 찾고 있다면 코드 전환에 관한 포괄적 인 설문 조사 논문을 작성했습니다. NLP의 코드 전환 연구에 대한 수십 년 진행 : 트렌드 및 과제에 대한 체계적인 설문 조사 [논문]. 제안이 있으면 자유롭게 읽고 알려주십시오! Alham Fikri Aji, Zheng-Xin Yong 및 Thamar Solorio 덕분에 이것을 가능하게 해주십니까?
- EMNLP 2023에서 코드 전환 워크숍을 조직했습니다! [웹 사이트]
- 우리 (I, Marina Zhukova 및 Sudipta Kar)는 Abu Dhabi의 EMNLP 2022에서 피더의 조류 세션을 조직했습니다. 우리는 약 30 명이 가입합니다 (직접 및 온라인). 와 주셔서 감사합니다!
- ? EMNLP 2019에는 Microsoft Research (Monojit Choudhury, Kalika Bali, Anirudh Srinivasan 및 Sandipan Dandapat)의 코드 혼합에 대한 포괄적 인 자습서가있었습니다. 다음 링크를 확인할 수 있습니다.
? 워크샵
이것은 코드 스위치 워크숍 시리즈의 목록입니다.
- Code-Switching에 대한 계산 접근 방식에 대한 첫 번째 워크숍, EMNLP 2014 [웹 사이트]
- Code-Switching에 대한 계산 접근법에 대한 두 번째 워크숍, EMNLP 2016
- 언어 코드 전환에 대한 계산 접근법에 대한 세 번째 워크숍, ACL 2018 [웹 사이트]
- 언어 코드 전환에 대한 계산 접근법에 대한 네 번째 워크숍, LREC 2020 [웹 사이트]
- 다국어 커뮤니티에서 코드 전환을위한 언어 기술에 관한 첫 번째 워크숍, Interspeech 2020 [웹 사이트]
- 언어 코드 전환에 대한 계산 접근법에 대한 다섯 번째 워크숍, NAACL 2021 [웹 사이트]
- 언어 코드 전환에 대한 계산 접근법에 대한 여섯 번째 워크숍, EMNLP 2023 [웹 사이트]
- 언어 코드 전환에 대한 계산 접근법에 대한 제 7 워크숍, NAACL 2025 [웹 사이트 (곧 개장 할 예정)]
? 연구 논문
설문 조사 논문
- Winata, et al. (2023) NLP의 코드 전환 연구에 대한 수십 년의 진보 : 트렌드와 도전에 대한 체계적인 조사 . ACL 발견 [종이]
- Doğruöz 등 (2021) 코드 전환에 대한 조사 : 언어 기술에 대한 언어 및 사회적 관점 . ACL [종이]
- Jose, et al. (2020) 코드 전환 연구를위한 현재 데이터 세트 조사 . 고급 컴퓨팅 및 통신 시스템에 관한 국제 회의 (ICACC) [논문]
- Sitaram, et al. (2019) 코드 전환 음성 및 언어 처리 설문 조사 . Arxiv [종이]
큰 언어 모델
- Winata, et al. (2024) 광부 : 시맨틱 리트리버로서 다국어 언어 모델 . EMNLP 결과 [논문] [코드]
- 유, et al. (2024) 코드 스위치 레드 팀 밍 : 안전 및 다국어 이해를위한 LLM 평가 . Arxiv [종이]
- Leon, et al., (2024) 코드 혼합 프로브는 미리 훈련 된 모델이 코드 전환 텍스트에서 일반화하는 방법을 보여줍니다 . LREC [종이] [코드]
- Huzaifah, et al. (2024) 큰 언어 모델로 코드 전환 번역 평가 . lrec-coling [종이]
- Yong, et al. (2023) 코드 혼합 텍스트 : 동남아시아 언어의 사례를 생성하기 위해 대형 언어 모델을 제기합니다 . calcs, emnlp [종이]
언어 식별 및 POS 태깅
- Burchell, et al. (2024) 코드 전환 언어 식별은 생각보다 어렵습니다 . EACL [종이]
- Igor Sterner와 Simone Teufel (2023) Tongueswitcher : 독일-영어 코드 전환의 세밀한 식별 . calcs, emnlp [종이]
- Ostapenko, et al. (2022) 스피커 정보는 코드 전환 예측에 대한 사례 연구 : 더 나은 유도 편향을위한 모델을 안내 할 수 있습니다. ACL [종이]
- Nguyen 등. (2021) 코드 전환 힌디어 소셜 미디어 텍스트의 자동 언어 식별 . 열린 인문학 저널 [논문]
- Tarunesh, et al. (2021) 기계 번역에서 코드 전환까지 : 고품질 코드 전환 텍스트 생성 . ACL [종이]
- Gustavo Aguilar와 Thamar Solorio. (2020) 영어에서 코드 전환 : 강한 형태 학적 단서로 전송 학습 . ACL [종이] [코드]
- Mager, et al. (2019) 단어 내 코드 전환에 대한 서브 워드 레벨 언어 식별 . NaaCl [종이]
- Zhang, et al. (2018) Codemixed 텍스트의 언어 식별을위한 빠르고 작고 정확한 모델 . emnlp [종이]
- Kelsey Ball과 Dan Garrette. (2018) 명시 적 언어 식별없이 코드 전환, 음역 텍스트에 대한 부품 태그 . emnlp [종이]
- Zeynep Yirmibesoglu 및 Gulsen Eryigit. (2018) 터키-영어 언어 쌍 사이의 코드 전환 감지 . 워크숍 W-Nut, EMNLP [종이]
- Mavem, et al. (2018) 코드 전환 소셜 미디어 텍스트의 언어 식별 및 분석 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Victor Soto와 Julia Hirschberg. (2018) 코드 전환 데이터에 대한 공동 부품 및 언어 ID 태그 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Bullock, et al. (2018) 코드 전환에서 매트릭스 언어의 존재를 예측합니다 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Soto, et al. (2018) 코드 전환에서 동족 단어, POS 태그 및 연락의 역할 . interspeech [종이]
- Barman, et al. (2016) 코드 혼합 소셜 미디어 컨텐츠의 부품 태그 : 파이프 라인, 스태킹 및 공동 모델링 . Code-Switching, ACL에 대한 계산 접근법에 대한 두 번째 워크숍 [논문]
- Vyas, et al. (2014) English-Hindi 코드 혼합 소셜 미디어 컨텐츠의 POS 태깅 . emnlp [종이]
- Heba Elfardy와 Mona Diab. (2012) 언어 코드 전환의 토큰 레벨 식별 . 콜링 [종이]
- Thamar Solorio와 Yang Liu. (2008) 코드 전환점을 예측하는 법을 배우는 학습 . emnlp [종이]
- Dau-Cheng Lyu와 Ren-Yuan Lyu. (2008) 여러 신호를 사용한 코드 전환 발화에 대한 언어 식별 . interspeech [종이]
신체
- Kuwanto, et al. (2024) 언어학 이론은 LLM을 충족시킨다 . arxiv [종이] [코드] [데이터 세트]
- Ruochen Zhang and Carsten Eickhoff (2024) Crocosum : 교차 코드 전환 요약을위한 벤치 마크 데이터 세트 . LREC [종이] [데이터 세트]
- Whitehouse, et al. (2022) ENTITYCS : 엔티티 중심 코드 스위칭을 통한 제로 샷 교차 전송 개선 . emnlp [종이] [코드]
- Lovenia, et al. (2022) Ascend : 다중 회전 대화에서 코드 전환을위한 자발적인 중국어 영어 데이터 세트 . LREC [종이] [데이터 세트]
- Nguyen 등. (2020) 캔버라-캔버라 베트남-영어 코드 전환 자연 스피치 코퍼스 . LREC [종이]
- Umapathy, et al. (2020) 볼리우드 영화의 코드 전환 대화에 대한 자연 언어 추론 모델링 기술 조사 . 다국어 커뮤니티에서 코드 전환을위한 언어 기술에 관한 첫 번째 워크숍, Interspeech 2020 [데이터 세트]
- Xiang, et al. (2020) Sina Mandarin 알파벳 단어 : 웹 중심 코드 혼합 어휘 자원 . AACL-IJCNLP [TBC]
- Chakravarthi, et al. (2020) 코드 혼합 타밀어 영어 텍스트에서 감정 분석을위한 코퍼스 생성 . 자원 부족 언어를위한 음성 언어 기술) 및 CCURL (부족한 언어에 대한 협업 및 컴퓨팅 워크숍, LREC [논문]
- Khanuja, et al. (2020) 코드 혼합 대화에서 자연어 추론을위한 새로운 데이터 세트 . 언어 코드 전환에 대한 컴퓨터 접근법 4 번째 워크숍, LREC [논문]
- Barik, et al. (2019) 인도네시아-영어 코드 혼합 트위터 데이터의 정규화 . w-nut, emnlp [종이] [데이터 세트]
- Singh, et al. (2018) 힌디 영어 코드 혼합 POS 태깅을위한 트위터 코퍼스 . 소셜 미디어를위한 자연 언어 처리에 관한 6 차 국제 워크숍, ACL [논문]
- Li, et al. (2012) 만다린-영어 코드 전환 코퍼스 . LREC [종이]
- Lyu, et al. (2010) Seame : 동남아시아의 만다린-영어 코드 전환 연설 코퍼스 . interspeech [종이]
- Lyu, et al. (2010) 만다린-영어 코드 전환 연설 코퍼스 : Seame의 분석 . 나이 [종이]
언어 모델링 및 음성 인식
- Yu, et al. (2023) 만다린-영어 ASR의 코드 전환 텍스트 생성 및 주입 . ICASSP [종이]
- Tolúlopé, et al. (2023) 다국어 자체 감독 연설 표현은 코드 스웨인을 사용하여 저주적 아프리카 언어의 음성 인식을 향상시킵니다 . 언어 코드 전환에 대한 계산 접근법에 대한 여섯 번째 워크숍. [종이]
- Kumar, et al. (2020) 코드 스위치 데이터의 기계 학습 기반 언어 모델링 . 전자 및 지속 가능한 통신 시스템에 관한 국제 회의 (ICESC) [논문]
- Madhumani 등. (2020) 차별하지 않는 학습 : 단일 언어 및 코드 전환 음성 인식을 향상시키기위한 작업 불가지론 학습 . Arxiv [종이]
- Shah, et al. (2020) 단일 언어 음성 인식을 잊지 않고 코드 전환 연설을 인식하는 법을 배우는 것 . Arxiv [종이]
- Winata, et al. (2020) 코드 전환 음성 인식에 대한 메타 전환 학습 . ACL [종이] [코드]
- 찬두 등 (2020) 코드 전환의 유리한 지점으로서의 스타일 변동 . Arxiv [종이]
- Ganji Sreeram과 Rohit Sinha (2020) 코드 전환 음성 인식 작업을위한 엔드 투 엔드 프레임 워크 탐색 : 도전 및 향상 . IEEE 액세스 [종이]
- Winata, et al. (2019) 병렬 문장의 신경 기반 합성 데이터를 사용한 코드 전환 언어 모델 . conll [종이]
- Hila Gonen and Yoav Goldberg (2019) 코드 전환을위한 언어 모델링 : 평가, 단일 언어 데이터의 통합 및 차별 교육 . emnlp [종이]
- Lee, et al. (2019) 코드 스위치 언어 모델링에 대한 언어 적으로 동기 부여 병렬 데이터 확대 . interspeech [종이]
- Victor Soto와 Julia Hirschberg (2019) Cognate 기능을 사용하여 코드 전환 언어 모델링 성능 향상 . interspeech [종이]
- Chang, et al. (2019) 생성 적대성 네트워크에 의한 코드 전환 문장 생성 및 데이터 확대에 대한 적용 . interspeech [종이]
- Zeng, et al. (2019) 는 만다린-영어 코드 전환 음성 인식에 대한 엔드 투 엔드 솔루션 . interspeech [종이]
- Taneja, et al. (2019) 코드 혼합 음성 인식을위한 단일 언어 스피치 코퍼라 악용 . interspeech [종이]
- Shan, et al. (2019) 만다린-영어 코드 전환에 대한 엔드 투 엔드 음성 인식 조사 . 음향, 연설 및 신호 처리에 관한 IEEE 국제 회의 (ICASSP) [논문]
- Grandee Lee, Haizhou Li. (2019) 코드 스위치 언어 모델링을위한 Word 및 Class Common Space Embedding . 음향, 연설 및 신호 처리에 관한 IEEE 국제 회의 (ICASSP) [논문]
- Hamed, et al. (2019) 이중 언어 단어 임베딩을 사용한 코드 전환 언어 모델링 : 이집트 아랍어-영어를위한 사례 연구 . 연설 및 컴퓨터에 관한 국제 회의 [종이]
- Winata, et al. (2018)은 언어 모델링에 대한 사본 메커니즘을 사용하여 코드 스위치 : 데이터 확대에 대해 배우십시오 . Arxiv [종이]
- Winata, et al. (2018) 엔드 투 엔드 자동 코드 전환 음성 인식을 향해 . Arxiv [종이]
- 나카야마 등. (2018) 일본-영어 코드 전환 ASR 및 TTS에 대한 반 감독 학습을위한 언어 체인 . IEEE Spoken Language Technology Workshop (SLT) [논문]
- Jesse Emond, Bhuwana Ramabhadran, Brian Roark, Pedro Moreno 및 Min Ma. (2018) 코드 전환 음성 인식 성능을 향상시키기위한 음역 기반 접근법 , IEEE Spoken Language Technology Workshop (SLT) [논문]
- 간지 Sreeram과 Rohit Sinha. (2018) 코드 전환 데이터의 개선 된 텍스트 모델링을위한 말하기 부품 악용 . 2018 커뮤니케이션에 관한 4 번째 전국 회의 (NCC) [논문]
- Garg, et al. (2018) 듀얼 RNN 및 동일한 소스 사전 계산을 사용한 코드 전환 언어 모델 . emnlp [종이]
- Ewald van der Westhuizen과 Thomas R. Niesler. (2018) 4 개의 남아프리카 언어 쌍의 코드 전환 ASR에 대한 단어 임베딩을 사용하여 Bigrams를 합성했습니다 . 컴퓨터 연설 및 언어 [종이]
- Biswal, et al. (2018) 자원이 부족한 영어-지연 코 코드 전환 연설의 ASR에 대한 다국어 신경망 음향 모델링 . interspeech [종이]
- Winata, et al. (2018) 구문 인식 멀티 태스킹 학습을 사용한 코드 전환 언어 모델링 . 언어 코드 전환에 대한 계산 접근 방식의 세 번째 워크숍, ACL [논문] [코드]
- 찬두 등 (2018) 코드 전환 텍스트의 언어 정보 모델링 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Pratapa, et al. (2018) 코드 혼합에 대한 언어 모델링 : 언어 이론 기반 합성 데이터의 역할 . ACL [종이]
- Sivasankaran, et al. (2018) 코드 전환 음성 인식에 대한 전화 통합 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Garg, et al. (2018) 코드 전환 음성 인식에 대한 이중 언어 모델 . interspeech [종이]
- Baheti, et al. (2017) 코드 전환을위한 커리큘럼 설계 : 깊은 신경망을 통한 언어 식별 및 언어 모델링 실험 . 아이콘 [종이]
- Adel, et al. (2015) 코드 전환 인식 언어 모델을위한 구문 및 의미 론적 기능 . 오디오, 음성 및 언어 처리에 대한 IEEE 거래 [논문]
- Ying Li와 Pascale Fung. (2014) 기능적 헤드 제약 조건을 갖춘 코드 스위치 언어 모델링 . ICASSP [종이]
- Ying Li와 Pascale Fung. (2014) 코드 전환 음성 인식을위한 기능적 헤드 제약 조건을 갖춘 언어 모델링 . emnlp [종이]
- Adel, et al. (2013) 코드 전환 언어 모델링을위한 재발 신경 네트워크와 사실적인 언어 모델의 조합 . ACL [종이]
- Adel, et al. (2013) 코드 전환 대화 연설을위한 반복 신경 네트워크 언어 모델링 . ICASSP [종이]
- vu, et al. (2012) 만다린-영어 코드 스위치 대화 연설에 대한 첫 번째 음성 인식 시스템 . ICASSP [종이]
- Ying Li와 Pascale Fung. (2012) 혼합 언어 음성 인식을위한 역전 제약을 가진 코드 스위치 언어 모델 . 콜링 [종이]
- Li, et al. (2011) 혼합 언어 음성의 비대칭 음향 모델링 . ICASSP [종이]
담화
- Sravani 등. (2021) 정치 담론 분석 : 정치 연설에서 코드 혼합 및 코드 전환에 대한 사례 연구 . 코드 스위칭에 대한 계산 접근법 (CALC), NAACL [논문]에 관한 제 5 차 워크숍의 절차
세대
- Gupta, et al. (2020) 사전 훈련 된 인코더 및 전송 학습을 사용하여 코드 혼합 텍스트를 생성하기위한 반 감독 접근법 . EMNLP의 발견 [종이]
- Bryan Gregorius와 Takeshi Okadome (2022) 의존성 트리가있는 단일 텍스트에서 코드 전환 텍스트를 생성합니다 . 오스트레일리아 언어 기술 협회의 제 20 회 연례 워크숍 [논문] [코드]
음성 합성
- Sai Krishna Rallabandi와 Alan W Black (2019) 단일 corpora를 사용하여 코드 혼합 음성을 생성하기위한 관절 사전을 사용한 변동주의 . interspeech [종이]
- Sai Krishna Rallabandi와 Alan W Black (2017)은 혼합 설측 음성 합성 시스템을 구축합니다. interspeech [종이]
- 찬두 등 (2017) 혼합 내비게이션 지침에 대한 음성 합성. interspeech [종이]
메트릭
- Guzman, et al. (2017) Corpora의 코드 전환 모델링을위한 메트릭 . interspeech [종이]
표현 학습
- Adilazuarda, et al. (2023) Indorobusta : 다양한 코드 혼합 인도네시아 현지 언어에 대한 견고성을 향해 . 다국어 평가 확장에 관한 첫 번째 워크숍의 절차, AACL [논문] [코드]
- Prasad, et al. (2021) 코드 전환 자연어 이해를위한 중간 작업 교육의 효과 . 다국어 대표 학습에 관한 제 1 차 워크숍의 절차, EMNLP [논문]
- Winata, et al. (2021) 다국어 모델이 코드 전환에 효과적입니까? . 코드 스위칭에 대한 계산 접근법 (CALC), NAACL [논문]에 관한 제 5 차 워크숍의 절차
- Rizal, et al. (2020) 합성 데이터를 기반으로 인도네시아-영어 코드 혼합 텍스트에 대한 단어 임베딩 평가 . 코드 스위칭에 대한 계산 접근법 (Calcs), LREC [논문]에 관한 제 4 차 워크숍의 절차
- Winata, et al. (2019) 코드 전환을위한 계층 적 메타-엠 베드 딩이라는 이름의 엔티티 인식 . emnlp [종이] [코드]
- Pratapa, et al. (2018) 코드 혼합 언어 처리를위한 단어 임베딩 . emnlp [종이]
기계 번역
- Pengpun, et al. (2024) 의료 도메인에서 영어-타이 코드 스위치 기계 번역을 작성합니다. emnlp [종이]
- Gaser, et al. (2023) 코드 전환 이집트 아랍어-영어 텍스트의 신경 기계 번역을위한 세분화 접근법 탐색 . EACL [종이]
- Kuwanto, et al. (2021) 저주적 기계 번역 교육 커리큘럼은 저수고 언어에 적합합니다 . Arxiv [종이]
- Vivek Srivastava와 Mayank Singh (2020) Phinc : 기계 번역을위한 병렬 hinglish 소셜 미디어 코드 혼합 코퍼스 . w-nut, emnlp [종이] [데이터 세트]
- Thoudam Doren Singh와 Thamar Solorio. (2017) 소셜 미디어의 혼합 코드 댓글을 번역하는 것 . 시클링 [종이]
연설 번역
- Alastruey 등. (2023) 코드 전환 연설에 대한 실제 스트리밍 연설 번역 . calcs, emnlp [종이]
자연어 이해
- Krishnan, et al. (2021) 제로 샷 교차 의도 예측 및 슬롯 충전에 대한 다국어 코드 전환 . MRL, emnlp [종이]
지명 된 엔티티 인식
- Priyadharshini, et al. (2020) Meta Embedding을 사용하여 코드 혼합 인디언 코퍼스에 대한 엔티티 인식을 지명했습니다 . 고급 컴퓨팅 및 통신 시스템에 관한 제 6 차 국제 회의 (ICACC) [논문]
- Winata, et al. (2019) 코드 전환을위한 다국어 메타-엠 베딩 학습은 엔티티 인식이라는 이름이 지정됩니다 . Repl4nlp, ACL [종이] [코드]
- Aguilar, et al. (2018) 은 코드 전환 데이터에 대한 엔티티 인식을 지명했습니다. CALCS 2018 공유 작업의 개요 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Wang, et al. (2018) 코드 스위치 지명 된 엔티티 인식을 임베드 된주의를 기울였습니다 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Winata, et al. (2018) 코드 전환에서 기본적으로 명시되지 않는 단어를 효율적으로 해결하기위한 이중 언어 문자 표현 . 언어 코드 전환에 대한 전산적 접근 방식의 제 3 차 워크숍, ACL [논문]
- Aguilar, et al. (2017) 소셜 미디어 데이터에서 명명 된 엔티티 인식을위한 멀티 태스킹 접근법 . 시끄러운 사용자 제작 텍스트에 대한 세 번째 워크숍, EMNLP [종이]
언어학
- Li Nyuyen. (2018) 차용 또는 코드 전환? 베트남-영어 연설에서 공동체 규범의 흔적. 호주 언어학 저널 38.4 (2018) : 443-466. [종이]
- Fairchild, Sarah 및 Janet G. Van Hell. (2017) 스페인 문화 유산 스피커의 결정자 명사 코드 전환. 이중 언어 : 언어와 인식 20.1 (2017) : 150-161. [종이]
- Bhatt, Rakesh M. 및 Agnes Bolonyai. (2011) 코드 전환 및 이중 언어 언어 사용의 최적 문법. 이중 언어 : 언어와 인식 14.4 (2011) : 522-546. [종이]
- Lipski (2005) 코드 전환 또는 차용? Sé는 없으므로 Puedo Decir가 없습니다. 스페인 사회 언어학에 관한 두 번째 워크숍 [논문]
- Roberto R. Heredia와 Jeanette Altarriba (2001) 이중 언어 믹싱 : 이중 언어가 왜 코드 스위치를합니까? 세이지 간행물 [종이]
- Belazi, et al. (1994) 코드 스위칭 및 X- 바 이론 : 기능적 헤드 제약 조건 . 언어 조사 Vol 25 No.2 Spring [종이]
- Shana Poplack (1980) 때때로 스페인어 y termino en espanol : 코드 스위치의 유형을 향해 문장을 시작할 것입니다 . 언어학 18 (7-8) [종이]
- Pfaff, Carol W. (1979) 언어 믹싱에 대한 제약 : 스페인어/영어로 된 코드 전환 및 차입. 언어 : 291-318. [종이]
- Shana Poplack (1978) 코드 전환의 구문 구조 및 사회적 기능 . vol. 2. Centro de Estudios Puertorriqueños, 뉴욕시 대학 [종이]
- Gumperz, JJ, & Hernandez, E. (1969) 이중 언어 의사 소통의인지 적 측면 . 캘리포니아 대학교 국제 연구 연구소 [논문]
정서적 컴퓨팅
- Chakravarthi, et al. (2021) Dravidiancodemix : 코드 혼합 텍스트의 Dravidian 언어에 대한 감정 분석 및 공격적인 언어 식별 데이터 세트 . arxiv [종이] [코드 및 데이터 세트]
- Siddharth Yadav (2020) 코드 혼합 데이터에 대한 감독되지 않은 감정 분석 . arxiv [종이] [코드]
- Wang, et al. (2017) Joint Factor Graph 모델을 사용한 코드 전환 텍스트의 감정 분석 . 오디오, 음성 및 언어 처리에 대한 IEEE/ACM 트랜잭션 [논문]
- Wang, et al. (2016) 코드 전환 감정 예측을위한 이중 언어주의 네트워크 . 콜링 [종이]
- Sophia Lee와 Zhongqing Wang (2015) 코드 전환 텍스트의 감정 : 코퍼스 건설 및 분석 . 중국어 처리에 관한 여덟 번째 Sighan 워크숍의 절차 [논문]
- Wang, et al. (2015) 이중 언어 및 감상 정보를 통한 코드 전환 텍스트의 감정 탐지 . ACL [종이]
대화 및 대화 시스템
- Gupta, et al. (2018) 코드 혼합 과제를 발견 : 언어 적으로 주도 된 질문 생성 및 신경 기반 질문 답변을위한 프레임 워크 . conll [종이]
담화
- Sravani 등. (2021) 정치 담론 분석 : 정치 연설에서 코드 혼합 및 코드 전환에 대한 사례 연구 . Calcs Code Switching (Calcs), NAACL [종이]에 대한 5 차 워크숍의 Calcs 절차
통사론
- Kodali, et al. (2022) Symcom- 영어 힌디 코드 혼합 연구를 혼합하는 코드의 구문 측정 . ACL의 결과 [종이]
- Özlem Çetinoglu 및 Çagrı Çöltekin (2019) 코드 전환 트리 뱅크에 주석을 달아야하는 도전 . SyntaxFest [종이]
대적 공격
- Samson Tan과 Shafiq Joty (2021) Sesame Street에서 코드 혼합 : Adversarial Polyglots의 새벽 . NaaCl [종이]
사회 언어학
- Bolock, et al. (2020) 누가, 언제, 왜 : 코드 전환의 3 ws . 에이전트 및 다제 시스템의 실제 적용에 관한 국제 회의 [논문]
- Yoder, et al. (2017) 사회 행위로서 코드 전환 : 아랍어 위키 백과 토크 페이지의 사례 . 자연 언어 처리 및 계산 사회 과학에 관한 두 번째 워크숍의 절차, ACL [논문]
- Agrawal, et al. (2017) Agarwal, Prabhat, et al. 나는 영어로 말할 수 있지만 Gaali Toh Hindi Mein Hi denge : 소셜 네트워크에서 영어 힌디 코드 전환 및 맹세 패턴에 대한 연구 . 커뮤니케이션 시스템 및 네트워크 국제 회의 (COMSNETS) [논문]
기준
- Khanuja, et al. (2020) Gluecos : 코드 전환 NLP에 대한 평가 벤치 마크 . ACL [종이]
- Aguilar, et al. (2020) Lince : 언어 코드 전환 평가를위한 중앙 집중식 벤치 마크 . LREC [종이]
소셜 미디어
- Bali, et al. (2014) “나중에 믹싱을 빌려 있습니까?” Facebook에서 영어 힌디 코드 믹싱 분석 . 코드 전환에 대한 계산 접근법에 관한 첫 번째 워크숍의 절차 [논문]
텍스트 정규화
- Dwija Parikh와 Thamar Solorio (2021) 코드 스웨인 데이터에 대한 정규화 및 역 용화 . Calcs Code Switching (Calcs), NAACL [종이]에 대한 5 차 워크숍의 Calcs 절차
툴킷
합성 데이터 생성 툴킷
- Jayanthi, et al. (2021) CodemixedNlp : 코드 혼합을위한 확장 가능하고 열린 NLP 툴킷 . Calcs Code Switching (Calcs), NAACL [논문] [코드]에 대한 5 차 워크숍의 Calcs 절차
- Rizvi, et al. (2021) GCM : 합성 코드 혼합 텍스트를 생성하기위한 툴킷 . EACL (시스템 데모) [논문] [코드]
주석 툴킷
- Shah, et al. (2019) Cossat : 코드 전환 음성 주석 도구 . NLP에 대한 크라우드 소싱 주석 집계 및 분석에 관한 첫 번째 워크숍의 절차 [논문]
요약
- Mehnaz, et al. (2021) Gupshup : 개방형 도메인 코드 전환 대화 요약 . emnlp
질문 대답
- Gupta, et al. (2020) 다국어 및 코드 혼합 된 시각적 질문 응답을위한 통합 프레임 워크 . AACL-IJCNLP [TBA]
대화 및 대화 시스템
- Bawa, et al. (2020) 다국어 사용자가 코드 혼합물을 선호합니까? 새끼를 랑 모르고 알아 보자! . 인간-컴퓨터 상호 작용에 대한 ACM [종이]
- Banerjee 등. (2018) Code-Mixed 목표 지향 대화 시스템을 구축하기위한 데이터 세트 . 콜링 [종이]
위치 종이
- Nguyen 등. (2022) 코드 전환을위한 교육 기술 구축 : 현재 관행, 어려움 및 미래 방향 . 언어 [종이]
서적
- Caciullos and Travis (2018) 지역 사회의 이중 언어 . 케임브리지 대학교 출판부
논문
- Genta Indra Winata (2021) 코드 전환 언어 및 음성 신경 모델링을위한 다국어 전송 학습 . [명제]
- Gustavo Aguilar (2020) 소셜 미디어 텍스트의 신경 서열 레이블 . [명제]
- Victor Soto Martinez (2020) 코드 전환 언어를 식별하고 모델링합니다 . [명제]