Forschungsressourcen mit Code-Switching
Dies ist die Liste der Tutorials, Workshops, Artikel und Ressourcen zu rechnerischen sprachlichen Ansätzen zur Code-Switching-Forschung. Die Liste wird im Laufe der Zeit aktualisiert. Sie können gerne eine Pull -Anfrage zur Aktualisierung der Liste senden und einer der Mitwirkenden sein!
? Ich habe vor, diese und Bücher zum Codesschwestern zu sammeln und sie hier aufzulisten. Wenn Sie einen haben, zögern Sie nicht, mich zu kontaktieren oder eine Pull -Anfrage zu erstellen!
Inhaltsverzeichnis
- Highlights
- ? Workshops
- ? Forschungsarbeiten
- Vermessungspapier
- Großsprachige Modelle
- Sprachidentifikation und POS -Tagging
- Korpus
- Sprachmodellierung und Spracherkennung
- Diskurs
- Generation
- Sprachsynthese
- Metrisch
- Repräsentationslernen
- Maschinelle Übersetzung
- Sprachübersetzung
- Natürliches Sprachverständnis
- Genannte Entitätserkennung
- Linguistik
- Affektives Computing
- Dialog- und Konversationssystem
- Diskurs
- Syntax
- Gegnerschaftsangriff
- Soziale Linguistik
- Benchmark
- Social Media
- Textnormalisierung
- Toolkit
- Bücher
- Thesen
Highlights
- Wir werden den Code-Switching-Workshop bei NAACL 2025 organisieren! Wir werden die Website bald aktualisieren! [Webseite]
- Wenn Sie neu in Code-Switching sind oder nach einer neuen Forschungsrichtung suchen, haben wir ein umfassendes Umfragemapier über die Code-Switching geschrieben: Die Jahrzehnte Fortschritte bei der Code-Switching-Forschung in NLP: Eine systematische Umfrage zu Trends und Herausforderungen [Papier]. Fühlen Sie sich frei zu lesen und lassen Sie uns wissen, ob Sie Vorschläge haben! Vielen Dank an Alham Fikri Aji, Zheng-Xin Yong und Thamar Solorio, um dies zu ermöglichen?
- Wir haben den Code-Switching-Workshop bei EMNLP 2023 organisiert! [Webseite]
- Wir (I, Marina Zhukova und Sudipta Kar) organisierten eine Sitzungsvogel in der EMNLP 2022 in Abu Dhabi. Wir haben rund 30 Leute, die sich anschließen (persönlich und online). Danke, dass du gekommen bist!
- ? Es gab ein umfassendes Tutorial über Code-Mixing von Microsoft Research (Monojit Choudhury, Kalika Bali, Anirudh Srinivasan und Sandipan Dandapat) auf der EMNLP 2019, Sie können den folgenden Link überprüfen.
? Workshops
Dies ist die Liste der Code-Switching-Workshop-Serie:
- Erster Workshop zu rechnerischen Ansätzen für den Code-Switching, EMNLP 2014 [Website]
- Zweiter Workshop zu rechnerischen Ansätzen für den Code-Switching, EMNLP 2016
- Dritter Workshop zu rechnerischen Ansätzen für sprachliche Code-Switching, ACL 2018 [Website]
- Viertes Workshop zu rechnerischen Ansätzen zum Sprachcode-Switching, LREC 2020 [Website]
- Erster Workshop zu Sprachtechnologien für den Code-Switching in mehrsprachigen Gemeinschaften, Interspeech 2020 [Website]
- Fünfter Workshop zu rechnerischen Ansätzen zum Sprachcode-Switching, NAACL 2021 [Website]
- Sechster Workshop zu rechnerischen Ansätzen für sprachliche Code-Switching, EMNLP 2023 [Website]
- Siebter Workshop zu rechnerischen Ansätzen für sprachliche Code-Switching, NAACL 2025 [Website (wird bald geöffnet)]
? Forschungsarbeiten
Vermessungspapier
- Winata et al. (2023) Die Jahrzehnte Fortschritte bei der Code-Switching-Forschung in NLP: Eine systematische Umfrage zu Trends und Herausforderungen . ACL -Befunde [Papier]
- Doğruöz, et al. (2021) Eine Umfrage zum Code-Schalter: sprachliche und soziale Perspektiven für Sprachtechnologien . ACL [Papier]
- Jose et al. (2020) Eine Übersicht über aktuelle Datensätze für die Code-sankte Forschung . Internationale Konferenz über fortschrittliche Computer- und Kommunikationssysteme (ICACCS) [Papier]
- Sitaram et al. (2019) Eine Umfrage zur mit Code angesiedelten Sprach- und Sprachverarbeitung . Arxiv [Papier]
Großsprachige Modelle
- Winata et al. (2024) Bergleute: Mehrsprachige Sprachmodelle als semantische Retriever . EMNLP -Ergebnisse [Papier] [Code]
- Yoo et al. (2024) CODE-Switching Red-Teaming: LLM-Bewertung für Sicherheit und mehrsprachiges Verständnis . Arxiv [Papier]
- Leon et al., (2024) Code-Misch-Sonden zeigen, wie vorgebaute Modelle auf dem Code-gewandten Text verallgemeinert werden . LREC [Papier] [Code]
- Huzaifah et al. (2024) Bewertung der code-sanitierenden Übersetzung mit großen Sprachmodellen . LEC-Coling [Papier]
- Yong et al. (2023) Erregen großer Sprachmodelle zum Generieren von Code-Mischtexten: Der Fall südostasiatischer Sprachen . Berechnungen, EMNLP [Papier]
Sprachidentifikation und POS -Tagging
- Burchell et al. (2024) Die identifizierte Sprachausweise mit dem Code ist schwieriger als Sie denken . EACL [Papier]
- Igor Sterner und Simone Teufel (2023) Zungenschalter: Feinkörnige Identifizierung von deutsch-englischer Code-Schalter . Berechnungen, EMNLP [Papier]
- Ostapenko et al. (2022) Sprecherinformationen können Modelle zu besseren induktiven Verzerrungen führen: eine Fallstudie zur Vorhersage des Code-Schalters . ACL [Papier]
- Nguyen et al. . Journal of Open Humanities Data [Papier]
- Tarunesh et al. (2021) Von der maschinellen Übersetzung zum Code-Switching: Generierung hochwertiger Code-gewechster Text . ACL [Papier]
- Gustavo Aguilar und Thamar Solorio. (2020) von Englisch bis zum Code-Switching: Übertragen Sie das Lernen mit starken morphologischen Hinweisen . ACL [Papier] [Code]
- Mager et al. (2019) Sprachidentifikation auf Unterwortebene für den Intra-Wort-Code-Schalter . NAACl [Papier]
- Zhang et al. (2018) Ein schnelles, kompaktes, genaues Modell für die Sprachidentifizierung von Codemixed Text . EMNLP [Papier]
- Kelsey Ball und Dan Garrette. (2018) Teil des Speech-Taggings für codesschaltete, transliterierte Texte ohne explizite Sprachidentifikation . EMNLP [Papier]
- Zeynep Yirmibesoglu und Gulsen Eryigit. (2018) Erkennen von Code-Schalter zwischen türkisch-englischen Sprachpaaren . Workshop W-Nut, EMNLP [Papier]
- Mavem et al. (2018) Sprachidentifizierung und Analyse von sozialen Social-Media-Text . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Victor Soto und Julia Hirschberg. (2018) Joint-Teil der Sprach- und Sprach-ID-Tagging für code-schalte Daten . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Bullock et al. (2018) Vorhersage des Vorhandenseins einer Matrixsprache im Code-Schalter . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Soto et al. (2018) Die Rolle der verwandten Wörter, POS-Tags und der Mitnahme im Code-Switching . Interspeech [Papier]
- Barman et al. (2016) Teil des Speech-Taggings von Code-gemischten Social-Media-Inhalten: Pipeline, Stapel und gemeinsame Modellierung . 2. Workshop zu rechnerischen Ansätzen für den Code-Switching, ACL [Papier]
- Vyas et al. (2014) POS-Tagging von englisch-hindi-codemischten Social-Media-Inhalten . EMNLP [Papier]
- Heba Elfardy und Mona Diab. (2012) Token -Level -Identifizierung des sprachlichen Codewechsels . Coling [Papier]
- Thamar Solorio und Yang Liu. (2008) Erlernen der Vorhersage von Code-Switching-Punkten . EMNLP [Papier]
- Dau-cheng lyu und ren-yuan lyu. (2008) Sprachidentifizierung bei Code-sankten Äußerungen unter Verwendung mehrerer Hinweise . Interspeech [Papier]
Korpus
- Kuwanto et al. (2024) Die Linguistiktheorie trifft LLM: Code-sankte Textgenerierung über die Äquivalenzmodelle . ARXIV [Papier] [Code] [Datensatz]
- Ruochen Zhang und Carsten Eickhoff (2024) Crocosum: Ein Benchmark-Datensatz für die synchronisierte Zusammenfassung . LREC [Papier] [Datensatz]
- Whitehouse et al. (2022) EntityCs: Verbesserung der Kreuzung der Null-Shot-Übertragung mit Entitäts-zentrierter Codewechsel . EMNLP [Papier] [Code]
- Lovenia et al. . LREC [Papier] [Datensatz]
- Nguyen et al. . LREC [Papier]
- Umapathy et al. (2020) Untersuchung von Modellierungstechniken für die Inferenz für natürliche Sprache in Code-schalten Dialogen in Bollywood-Filmen . Erster Workshop zu Sprachtechnologien für den Code-Switching in mehrsprachigen Gemeinschaften, Interspeech 2020 [Datensatz]
- Xiang et al. (2020) Alphabetische Sina Mandarin-Wörter: Eine webgesteuerte codemischende lexikalische Ressource . AACL-IJCNLP [TBC]
- Chakravarthi et al. (2020) Corpus-Erstellung für die Stimmungsanalyse in codemisch mischten tamilisch-englischen Text . Gesprochene Sprachtechnologien für unterressourzierte Sprachen) und CCURL (Zusammenarbeit und Computer für unterressourced Sprachen Workshop, LREC [Papier]
- Khanuja et al. (2020) Ein neuer Datensatz für die Inferenz für natürliche Sprache aus codemischen Gesprächen . 4. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, LREC [Papier]
- Barik et al. (2019) Normalisierung von indonesisch-englisch-codemischten Twitter-Daten . W-NUT, EMNLP [Papier] [Datensatz]
- Singh et al. (2018) Ein Twitter-Korpus für Hindi-English-Code gemischtes POS-Tagging . Sechster internationaler Workshop zur Verarbeitung natürlicher Sprache für soziale Medien, ACL [Papier]
- Li, et al. (2012) Ein Mandarin-English-Codes-Switching Corpus . LREC [Papier]
- Lyu et al. (2010) Seame: Ein Mandarin-English-Code-Switching-Rede-Korpus in Südostasien . Interspeech [Papier]
- Lyu et al. (2010) Eine Analyse eines Mandarin-English-Code-Switching-Sprachkorpus: Seame . Alter [Papier]
Sprachmodellierung und Spracherkennung
- Yu et al. (2023) Code-sankte Textgenerierung und -injektion in Mandarin-englischer ASR . ICASSP [Papier]
- Tolúlopé et al. (2023) Mehrsprachige selbstsütige Sprachdarstellungen verbessern die Spracherkennung von afrikanischen Sprachen mit niedrigem Ressourcen mit codesscharnern . Sechster Workshop zu rechnerischen Ansätzen zum sprachlichen Code-Schalter. [Papier]
- Kumar et al. (2020) Sprachmodellierung von maschinelles Lernen von Code -Switched -Daten . Internationale Konferenz über Elektronik und nachhaltige Kommunikationssysteme (ICESSC) [Papier]
- Madhumani et al. . Arxiv [Papier]
- Shah et al. . Arxiv [Papier]
- Winata et al. . ACL [Papier] [Code]
- Chandu et al. (2020) Stilvariation als Aussichtspunkt für den Code-Schalter . Arxiv [Papier]
- Ganji Sreeram und Rohit Sinha (2020) Exploration des End-to-End-Frameworks für die Aufgabe der Code-Switching-Spracherkennung: Herausforderungen und Verbesserungen . IEEE Access [Papier]
- Winata et al. (2019) Code-sankte Sprachmodelle unter Verwendung neuronaler synthetischer Daten aus parallelen Sätzen . Conll [Papier]
- Hila Gonen und Yoav Goldberg (2019) Sprachmodellierung für die Code-Switching: Bewertung, Integration einsprachiger Daten und diskriminierendes Training . EMNLP [Papier]
- Lee et al. (2019) sprachlich motivierte Paralleldatenvergrößerung für die Modellierung von Code-Schalter . Interspeech [Papier]
- Victor Soto und Julia Hirschberg (2019) Verbesserung der Code-Switched-Sprachmodellierungsleistung mit verwandten Funktionen . Interspeech [Papier]
- Chang et al. (2019) Code-Switching-Satzgenerierung durch generative kontroverse Netzwerke und ihre Anwendung auf die Datenerweiterung . Interspeech [Papier]
- Zeng et al. (2019) über die End-to-End-Lösung für Mandarin-English-Code-Switching-Spracherkennung . Interspeech [Papier]
- Taneja et al. (2019) Ausnutzung von einsprachigen Sprachkörper für die Code-gemischte Spracherkennung . Interspeech [Papier]
- Shan, et al. (2019) Untersuchung der End-to-End-Spracherkennung für Mandarin-English-Code-Schalter . IEEE Internationale Konferenz über Akustik, Sprache und Signalverarbeitung (ICASSP) [Papier]
- Grandee Lee, Haizhou Li. (2019) Wort und Klasse Common Space Einbettung für Code-Switch-Sprachmodellierung . IEEE Internationale Konferenz über Akustik, Sprache und Signalverarbeitung (ICASSP) [Papier]
- Hamed et al. (2019) Code-Switching-Sprachmodellierung mit zweisprachigen Worteinbettungen: Eine Fallstudie für ägyptische Arabisch-Englisch . Internationale Konferenz über Sprache und Computer [Papier]
- Winata et al. (2018) Lernen Sie den Code-Switch: Datenerweiterung mit dem Kopiermechanismus zur Sprachmodellierung . Arxiv [Papier]
- Winata et al. (2018) zur automatischen Code-sankten Spracherkennung von End-to-End . Arxiv [Papier]
- Nakayama et al. (2018) Sprachkette für das halbübergreifende Erlernen von japanisch-englisch-codesschwankenden ASR und TTS . IEEE Spoken Language Technology Workshop (SLT) [Papier]
- Jesse Emond, Bhuwana Ramabhadran, Brian Roark, Pedro Moreno und Min Ma. (2018) Transliteration-basierte Ansätze zur Verbesserung der Code-Angeakten Spracherkennungsleistung , IEEE Spoken Language Technology Workshop (SLT) [Papier]
- Ganji Sreeram und Rohit Sinha. (2018) Nutzung von Speech-Teilen für eine verbesserte textuelle Modellierung von Code-Switching-Daten . 2018 Vierundzwanzig National Conference on Communications (NCC) [Papier]
- Garg et al. (2018) Code-sankte Sprachmodelle unter Verwendung von Dual-RNNs und gleichberechtigten Vorabbau . EMNLP [Papier]
- Ewald van der Westhuizen und Thomas R. Niesler. (2018) synthetisierten BigRams mit Word-Einbettungen für den Code-Schalter von vier südafrikanischen Sprachpaaren . Computer Sprache und Sprache [Papier]
- Biswal et al. (2018) Mehrsprachige akustische Modellierung des neuronalen Netzwerks für ASR von unterressernder englisch-isizulu-code-sankter Sprache . Interspeech [Papier]
- Winata et al. (2018) Code-Switching-Sprachmodellierung unter Verwendung von Syntax-bewusstes Multitasking-Lernen . 3. Workshop von rechnerischen Ansätzen zum Sprachcode-Switching, ACL [Papier] [Code]
- Chandu et al. (2018) Sprachförderte Modellierung von Code-angeschwächtem Text . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Pratapa et al. (2018) Sprachmodellierung für die Codemischung: Die Rolle von sprachlichen theoretischen synthetischen Daten . ACL [Papier]
- Sivasankaran et al. (2018) Telefonverschmelzung für die Code-gestellte Spracherkennung . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Garg et al. (2018) Dual -Sprachmodelle für die Code -Switched Spracherkennung . Interspeech [Papier]
- Baheti et al. (2017) Curriculum-Design für den Code-Switching: Experimente mit Sprachidentifikation und Sprachmodellierung mit tiefen neuronalen Netzwerken . Ikone [Papier]
- Adel et al. (2015) Syntaktische und semantische Funktionen für faktorisierte Sprachmodelle mit Code-Switching . IEEE -Transaktionen zu Audio-, Sprach- und Sprachverarbeitung [Papier]
- Ying Li und Pascale Pilg. (2014) Codeswechselsprachenmodellierung mit funktionaler Kopfbeschränkung . ICASSP [Papier]
- Ying Li und Pascale Pilg. (2014) Sprachmodellierung mit funktionaler Kopfbeschränkung für die Spracherkennung von Codewechsel . EMNLP [Papier]
- Adel et al. (2013) Kombination aus wiederkehrenden neuronalen Netzwerken und berücksichtigten Sprachmodellen für die Modellierung von Code-Switching-Sprach . ACL [Papier]
- Adel et al. (2013) Rezidivierende Modellierung der neuronalen Netzwerksprachenmodellierung für die Konversationsrede von Codewechsel . ICASSP [Papier]
- Vu et al. (2012) Ein erstes Spracherkennungssystem für Mandarin-English-Code-Switch-Konversationsrede . ICASSP [Papier]
- Ying Li und Pascale Pilg. (2012) Code-Switch-Sprachmodell mit Inversionsbeschränkungen für die Spracherkennung gemischter Sprache . Coling [Papier]
- Li, et al. (2011) Asymmetrische akustische Modellierung von Sprachmodellierung gemischter Sprache . ICASSP [Papier]
Diskurs
- Sravani et al. (2021) Analyse der politischen Diskurs: Eine Fallstudie zum Mischen von Code und Codewechsel in politischen Reden . Verfahren des 5. Workshops zu Computeransätzen bei Code -Switching (CALCS), NAACL [Papier]
Generation
- Gupta et al. (2020) Ein halbüberwachter Ansatz zur Generierung des Code-Mischtextes mithilfe von vorgebildetem Encoder und Übertragungslernen . Ergebnisse von EMNLP [Papier]
- Bryan Gregorius und Takeshi Okadome (2022) generieren Code-gewickter Text aus einsprachigem Text mit Abhängigkeitsbaum . Der 20. jährliche Workshop der Australasian Language Technology Association [Papier] [Code]
Sprachsynthese
- Sai Krishna Rallabandi und Alan W Black (2019) Variationsaufmerksamkeit unter Verwendung von artikulatorischen Priors zum Generieren von Code gemischtes Sprache mit monolingualen Korpora . Interspeech [Papier]
- Sai Krishna Rallabandi und Alan W Black (2017) zum Bau von gemischten lingualen Sprachsynthesesystemen. Interspeech [Papier]
- Chandu et al. (2017) Sprachsynthese für Anweisungen mit gemischter Sprache. Interspeech [Papier]
Metrisch
- Guzman et al. (2017) Metriken für die Modellierung des Code-Switching über Corpora . Interspeech [Papier]
Repräsentationslernen
- Adilazuarda et al. (2023) Indorobusta: Auf dem Weg zu Robustheit gegen verschiedene indonesische lokale Code-Lokalsprachen . Verfahren des ersten Workshops zur Skalierung mehrsprachiger Bewertung, AACl [Papier] [Code]
- Prasad et al. (2021) Die Wirksamkeit des Intermediate-Task-Trainings für das Verständnis der natürlichen Sprache . Verfahren des 1. Workshops über mehrsprachige Repräsentationslernen, EMNLP [Papier]
- Winata et al. (2021) Sind mehrsprachige Modelle im Code-Schalter wirksam? . Verfahren des 5. Workshops zu Computeransätzen bei Code -Switching (CALCS), NAACL [Papier]
- Rizal et al. (2020) Bewertung von Worteinbettungen für indonesisch-englisch-codemisch-mixte Text basierend auf synthetischen Daten . Verfahren des 4. Workshops über Computeransätze zur Codeschaltung (Berechnungen), LREC [Papier]
- Winata et al. (2019) Hierarchische Meta-Embeddings für den Code-Switching-Anerkennung der Entität . EMNLP [Papier] [Code]
- Pratapa et al. (2018) Word-Einbettungen für die Code-gemischte Sprachverarbeitung . EMNLP [Papier]
Maschinelle Übersetzung
- Pengpun et al. (2024) zum Erstellen einer englisch-thai-codemischen maschinellen Übersetzung im medizinischen Bereich. EMNLP [Papier]
- Gaser et al. (2023) Untersuchung von Segmentierungsansätzen für die neuronale maschinelle Übersetzung von ägyptisch-arabisch-englischen Text . EACL [Papier]
- Kuwanto et al. (2021) Low-Ressourcen-Lehrplan für maschinelle Übersetzungen für das Training für niedrige Ressourcen . Arxiv [Papier]
- Vivek Srivastava und Mayank Singh (2020) Phinc: Ein paralleler Hinglish Social-Media-Code-Corpus für die maschinelle Übersetzung . W-NUT, EMNLP [Papier] [Datensatz]
- Thoudam Doren Singh und Thamar Solorio. (2017) zur Übersetzung von Kommentaren von gemischten Code aus sozialen Medien . Cicling [Papier]
Sprachübersetzung
- Alastruy et al. (2023) In Richtung realer Streaming-Sprachübersetzung für codesschaltete Sprache . Berechnungen, EMNLP [Papier]
Natürliches Sprachverständnis
- Krishnan et al. (2021) Mehrsprachige Code-Switching für die kürzelige Vorhersage und Slotfüllung von Null-Shot-Absichten . MRL, EMNLP [Papier]
Genannte Entitätserkennung
- Priyadharshini et al. (2020) nannten die Entitätserkennung für codemischte indische Korpus unter Verwendung von Meta-Einbettung . 6. Internationale Konferenz für fortschrittliche Computer- und Kommunikationssysteme (ICACCS) [Papier]
- Winata et al. (2019) Erlernen mehrsprachiger Meta-Embeddings für die mit dem Code sanfitierende Entitätserkennung . Repl4NLP, ACL [Papier] [Code]
- Aguilar et al. (2018) nannten die Entitätserkennung von Code-Switched-Daten: Übersicht über die gemeinsame Aufgabe von Calcs 2018 . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Wang et al. (2018) Code-sanft bezeichnet mit dem Einbettung von Aufmerksamkeit . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Winata et al. (2018) Zweisprachige Charakterdarstellung zur effizienten Bekämpfung außerhalb des Vokabulars in den mit dem Code-sanft bezeichneten Entitätserkennung . 3. Workshop von rechnerischen Ansätzen zum sprachlichen Code-Switching, ACL [Papier]
- Aguilar et al. (2017) Ein Multitasking-Ansatz für die genannte Entitätserkennung in Social-Media-Daten . 3. Workshop zum lauten benutzergenerierten Text, EMNLP [Papier]
Linguistik
- Li Nyuyen. (2018) Ausleihen oder Code-Schalter? Spuren von Gemeinschaftsnormen in vietnamesisch-englischer Sprache. Australian Journal of Linguistics 38.4 (2018): 443-466. [Papier]
- Fairchild, Sarah und Janet G. Van Hell. (2017) Determiner-noun-Code-sankt in spanischen Sprechern des Kulturerbes. Zweisprachigkeit: Sprache und Kognition 20.1 (2017): 150-161. [Papier]
- Bhatt, Rakesh M. und Agnes Bolonyai. (2011) Code-Switching und die optimale Grammatik der Verwendung von zweisprachiger Sprache. Zweisprachigkeit: Sprache und Kognition 14.4 (2011): 522-546. [Papier]
- Lipski (2005) Code-sankt oder leihen? Kein Sé, also kein Puedo Decir, weißt du? Zweiter Workshop über spanische Soziolinguistik [Papier]
- Roberto R. Heredia und Jeanette Altarriba (2001) Zweisprachige Sprachmischung: Warum zweisprachige Code-Switch? Salbei Publications [Papier]
- Belazi et al. (1994) Code-Switching und X-Bar-Theorie: Die funktionale Kopfbeschränkung . Linguistische Untersuchung Vol 25 Nr. 2 Spring [Papier]
- Shana Poplack (1980) Manchmal beginne ich einen Satz in spanischen y tergo en espanol: auf eine Typologie des Code-Switching1 . Linguistik 18 (7-8) [Papier]
- Pfaff, Carol W. (1979) Einschränkungen bei der Sprachmischung: Intrasententententielle Code-Schalter und Ausleihe in Spanisch/Englisch. Sprache: 291-318. [Papier]
- Shana Poplack (1978) Syntaktische Struktur und soziale Funktion des Code-Schalters . Vol. 2. Centro de Estudios Puertorriqueños, City University of New York [Papier]
- Gumperz, JJ & Hernandez, E. (1969) Kognitive Aspekte der zweisprachigen Kommunikation . Institute of International Studies, University of California [Papier]
Affektives Computing
- Chakravarthi et al. . ARXIV [Papier] [Code und Datensatz]
- Siddharth Yadav (2020) Unüberwachte Stimmungsanalyse für Code-gemischte Daten . ARXIV [Papier] [Code]
- Wang et al. (2017) Emotionsanalyse im Code-Switching-Text mit gemeinsamem Faktor-Graph-Modell . IEEE/ACM -Transaktionen zu Audio-, Sprach- und Sprachverarbeitung [Papier]
- Wang et al. (2016) Ein zweisprachiges Aufmerksamkeitsnetzwerk für die prognostizierte Emotionsvorhersage von Code-gestellter Emotionen . Coling [Papier]
- Sophia Lee und Zhongqing Wang (2015) Emotionen in Code-Switching-Texten: Korpuskonstruktion und -analyse . Verfahren des achten Seufzwerks Workshop zur chinesischen Sprachverarbeitung [Papier]
- Wang et al. (2015) Emotionserkennung in Code-sankten Texten über zweisprachige und sentimentale Informationen . ACL [Papier]
Dialog- und Konversationssystem
- Gupta et al. (2018) Aufdeckung von Code-Misch-Herausforderungen: Ein Rahmen für sprachlich angetriebene Fragengenerierung und neuronale Frage . Conll [Papier]
Diskurs
- Sravani et al. (2021) Analyse der politischen Diskurs: Eine Fallstudie zum Mischen von Code und Codewechsel in politischen Reden . Berechnungsverfahren des 5. Workshops zu rechnerischen Ansätzen zur Codeschaltung (Berechnungen), NAACl [Papier]
Syntax
- Kodali et al. (2022) SYMCOM-Syntaktisches Maß für Code, das eine Untersuchung der englisch-hindi-Code-Mischung vermischt . Ergebnisse von ACL [Papier]
- Özlem çetinoglu und Çagrı çöltekin (2019) Herausforderungen bei der Annotation einer TreeBank . Syntaxfest [Papier]
Gegnerschaftsangriff
- Samson Tan und Shafiq Joty (2021) Code-Mischung in der Sesame Street: Morgendämmerung der kontroversen Polyglots . NAACl [Papier]
Soziale Linguistik
- Bolock et al. (2020) Wer, wann und warum: die 3 Ws des Code-Switching . Internationale Konferenz über praktische Anwendungen von Agenten und Multi-Agent-Systemen [Papier]
- Yoder et al. (2017) Code-Switching als soziales Gesetz: Der Fall von arabischen Wikipedia-Talkseiten . Verfahren des zweiten Workshops zur Verarbeitung natürlicher Sprache und der Berechnung der Sozialwissenschaften, ACL [Papier]
- Agrawal et al. (2017) Agarwal, Prabhat et al. Ich kann in englischer Sprache sprechen, aber Gaali toh hindi mein hi Denge: Eine Studie über englisch-hindi-sankte und schwörende Muster in sozialen Netzwerken . Internationale Konferenz über Kommunikationssysteme und Netzwerke (Comsnets) [Papier]
Benchmark
- Khanuja et al. (2020) Gluecos: Ein Bewertungs-Benchmark für Codes-Switched NLP . ACL [Papier]
- Aguilar et al. (2020) Lince: Ein zentraler Benchmark für die Bewertung des sprachlichen Code-Witching . LREC [Papier]
Social Media
- Bali et al. (2014) „Ich leihe mich YA -Mischen aus?“ Eine Analyse des englisch-hindi-Code-Mischens in Facebook . Verfahren des ersten Workshops zu rechnerischen Ansätzen zum Codewechsel [Papier]
Textnormalisierung
- Dwija Parikh und Thamar Solorio (2021) Normalisierung und Rücktransliteration für codesscharierte Daten . Berechnungsverfahren des 5. Workshops zu rechnerischen Ansätzen zur Codeschaltung (Berechnungen), NAACl [Papier]
Toolkit
Toolkit für synthetische Datengenerierung
- Jayanthi et al. (2021) codemixednlp: ein erweiterbares und offenes NLP-Toolkit für die Codemischung . Berechnungsverfahren des 5. Workshops über Computeransätze zur Codeschaltung (Berechnungen), NAACl [Papier] [Code]
- Rizvi et al. (2021) GCM: Ein Toolkit zum Generieren synthetischer Code-gemischter Text . EACL (Systemdemonstrationen) [Papier] [Code]
Annotations -Toolkit
- Shah et al. (2019) COSSAT: Code-gestellter Sprachannotation-Tool . Verfahren des ersten Workshops zur Aggregation und Analyse von Crowdsourced -Anmerkungen für NLP [Papier]
Zusammenfassung
- Mehnaz, et al. (2021) GUPSHUP: Zusammenfassende Gespräche mit Code mit Open-Domänen . EMNLP
Frage Beantwortung
- Gupta et al. (2020) Ein einheitliches Framework für mehrsprachige und codemischte visuelle Beantwortung . AACL-IJCNLP [TBA]
Dialog- und Konversationssystem
- Bawa et al. (2020) Bevorzugen mehrsprachige Benutzer Chat-Bots diese Code-Mix? Lassen Sie uns stupsen und es herausfinden! . ACM auf Human-Computer-Interaktion [Papier]
- Banerjee et al. (2018) Ein Datensatz zum Erstellen von mit Code-gemischten zielorientierten Konversationssystemen . Coling [Papier]
Positionspapier
- Nguyen et al. (2022) Aufbau von Bildungstechnologien für den Code-Schalter: Aktuelle Praktiken, Schwierigkeiten und zukünftige Anweisungen . Sprachen [Papier]
Bücher
- Caciullos und Travis (2018) Zweisprachigkeit in der Gemeinschaft . Cambridge University Press
Thesen
- Genta Indra Winata (2021) Mehrsprachiger Transferlernen für Code-Schalter-Sprache und Sprachneuralmodellierung . [These]
- Gustavo Aguilar (2020) Neuralsequenz -Kennzeichnung im Social -Media -Text . [These]
- Victor Soto Martinez (2020) Identifizierung und Modellierung von Code-Schalter-Sprache . [These]