Исследовательские ресурсы переключения кода
Это список учебных пособий, семинаров, документов и ресурсов по вычислительным лингвистическим подходам к исследованиям переключения кода. Список будет обновлен за время. Вы можете отправить запрос на обновление списка и стать одним из участников!
? Я планирую собрать тезисы и книги о переключении кода и перечислить их здесь. Если у вас есть один, не стесняйтесь обращаться ко мне или создать запрос на притяжение!
Оглавление
- Основные моменты
- ? Мастерские
- ? Исследовательские работы
- Обзорная статья
- Большие языковые модели
- Идентификация языка и теги POS
- Корпус
- Языковое моделирование и распознавание речи
- Дискурс
- Поколение
- Синтез речи
- Показатель
- Представительное обучение
- Машинный перевод
- Речевой перевод
- Понимание естественного языка
- Названное признание сущности
- Лингвистика
- Аффективные вычисления
- Диалог и разговорная система
- Дискурс
- Синтаксис
- Состязательная атака
- Социальная лингвистика
- Эталон
- Социальные сети
- Нормализация текста
- Инструментарий
- Книги
- Тезисы
Основные моменты
- Мы будем организовывать семинар по переключению кодов в NAACL 2025! Мы скоро обновим сайт! [Веб -сайт]
- Если вы новичок в переключении кода или ищете новое направление исследования, мы написали всеобъемлющий документ об опросе по переключению кода: десятилетия прогресса в исследовании переключения кода в NLP: систематический опрос о тенденциях и проблемах [Paper]. Не стесняйтесь читать и сообщать нам, если у вас есть какие -либо предложения! Благодаря Алхам Фикри Аджи, Чжэн-Синь Юн и Тамар Солорио, чтобы сделать это возможным?
- Мы организовали семинар по переключению кодов на EMNLP 2023! [Веб -сайт]
- Мы (я, Марина Чжукова и Судипта Кар) организовали сессию птицы в EMNLP 2022 в Абу-Даби. У нас около 30 человек присоединяются (лично и онлайн). Спасибо, что пришли!
- ? Было проведено всеобъемлющее руководство о смешивании кода Microsoft Research (Monojit Choudhury, Kalika Bali, Anirudh Srinivasan и Sandipan Dandapat) на Emnlp 2019, вы можете проверить следующую ссылку.
? Мастерские
Это список серии семинаров по переключению кодов:
- Первый семинар по вычислительным подходам к переключению кода, EMNLP 2014 [Веб-сайт]
- Второй семинар по вычислительным подходам к переключению кода, EMNLP 2016
- Третий семинар по вычислительным подходам к лингвистическому переключению кода, ACL 2018 [Веб-сайт]
- Четвертый семинар по вычислительным подходам к лингвистическому переключению кода, LREC 2020 [Веб-сайт]
- Первый семинар по речевым технологиям для переключения кодов в многоязычных сообществах, Interspeech 2020 [Веб-сайт]
- Пятый семинар по вычислительным подходам к лингвистическому переключению кода, NAACL 2021 [Веб-сайт]
- Шестой семинар по вычислительным подходам к лингвистическому переключению кода, EMNLP 2023 [Веб-сайт]
- Седьмой семинар по вычислительным подходам к лингвистическому переключению кода, NAACL 2025 [Веб-сайт (скоро откроется)]
? Исследовательские работы
Обзорная статья
- Winata, et al. (2023) десятилетия прогресса в исследованиях переключения кода в НЛП: систематический опрос о тенденциях и проблемах . Выводы ACL [бумага]
- Doğruöz и др. (2021) Обзор переключения кода: лингвистические и социальные перспективы для языковых технологий . ACL [Paper]
- Хосе и др. (2020) Обзор текущих наборов данных для исследований по переключению кодов . Международная конференция по передовым компьютерным и коммуникационным системам (ICACCS) [Paper]
- Sitaram, et al. (2019) Обзор речевой и языковой обработки, связанной с кодом . Arxiv [бумага]
Большие языковые модели
- Winata, et al. (2024) Шахтеры: многоязычные языковые модели в качестве семантических ретриверов . Выводы EMNLP [Paper] [Код]
- Yoo, et al. (2024) Переключение кодов красной команды: Оценка LLM для безопасности и многоязычного понимания . Arxiv [бумага]
- Leon, et al., (2024) , смешанные с кодовым, показывают, как предварительно обученные модели обобщаются по тексту, включенному в код . Lrec [Paper] [Код]
- Huzaifah, et al. (2024) Оценка перевода переключения кода с помощью больших языковых моделей . Lrec-coling [бумага]
- Yong, et al. (2023) Подает большие языковые модели для создания смешанных кода текстов: случай юго-восточно-азиатских языков . Calcs, emnlp [Paper]
Идентификация языка и теги POS
- Burchell, et al. (2024) Идентификация языка, включенная в код, сложнее, чем вы думаете . EACL [Paper]
- Igor Sterner и Simone Teufel (2023) Tongueswitcher: мелкозернистая идентификация немецко-английского переключения кода . Calcs, emnlp [Paper]
- Ostapenko, et al. (2022) Информация о динамике может направлять модели для лучших индуктивных смещений: тематическое исследование по прогнозированию переключения кода . ACL [Paper]
- Nguyen, et al. (2021) Автоматическая идентификация языка в текстовом тексте в социальных сетях с хинди-английским . Журнал данных о открытых гуманитарных науках [документ]
- Tarunesh, et al. (2021) От машинного перевода в переключение кода: генерирование высококачественного текста, переключенного кодом . ACL [Paper]
- Густаво Агилар и Тамар Солорио. (2020) От английского до переключения кода: перевод обучения с сильными морфологическими подсказками . ACL [Paper] [Код]
- Mager, et al. (2019) Идентификация языка на уровне подвесов для переключения кода внутрилогового . Naacl [бумага]
- Zhang, et al. (2018) Быстрая, компактная, точная модель для идентификации языка кодиссового текста . Emnlp [Paper]
- Келси Болл и Дэн Гарретт. (2018) Часть речи тегов для переключенных кода, транслитерированные тексты без явной идентификации языка . Emnlp [Paper]
- Zeynep yirmibesoglu и Gulsen Eryigit. (2018) Обнаружение переключения кода между турецкой английской языковой парой . Семинар w-ut, emnlp [Paper]
- Mavem, et al. (2018) Идентификация языка и анализ текста социальных сетей, включенного в код . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Виктор Сото и Джулия Хиршберг. (2018) Совместная часть речи и идентификатор языка для данных, связанных с кодом . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Bullock, et al. (2018) Прогнозирование наличия матричного языка в переключении кода . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Soto, et al. (2018) Роль родственных слов, тегов POS и увлечения в переключении кода . Межспика [бумага]
- Barman, et al. (2016) Часть речи с кодом смешанного в социальных сетях: трубопровод, укладку и совместное моделирование . 2-й семинар по вычислительным подходам к переключению кода, ACL [Paper]
- Vyas, et al. (2014) POS-тег, смешанный на кодовом сетях английского языка . Emnlp [Paper]
- Хеба Элфарди и Мона Диаб. (2012) Идентификация уровня токена лингвистического переключения кода . Coling [Paper]
- Тамар Солорио и Ян Лю. (2008) Обучение прогнозированию точек переключения кода . Emnlp [Paper]
- Дау-Ченг Лю и Рен-Юань Лю. (2008) Идентификация языка на высказываниях переключения кода с использованием нескольких сигналов . Межспика [бумага]
Корпус
- Kuwanto, et al. (2024) Теория лингвистики соответствует LLM: генерация текста, включенную в код посредством эквивалентности, ограниченных большими языковыми моделями . Arxiv [paper] [code] [набор данных]
- Ruochen Zhang и Carsten Eickhoff (2024) Crocosum: набор данных контрольного данных для суммирования перекрестного кода . Lrec [Paper] [Набор данных]
- Whitehouse, et al. (2022) Entitycs: улучшение перекрестного перевода с нулевым выстрелом с помощью переключения кода, ориентированного на объект . EMNLP [Paper] [Код]
- Lovenia, et al. (2022) ASCEND: спонтанный набор данных из китайского английского языка для переключения кода в многообразивом разговоре . Lrec [Paper] [Набор данных]
- Nguyen, et al. (2020) Canvec-Canberra Vietnamese-English, переключающий природные речи . Lrec [Paper]
- Umapathy, et al. (2020) Исследование методов моделирования для вывода естественного языка на диалогах с переключенными кодами в фильмах Болливуда . Первый семинар по речевым технологиям для переключения кодов в многоязычных сообществах, Interspeech 2020 [Набор данных]
- Xiang, et al. (2020) СИНА МАНДАРИН АЛФАБЕТИЧЕСКИЕ СЛОВА: Лексический ресурс, управляемый веб-кодом . AACL-IJCNLP [TBC]
- Чакраварти и др. (2020) Создание корпуса для анализа настроений в смешанном кодовом тамил-английском тексте . Технологии разговорного языка для языков с недостаточным ресурсом) и CCURL (Collaboration and Computing для семинара по языкам с низкими ресурсами, Lrec [Paper]
- Khanuja, et al. (2020) Новый набор данных для вывода естественного языка из переговоров с кодом . 4-й семинар вычислительных подходов к лингвистическому переключению кода, LREC [Paper]
- Barik, et al. (2019) Нормализация индонезийско-английских данных, смешанных в Твиттере . W-nut, emnlp [Paper] [Набор данных]
- Singh, et al. (2018) Корпус Twitter для хинди-английского кода смешанного POS-тега . Шестой международный семинар по обработке естественного языка для социальных сетей, ACL [Paper]
- Li, et al. (2012) Корпус переключения кода мандарина . Lrec [Paper]
- Lyu, et al. (2010) Seade: речевой речевой корпус переключения кода мандарина в Юго-Восточной Азии . Межспика [бумага]
- Lyu, et al. (2010) Анализ речевого речевого корпуса переключения кода мандарина: seade . Возраст [бумага]
Языковое моделирование и распознавание речи
- Yu, et al. (2023) Генерация текста и инъекция текста и инъекции в мандарин-английском ASR . Icassp [бумага]
- Toloulopé, et al. (2023) Многоязычные самоотверженные речевые речевые представления улучшают распознавание речи африканских языков с низким ресурсом с помощью переключения кодов . Шестой семинар по вычислительным подходам к лингвистическому переключению кода. [Бумага]
- Kumar, et al. (2020) Языковое моделирование на основе машинного обучения данных по переключению кода . Международная конференция по электронике и устойчивым системам связи (ICESC) [Paper]
- Мадхумани и др. (2020) Обучение не дискриминации: агностическое обучение задач для улучшения одноязычного и композиционного распознавания речи . Arxiv [бумага]
- Shah, et al. (2020) Обучение распознаванию речи с кодом, не забывая о одноязычном распознавании речи . Arxiv [бумага]
- Winata, et al. (2020) Мета-переносное обучение для распознавания речи, связанных с кодом . ACL [Paper] [Код]
- Chandu, et al. (2020) Изменение стиля как выгодная точка для переключения кода . Arxiv [бумага]
- Ganji Sreeram и Rohit Sinha (2020). Исследование сквозной структуры для задачи распознавания речи с переключением кода: проблемы и улучшения . IEEE Access [Paper]
- Winata, et al. (2019) Языковые модели, включенные в код, с использованием нейронных синтетических данных из параллельных предложений . Conll [Paper]
- Хила Гонен и Йоав Голдберг (2019) . Emnlp [Paper]
- Ли и др. (2019) Лингвистически мотивированное параллельное увеличение данных для моделирования языка переключения кода . Межспика [бумага]
- Виктор Сото и Джулия Хиршберг (2019) Улучшение производительности языкового моделирования, связанного с кодом, с использованием родственных функций . Межспика [бумага]
- Чан и др. (2019) Генерация предложений с переключением кода путем генеративных состязательных сетей и его применения к увеличению данных . Межспика [бумага]
- Zeng, et al. (2019) На сквозном решении распознавания речи мандарина-английского языка . Межспика [бумага]
- Taneja, et al. (2019) Использование одноязычных речевых корпораций для распознавания речи с кодом . Межспика [бумага]
- Shan, et al. (2019) Исследование сквозного распознавания речи для переключения кода мандарина-английского языка . Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP) [Paper]
- Гранди Ли, Хайзхоу Ли. (2019) Word и Class Common Space, встраиваемая для моделирования языка переключения кода . Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP) [Paper]
- Hamed, et al. (2019) Моделирование языка переключения кода с двуязычными встроениями слов: тематическое исследование для египетского арабского английского языка . Международная конференция по речи и компьютеру [Документ]
- Winata, et al. (2018) научиться переключать код: увеличение данных с использованием механизма копирования на языковом моделировании . Arxiv [бумага]
- Winata, et al. (2018) На пути к установке автоматического распознавания речи . Arxiv [бумага]
- Nakayama, et al. (2018) Речевая цепочка для полупрофильного обучения японско-английскому переключающему кодексу ASR и TTS . Семинар по технологиям разговорной языка IEEE (SLT) [Paper]
- Джесси Эмонд, Бхувана Рамабхадран, Брайан Роарк, Педро Морено и Мин Ма. (2018) Подходы, основанные на транслитерации для улучшения производительности распознавания речи , семинар по технологиям разговорной языка IEEE (SLT) [Paper]
- Ganji Sreeram и Rohit Sinha. (2018) Использование частей речи для улучшения текстового моделирования данных переключения кодов . 2018 Двадцать четвертая национальная конференция по коммуникациям (NCC) [Paper]
- Garg, et al. (2018) Языковые модели с кодом с использованием двойных RNNS и предварительной подготовки в одном источнике . Emnlp [Paper]
- Эвальд Ван дер Вестуйзен и Томас Р. Нислер. (2018) синтезировали биграмы, используя Word Enterdings для ASR, связанного с кодом из четырех пар, южноафриканских языковых пар . Компьютерная речь и язык [бумага]
- Biswal, et al. (2018) Многоязычное акустическое моделирование нейронной сети для ASR речи с недооцененным английским изизулу . Межспика [бумага]
- Winata, et al. (2018) Моделирование языка переключения кода с использованием многозадачного обучения синтаксиса . 3-й семинар по вычислительным подходам к лингвистическому переключению кода, ACL [Paper] [Код]
- Chandu, et al. (2018) Языковое информированное моделирование текста, включенного в код . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Pratapa, et al. (2018) Языковое моделирование для смешивания кода: роль лингвистических теоретических синтетических данных . ACL [Paper]
- Sivasankaran, et al. (2018) Слияние телефона для распознавания речи, связанных с кодом . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Garg, et al. (2018) Модели с двумя языками для распознавания речи переключенных кодов . Межспика [бумага]
- Baheti, et al. (2017) Дизайн учебного плана для переключения кода: эксперименты с идентификацией языка и моделированием языка с глубокими нейронными сетями . Икона [бумага]
- Adel, et al. (2015) Синтаксические и семантические функции для моделей с переключением кодов . IEEE транзакции по аудио, речи и языковой обработке [Paper]
- Инг Ли и Паскаль Фунг. (2014) Моделирование языка переключения кода с функциональным ограничением головы . Icassp [бумага]
- Инг Ли и Паскаль Фунг. (2014) Языковое моделирование с функциональным ограничением головы для распознавания речи переключения кода . Emnlp [Paper]
- Adel, et al. (2013) Сочетание повторяющихся нейронных сетей и факторизованных языковых моделей для моделирования языка переключения кода . ACL [Paper]
- Adel, et al. (2013) Рецидивирующее моделирование языка нейронной сети для переключения кода разговорной речи . Icassp [бумага]
- Vu, et al. (2012) Первая система распознавания речи для разговорной речи мандарин-английского языка . Icassp [бумага]
- Инг Ли и Паскаль Фунг. (2012) Языковая модель переключения кода с ограничениями инверсии для распознавания речи смешанного языка . Coling [Paper]
- Li, et al. (2011) Асимметричное акустическое моделирование смешанной языковой речи . Icassp [бумага]
Дискурс
- Sravani, et al. (2021) Анализ политического дискурса: тематическое исследование смешивания кода и переключения кода в политических речах . Материалы 5 -го семинара по вычислительным подходам к переключению кода (CALS), NAACL [Paper]
Поколение
- Gupta, et al. (2020) Полубезопасенный подход к созданию смешанного кода текста с использованием предварительно обученного энкодера и обучения передачи . Результаты EMNLP [Paper]
- Брайан Грегориус и Такеши Окадоме (2022) генерируют текст, переключаемый с кодом из одноязычного текста с деревом зависимости . 20 -й ежегодный семинар Австралийской ассоциации языковых технологий [Paper] [Код]
Синтез речи
- Саи Кришна Раллабанди и Алан У. Блэк (2019) Вариационное внимание с использованием артикуляционных априоров для создания смешанной речи кода с использованием одноязычных корпораций . Межспика [бумага]
- Саи Кришна Раллабанди и Алан У. Блэк (2017) по строительству смешанных систем синтеза с лингвальной речью. Межспика [бумага]
- Chandu, et al. (2017) Синтез речи для навигационных инструкций смешанного языка. Межспика [бумага]
Показатель
- Guzman, et al. (2017) Метрики для моделирования переключения кодов по корпусам . Межспика [бумага]
Представительное обучение
- Adilazuarda, et al. (2023) Indorobusta: к надежности против разнообразных индонезийских местных языков, смешанных в коде . Материалы первого семинара по масштабированию многоязычной оценки, AACL [Paper] [CODE]
- Prasad, et al. (2021) Эффективность обучения промежуточной задаче для понимания естественного языка, связанного с кодом . Материалы 1 -го семинара по многоязычному обучению представления, EMNLP [Paper]
- Winata, et al. (2021) Эффективны ли многоязычные модели при переключении кода? Полем Материалы 5 -го семинара по вычислительным подходам к переключению кода (CALS), NAACL [Paper]
- Rizal, et al. (2020) Оценка встроенных слов для индонезийского-английского текста с кодом смешанного на основе синтетических данных . Материалы 4 -го семинара по вычислительным подходам к переключению кода (CALS), LREC [Paper]
- Winata, et al. (2019) Иерархические мета-эмбединги для переключения кода по имени EMNLP [Paper] [Код]
- Pratapa, et al. (2018) Вставки Word для обработки языка смешанного кода . Emnlp [Paper]
Машинный перевод
- Pengpun, et al. (2024) При создании перевода машин, переключенного в коде, в медицинском домене. Emnlp [Paper]
- Gaser, et al. (2023) Изучение подходов к сегментации для перевода нейронной машины, переключенного в коде египетского арабско-английского текста . EACL [Paper]
- Kuwanto, et al. (2021) Учебная программа с низким ресурсом . Arxiv [бумага]
- Vivek Srivastava и Mayank Singh (2020) Phinc: параллельный корпус в социальных сетях Hinglish для машинного перевода . W-nut, emnlp [Paper] [Набор данных]
- Тудам Дорен Сингх и Тамар Солорио. (2017) для перевода комментариев смешанных кодов из социальных сетей . Cicling [бумага]
Речевой перевод
- Alastruey, et al. (2023) На пути к потоковой речи в реальном мире для речи с переключенной кодом . Calcs, emnlp [Paper]
Понимание естественного языка
- Krishnan, et al. (2021) Многоязычное переключение кода для нулевого выстрела перекрестного прогнозирования намерений и заполнения слотов . MRL, EMNLP [Paper]
Названное признание сущности
- Приядхаршини и др. (2020) Названное признание организации для индийского корпуса, смешанного с кодом, с использованием Meta Entusting . 6 -я Международная конференция по передовым компьютерным и коммуникационным системам (ICACCS) [Paper]
- Winata, et al. (2019) Изучение многоязычного мета-внедрения для переключения кодов по имени Означение сущности . Repl4nlp, ACL [Paper] [Код]
- Aguilar, et al. (2018) названо распознавание объектов на данных, включенных в код: обзор общей задачи CALS 2018 . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Wang, et al. (2018) Объединенное кодовое распознавание объектов с внедрением внимания . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Winata, et al. (2018) Двуязычное представление символов для эффективного решения слов вне вокалука в переключении кода с именем распознавания сущности . 3-й семинар вычислительных подходов к лингвистическому переключению кода, ACL [Paper]
- Aguilar, et al. (2017) многозадачный подход для распознавания именованных организаций в данных в социальных сетях . 3-й семинар по шумному пользовательскому тексту, EMNLP [Paper]
Лингвистика
- Ли Нюйен. (2018) Заимствование или переключение кода? Следы общинных норм в вьетнамской английской речи. Австралийский журнал лингвистики 38,4 (2018): 443-466. [Бумага]
- Фэйрчайлд, Сара и Джанет Г. Ван Ад. (2017) Определитель-дефект-завод на кодовые переключения в испанском наследии. Билингвиализм: язык и познание 20.1 (2017): 150-161. [Бумага]
- Бхатт, Ракеш М. и Агнес Болоняй. (2011) Переключение кодов и оптимальная грамматика использования двуязычного языка. Билингвизм: язык и познание 14.4 (2011): 522-546. [Бумага]
- Липски (2005) переключение кода или заимствование? Нет, так не дезир, вы знаете. Второй семинар по испанской социолингвистике [бумага]
- Роберто Р. Эедиа и Джанетт Алтариба (2001). Смешивание двуязычного языка: почему двуязычные коды переключатель? Sage Publications [Paper]
- Belazi, et al. (1994) Кодовое переключение и теория X-BAR: функциональное ограничение головы . Лингвистическое исследование, том 25 № 2 пружина [бумага]
- Shana Poplack (1980) Иногда я начну предложение в испанском y termino en espanol: к типологии переключения кода1 . Лингвистика 18 (7-8) [бумага]
- Pfaff, Carol W. (1979) Ограничения на микширование языка: интрасценциальное переключение кода и заимствование на испанском/английском языке. Язык: 291-318. [Бумага]
- Shana Poplack (1978) Синтаксическая структура и социальная функция переключения кода . Тол. 2. Centro de estudios Puertorriquños, городской университет Нью -Йорка [Paper]
- Gumperz, JJ, & Hernandez, E. (1969) Когнитивные аспекты двуязычного общения . Институт международных исследований, Калифорнийский университет [Документ]
Аффективные вычисления
- Чакраварти и др. (2021) Dravidiancodemix: Анализ настроений и набор данных идентификации языка на атакующем языке для дравидийских языков в тексте с кодом смешанного . Arxiv [paper] [код и набор данных]
- Сиддхарт Ядав (2020). Неконтролируемый анализ настроений для данных, смешанных по коду . Arxiv [paper] [код]
- Wang, et al. (2017) Анализ эмоций в тексте переключения кода с моделью графика совместного фактора . IEEE/ACM Транзакции по аудио, речи и языковой обработке [Paper]
- Wang, et al. (2016) Двуязычная сеть внимания для прогнозирования эмоций, связанных с кодом . Coling [Paper]
- София Ли и Чжунцин Ван (2015) Эмоции в текстах переключения кодов: строительство и анализ корпуса . Труды восьмого семинара Sighan по обработке китайского языка [Paper]
- Wang, et al. (2015) Обнаружение эмоций в текстах переключения кодов с помощью двуязычной и сентиментальной информации . ACL [Paper]
Диалог и разговорная система
- Gupta, et al. (2018) Раскрытие проблем с смешанными кодом: основа для лингвистически управляемого генерации вопросов и ответа на нейронные вопросы . Conll [Paper]
Дискурс
- Sravani, et al. (2021) Анализ политического дискурса: тематическое исследование смешивания кода и переключения кода в политических речах . Calls Complyss of 5 -го семинара по вычислительным подходам к переключению кода (Calcs), NAACL [Paper]
Синтаксис
- Kodali, et al. (2022) Symcom-синтаксическая мера кода, смешивая исследование кода-смешивания английского языка . Результаты ACL [Paper]
- Özlem çetinoglu и çgrı çöltekin (2019) Проблемы аннотирования деревьев переключающего кода . SyntaxFest [Paper]
Состязательная атака
- Самсон Тан и Шафик Йоти (2021) Кодовой смешивание на улице Сезам: Рассвет состязательных полиглотов . Naacl [бумага]
Социальная лингвистика
- Bolock, et al. (2020) Кто, когда и почему: 3 ws переключения кода . Международная конференция по практическому применению агентов и многоагентных систем [Paper]
- Yoder, et al. (2017) Переключение кода как социальное акт: случай арабских страниц разговоров Википедии . Материалы второго семинара по обработке естественного языка и вычислительной социальной науке, ACL [Paper]
- Agrawal, et al. (2017) Agarwal, Prabhat, et al. Я могу говорить на английском языке, но Gaali Toh Hindi Mein Hi Denge: изучение англо-хинди, переключающе и ругательство в социальных сетях . Международная конференция по системам связи и сетям (COMSNETS) [Paper]
Эталон
- Khanuja, et al. (2020) Gluecos: эталон оценки для переключенного кода NLP . ACL [Paper]
- Aguilar, et al. (2020) Lince: централизованный эталон для лингвистической оценки переключения кодов . Lrec [Paper]
Социальные сети
- Бали и др. (2014) «Я заимствую тебя микширование?» Анализ микширования кода английского иинди в Facebook . Материалы первого семинара по вычислительным подходам к переключению кода [Paper]
Нормализация текста
- Dwija Parikh и Thamar Solorio (2021) Нормализация и обратная транслитерация для данных, выполняемых кодами . Calls Complyss of 5 -го семинара по вычислительным подходам к переключению кода (Calcs), NAACL [Paper]
Инструментарий
Синтетическое генерация данных инструментарий
- Jayanthi, et al. (2021) Codemixednlp: расширяемый и открытый инструментарий NLP для смешивания кода . Calls Toolings of 5 -го семинара по вычислительным подходам к переключению кода (Calcs), NAACL [Paper] [CODE]
- Rizvi, et al. (2021) GCM: инструментарий для генерации синтетического текста, смешанного с кодом . EACL (Системные демонстрации) [Paper] [Код]
Аннотация инструментария
- Shah, et al. (2019) COSSAT: инструмент речевой аннотации с переключенным кодом . Материалы первого семинара по агрегированию и анализе краудсорсинговых аннотаций для NLP [Paper]
Суммирование
- Mehnaz, et al. (2021) Гупшуп: суммирование разговоров с открытым доменом . Emnlp
Ответ на вопрос
- Gupta, et al. (2020) Унифицированная структура для многоязычного и смешанного на коде ответа на визуальный вопрос . AACL-IJCNLP [TBA]
Диалог и разговорная система
- Bawa, et al. (2020) Предпочитают ли многоязычные пользователи-боты в чате этого кодового смеси? Давайте подталкиваем и узнаем! Полем ACM на взаимодействии человека с компьютером [бумага]
- Banerjee, et al. (2018) Набор данных для систем разговоров, ориентированных на строительство, ориентированных на строительство . Coling [Paper]
Позиционная бумага
- Nguyen, et al. (2022) Создание образовательных технологий для переключения кода: текущая практика, трудности и будущие направления . Языки [бумага]
Книги
- Caciullos и Travis (2018) Бингвиализм в сообществе . Издательство Кембриджского университета
Тезисы
- Genta Indra Winata (2021) Многоязычное переносное обучение для языка, связанного с кодом и речевого нейронного моделирования . [Тезис]
- Густаво Агилар ( 2020 ) . [Тезис]
- Виктор Сото Мартинес (2020) Идентификация и моделирование языка, переключенного кодом . [Тезис]