Развитие знаний по конкретным задачам от BERT в простые нейронные сети
Насколько эффективно увеличение данных, влияющих на задачу, для предварительных трансформаторов?
Пришло время морфина! Борьба с лингвистической дискриминацией с помощью инфлекционных возмущений
Обзор
Визуальный обзор увеличения данных в NLP
Независимое от задачи увеличение данных для NLP
Крепкая, непредвзятая обработка естественного языка PDF
Методы
Общий
случайная вставка, удаление, слово, перетасовка предложения
Замена слов синонимами
Замените слова от дицификационного от той же лейбла
Нор
Возмущения (буква, слово или уровень предложения)
Noisemix
Языковая модель
Контекстуальное увеличение
Задний перевод
Машинное трасляция
Перевод в оба конца
Парафатическое
Параллельные тела с низким ресурсом
中文文本纠错任务
Используйте внешние данные
Использование внешних данных, полученных из Википедии. Связывая статьи в Википедии с произвольным входным текстом. Идея состоит в том, что если бы входной текст был в Википедии, он имел бы ссылки на другие статьи в Википедии (которые являются семантически связанными и предоставляют дополнительную информацию).
Разбить входной текст на n-граммы
Проверьте, существует ли каждый N-грамм в качестве статьи в Википедии, чтобы создать набор «ссылок кандидатов»
Обрезать ссылки кандидата, вычисляя сходство входного текста и аннотация каждого кандидата
Разговорные системы
фонтан
Понимание прочитанного
Замена и перестановка сущности
Генерировать сильные негативы на основе POS -тегов