Aumentação de dados do PNL
Papel
- Aumentação de dados não supervisionados
- Resposta de perguntas não supervisionadas por tradução de cloze
- Distilação de conhecimentos específicos da tarefa de Bert em redes neurais simples
- Quão eficaz é o aumento de dados agnósticos de tarefas para transformadores pré-gravados?
- É hora de morfin! Combatendo a discriminação linguística com perturbações flexíveis
Visão geral
- Uma pesquisa visual com aumento de dados na PNL
- Aumento de dados independente de tarefas para PNL
- Processamento de linguagem natural robusto e imparcial
Métodos
- Em geral
- Inserção aleatória, exclusão, palavra, frase embaralhada
- Substituindo palavras por sinônimos
- Substitua as palavras do dicicionário do mesmo rótulo
- Perturbações (carta, palavra ou nível de frase)
- Modelo de idioma
- Back tradução
- Tradução de ida e volta
- Parafasar
- Corpusos paralelos de baixo recurso
- 中文文本纠错任务
- Aproveite os dados externos
- Usando dados externos derivados da Wikipedia. Vinculando artigos da Wikipedia ao texto de entrada arbitrária. A idéia é que, se o texto de entrada estivesse na Wikipedia, ele teria links para outros artigos da Wikipedia (que estão semanticamente relacionados e fornecem informações adicionais).
- Quebre o texto de entrada em n-gramas
- Verifique se cada n-grama existe como um artigo da Wikipedia para criar um conjunto de 'links de candidatos'
- podar o candidato vincula -se ao calcular a semelhança do texto de entrada e o resumo de cada candidato
- Sistemas de conversação
- Compreensão de leitura
- Substituição e permutação de entidades
- Gerar fortes negativos com base em tags de POS
Biblioteca