Unbeaufsichtigte Frage zur Beantwortung der Übersetzung von Lückle
Destillieren aufgabenspezifisches Wissen von Bert in einfache neuronale Netze
Wie effektiv ist Aufgaben-agnostische Datenvergrößerung für vorbereitete Transformatoren?
Es ist Morphin 'Zeit! Bekämpfung der sprachlichen Diskriminierung mit Beugungstörungen
Überblick
Eine visuelle Übersicht über die Datenerweiterung in NLP
Aufgabenunabhängige Datenvergrößerung für NLP
Robuste, unvoreingenommene natürliche Sprachverarbeitung PDF
Methoden
Allgemein
zufällige Einfügung, Löschen, Wort, Satzschlurfen
Wörter durch Synonyme ersetzen
Ersetzen Sie die Wörter aus dem gleichen Etikett von Dicitionary
Ner
Störungen (Buchstaben, Wort oder Satzebene)
Noisemix
Sprachmodell
Kontextvergrößerung
Rückübersetzung
Maschinenverletzung
Hin- und Rückübersetzung
Berechtigt
Parallele Korpus mit niedriger Ressourcen
中文文本纠错任务
Nutzen Sie externe Daten
Verwenden externer Daten, die aus Wikipedia abgeleitet sind. Verknüpfung von Wikipedia -Artikeln mit willkürlichem Eingabetxt. Die Idee ist, dass, wenn der Eingabtext auf Wikipedia wäre, Links zu anderen Wikipedia -Artikeln (die semantisch verwandt sind und zusätzliche Informationen liefern).
Brechen Sie den Eingabetxt in N-Gramm ein
Überprüfen Sie, ob jedes N-Gramm als Wikipedia-Artikel existiert, um eine Reihe von "Kandidatenlinks" zu erstellen
Beschneiden Sie den Kandidatenverbindungen durch Berechnung der Ähnlichkeit des Eingabentextes und der Zusammenfassung jedes Kandidaten
Konversationssysteme
Brunnen
Leseverständnis
Entitätsersatz und Permutation
Generieren Sie starke Negative, die auf POS -Tags basieren