
Dieses Dokument zielt darauf ab, die Fortschritte in der vietnamesischen Verarbeitung natürlicher Sprache zu verfolgen und einen Überblick über die hochmodernen (SOTA) über die häufigsten NLP-Aufgaben und ihre entsprechenden Datensätze zu geben.
Ziel ist es, sowohl traditionelle als auch Kern-NLP-Aufgaben wie Abhängigkeitsanalyse und Speech-Markierungen sowie neuere wie Leseverständnis und Inferenz für das Leseverständnis und die Inferenz für natürliche Sprache abzudecken. Das Hauptziel ist es, dem Leser einen kurzen Überblick über benchmark datasets und die state-of-the-art für ihre Aufgabe von Interesse zu geben, die als Sprungbrett für weitere Forschung dient. Zu diesem Zweck wird der Leser dort hingewiesen, wenn es einen Ort gibt, an dem die Ergebnisse für eine Aufgabe bereits veröffentlicht und regelmäßig public leaderboard werden.
Satzgrenze Disambiguation / Spracherkennung / Textnormalisierung / Rechtschreibkorrektur
Wortsegmentierung / Teil des Speech-Tagging / Chunking / Parsing
Textklassifizierung / Stimmungsanalyse / Worteinbettungen
Bezeichnete Entitätserkennung / Beziehungsextraktion / Ereignisextraktion / Informationsextraktion / Keyword -Extraktion
Koreferenzauflösung / Schlitzfüllung / Entitätsverbindung
Semantik / semantische Rollenkennzeichnung / Paraphrase Identifizierung / natürliche Sprachinferenz
Maschinelle Übersetzung / automatische Zusammenfassung
Wissensdarstellung und Argumentation
Dialogsysteme und Chatbots / Sprachgenerierung / Fragenbeantwortung
Automatische Spracherkennung / Text zur Sprach- / Sprachklassifizierung / Sprache
Optische Texterkennung / Bildunterschrift
RessourcenWenn Sie ein neues Ergebnis hinzufügen möchten, können Sie dies mit einer Pull -Anfrage (PR) tun. Um das Geräusch zu minimieren und die Wartung etwas überschaubar zu machen, werden die in veröffentlichten Artikel angegebenen Ergebnisse bevorzugt (geben Sie den Veranstaltungsort der Veröffentlichung in Ihrem PR an). Eine Ausnahme kann für einflussreiche Vordrucks gemacht werden. Das Ergebnis sollte den Namen der Methode, das Zitat, die Punktzahl und einen Link zum Papier enthalten und sollten hinzugefügt werden, damit die Tabelle sortiert wird (mit dem besten Ergebnis oben).
Wenn Ihre Pull -Anfrage ein neues Ergebnis enthält, stellen Sie sicher, dass das "neue Ergebnis" irgendwo im Titel der PR erscheint. Auf diese Weise können wir verfolgen, welche Aufgaben am aktivsten sind und die größte Aufmerksamkeit erhalten.
Um die Reproduktion zu vereinfachen, empfehlen wir, zu einer Implementierung zu einer Implementierung zu jeder Methode hinzuzufügen, falls verfügbar. Sie können der Tabelle eine Code (siehe unten) hinzufügen, wenn sie nicht vorhanden ist. Geben Sie in der Spalte Code eine offizielle Implementierung mit Beamter an. Wenn eine inoffizielle Implementierung verfügbar ist, verwenden Sie den Link (siehe unten). Wenn keine Implementierung verfügbar ist, können Sie die Zelle leer lassen.
| Modell | Punktzahl | Papier/Quelle | Code |
|---|---|---|---|
| Offiziell | |||
| Link |
Befolgen Sie die folgenden Schritte, um einen neuen Datensatz oder eine neue Aufgabe hinzuzufügen. Alle neuen Datensätze sollten für die Bewertung in mindestens einem veröffentlichten Papier verwendet werden, der den Datensatz eingeführt hat.
| Modell | Punktzahl | Papier/Quelle | Code |
|---|---|---|---|