NLP Vietnamese progress
1.0.0

本文檔旨在跟踪越南自然語言處理的進度,並概述最常見的NLP任務及其相應數據集中的最先進(SOTA) 。
它旨在涵蓋傳統和核心NLP任務,例如依賴解析和言論部分標籤,以及更新的諸如閱讀理解和自然語言推斷之類的諸如依據。主要目的是為讀者提供benchmark datasets的快速概述,以及為他們感興趣的任務提供state-of-the-art ,該任務是進一步研究的墊腳石。為此,如果有一個已經發布和定期維護任務結果的地方,例如public leaderboard ,讀者將在那裡指向。
句子邊界歧義 /語言檢測 /文本歸一化 /拼寫校正
單詞分割 /詞性標記 /分解 /解析
文本分類 /情感分析 /單詞嵌入
命名實體識別 /關係提取 /事件提取 /信息提取 /關鍵字提取
核心分辨率 /插槽填充 /實體鏈接
語義 /語義角色標籤 /釋義標識 /自然語言推斷
機器翻譯 /自動摘要
知識代表和推理
對話系統和聊天機器人 /語言生成 /問題回答
自動語音識別 /語音 /語音分類 /語音的文字
光學文本識別 /圖像字幕
資源如果您想添加新結果,則可以使用拉動請求(PR)進行操作。為了最大程度地減少噪聲並使維護有些可管理,將首選已發表的論文報告的結果(表示您的PR中的出版物場所);有影響力的預印本可能會例外。結果應包括該方法的名稱,引文,分數以及紙張的鏈接,並應添加表格,以便對錶進行排序(最佳結果)。
如果您的拉請請求包含新結果,請確保“新結果”出現在PR標題中。這樣,我們可以跟踪哪些任務是最活躍的,並受到最多關注。
為了使復制更容易,我們建議在可用的情況下添加到實現的鏈接。如果不存在,則可以將Code列(請參見下文)添加到表。在Code ”列中,指示正式實施的正式實施。如果有非官方實施,請使用鏈接(請參見下文)。如果沒有實現,則可以將單元格留為空。
| 模型 | 分數 | 紙/來源 | 代碼 |
|---|---|---|---|
| 官方的 | |||
| 關聯 |
要添加新的數據集或任務,請按照以下步驟操作。除了介紹數據集外,任何新的數據集都應在至少一篇論文中用於評估。
| 模型 | 分數 | 紙/來源 | 代碼 |
|---|---|---|---|