NLP Vietnamese progress
1.0.0

本文档旨在跟踪越南自然语言处理的进度,并概述最常见的NLP任务及其相应数据集中的最先进(SOTA) 。
它旨在涵盖传统和核心NLP任务,例如依赖解析和言论部分标签,以及更新的诸如阅读理解和自然语言推断之类的诸如依据。主要目的是为读者提供benchmark datasets的快速概述,以及为他们感兴趣的任务提供state-of-the-art ,该任务是进一步研究的垫脚石。为此,如果有一个已经发布和定期维护任务结果的地方,例如public leaderboard ,读者将在那里指向。
句子边界歧义 /语言检测 /文本归一化 /拼写校正
单词分割 /词性标记 /分解 /解析
文本分类 /情感分析 /单词嵌入
命名实体识别 /关系提取 /事件提取 /信息提取 /关键字提取
核心分辨率 /插槽填充 /实体链接
语义 /语义角色标签 /释义标识 /自然语言推断
机器翻译 /自动摘要
知识代表和推理
对话系统和聊天机器人 /语言生成 /问题回答
自动语音识别 /语音 /语音分类 /语音的文字
光学文本识别 /图像字幕
资源如果您想添加新结果,则可以使用拉动请求(PR)进行操作。为了最大程度地减少噪声并使维护有些可管理,将首选已发表的论文报告的结果(表示您的PR中的出版物场所);有影响力的预印本可能会例外。结果应包括该方法的名称,引文,分数以及纸张的链接,并应添加表格,以便对表进行排序(最佳结果)。
如果您的拉请请求包含新结果,请确保“新结果”出现在PR标题中。这样,我们可以跟踪哪些任务是最活跃的,并受到最多关注。
为了使复制更容易,我们建议在可用的情况下添加到实现的链接。如果不存在,则可以将Code列(请参见下文)添加到表。在Code ”列中,指示正式实施的正式实施。如果有非官方实施,请使用链接(请参见下文)。如果没有实现,则可以将单元格留为空。
| 模型 | 分数 | 纸/来源 | 代码 |
|---|---|---|---|
| 官方的 | |||
| 关联 |
要添加新的数据集或任务,请按照以下步骤操作。除了介绍数据集外,任何新的数据集都应在至少一篇论文中用于评估。
| 模型 | 分数 | 纸/来源 | 代码 |
|---|---|---|---|