
이 문서는 베트남 자연 언어 처리 의 진행 상황을 추적하고 가장 일반적인 NLP 작업 및 해당 데이터 세트에서 최첨단 (SOTA) 에 대한 개요를 제공하는 것을 목표로합니다.
의존성 구문 분석 및 부품 태그와 같은 전통적인 NLP 작업뿐만 아니라 독해력 및 자연 언어 추론과 같은 최근의 작업을 다루는 것을 목표로합니다. 주요 목표는 독자에게 benchmark datasets 에 대한 빠른 개요와 관심있는 임무를위한 state-of-the-art 정보를 제공하는 것입니다. 이는 추가 연구를위한 디딤돌 역할을합니다. 이를 위해 public leaderboard 와 같이 작업 결과가 이미 게시되고 정기적으로 유지되는 장소가있는 경우 독자가 지적됩니다.
문장 경계 명확성 / 언어 탐지 / 텍스트 정규화 / 철자 수정
워드 세분화 / 부품 태그 / 청킹 / 구문 분석
텍스트 분류 / 감정 분석 / 단어 임베딩
지명 된 엔티티 인식 / 관계 추출 / 이벤트 추출 / 정보 추출 / 키워드 추출
코퍼레이션 해상도 / 슬롯 충전 / 엔티티 링크
의미론 / 의미 론적 역할 라벨링 / 낙구 식별 / 자연 언어 추론
기계 번역 / 자동 요약
지식 표현과 추론
대화 시스템 및 챗봇 / 언어 생성 / 질문 응답
자동 음성 인식 / 연설 / 음성 분류 / 연설에 대한 텍스트
광학 텍스트 인식 / 이미지 캡션
자원새 결과를 추가하려면 풀 요청 (PR)을 사용하여 그렇게 할 수 있습니다. 소음을 최소화하고 유지 보수를 다소 관리하기 위해 공개 된 논문에보고 된 결과가 선호됩니다 (PR의 출판 장소를 나타냄). 영향력있는 전 프리 인트에 대한 예외가있을 수 있습니다. 결과에는 메소드 이름, 인용, 점수 및 용지 링크가 포함되어 있어야하며 테이블이 정렬되도록 추가해야합니다 (최상의 결과가 상단).
풀 요청에 새 결과가 포함 된 경우 PR 제목에 "새 결과"가 나타나는지 확인하십시오. 이런 식으로, 우리는 어떤 작업이 가장 활발한 작업을 추적하고 가장 많은 관심을받을 수 있습니다.
재생산을보다 쉽게하기 위해서는 가능한 경우 각 방법에 구현에 링크를 추가하는 것이 좋습니다. 존재하지 않는 경우 테이블에 Code 열 (아래 참조)을 추가 할 수 있습니다. Code 열에서 공식적인 공식 구현을 나타냅니다. 비공식 구현을 사용할 수있는 경우 링크를 사용하십시오 (아래 참조). 구현을 사용할 수없는 경우 셀을 비워 둘 수 있습니다.
| 모델 | 점수 | 종이/출처 | 암호 |
|---|---|---|---|
| 공식적인 | |||
| 링크 |
새 데이터 세트 또는 작업을 추가하려면 아래 단계를 따르십시오. 모든 새로운 데이터 세트는 데이터 세트를 도입 한 것 외에 최소한 하나의 게시 된 논문에서 평가에 사용되어야합니다.
| 모델 | 점수 | 종이/출처 | 암호 |
|---|---|---|---|