be_nlp_speech_resources 다운로드 be_nlp_speech_resources 소스 코드 다운로드

다운로드

벨로루시 NLP 및 음성 처리 자원

이 저장소에는 벨로루시 자연 언어 및 음성 처리 자원 및 데이터 세트에 대한 링크가 포함되어 있습니다.

우크라이나어 스피치 프로세싱 리소스와 유사한 프로젝트에서 영감을 얻었습니다.

WAV2VEC2 Common Voice 8 + Kenlm Lang
- 모델 : ALES/WAV2VEC2-CV-BE
- 데모 : ALES/WAV2VEC2-CV-BE-LM
- 코드 : Navalnica/WAV2VEC2-Belarusian
속삭임:
- 원래 Openai/Whisper 모델
- 벨로루시 공동 음성 11 데이터 세트에서 미세 조정 된 속삭임 모델 :
  - 작은 속삭임 :
    - 모델 : Ales/Whisper-Small-Belarusian
    - CommonVoice11 : 6.79 에서 테스트
    - 데모 : Ales/Whisper-Small-Belarusian-Demo
    - 코드 : Navalnica/Whisper-Finetuning-be
  - Whisper Base :
    - 모델 : ALES/WHISPER-BASE-BELARUSIAN
    - 코드 : Navalnica/Whisper-Finetuning-be
NVIDIA NEMO 모델 :
- nvidia/stt_be_conformer_ctc_large
  - [Huggingface 자체보고 된 메트릭] CommonVoice10 : 4.8 에서 테스트
- nvidia/stt_be_conformer_transducer_large
  - [Huggingface 자체보고 된 메트릭] CommonVoice10 : 3.8 에서 테스트
- NVIDIA/STT_BE_FASTCONFORMER_HYBRID_LARGE_PC
  - [Huggingface 자체보고 된 메트릭] CommonVoice12 : 2.72 에서 테스트
  - [Huggingface 자체보고 메트릭] 테스트 Wer P & C CommonVoice12 : 3.87
ESPNET :
- ESPNET/BELARUSIAN_COMMONVOICE_BLSTM

데이터 세트별로 그룹화 된 모델 비교. TODO

Koichiyasuoka/Roberta-Small-Belarusian-upos
Stanfordnlp/Stanza-be
Poritski/yabc_tagger. 규칙 기반 Pos-Tagger 및 Lemmatizer.
Perl로 작성되었습니다. Poritski/Yabc를 문법베이스 (?)로 사용합니다.
Volchek/Beltagger. Poritski/YABC_Tagger 규칙 기반 POS-TAGGER 및 LEMMATIZER의 개선 된 버전.
C ++로 작성된 크로스 플랫폼.
알려진 문제 :
- Windows-1251에서 입력 데이터가 인코딩되어야하며 UTF-8을 지원하지 않습니다.
- Tagset은 Bnkorpus의 Tagset 및 Grammar Base와 완전히 호환되지 않습니다.
- 사용 된 문법베이스는 충분하지 않습니다. 벨로루시/Grammardb는 더 나은 패러다임 소스이지만 아직 통합되지 않았습니다.
- 접미사 테이블 계산 스크립트는 Perl에서 C ++로 포팅되지 않았습니다.
- 코드는 Boost Libarary를 사용합니다