be_nlp_speech_resources download - be_nlp_speech_resources code source téléchargement

Télécharger

PNL biélorusse et ressources de traitement de la parole

Ce référentiel contient des liens vers les ressources et les ensembles de données de traitement du langage naturel et de la parole biélorusse.

Il est inspiré par un projet similaire avec les ressources de traitement de la parole ukrainiennes: Egorsmkv / Speech-Recognition-UK

WAV2VEC2 formé sur la voix commune 8 + modèle de langue Kenlm formé sur la voix commune 8:
- Modèle: Ales / Wav2Vec2-Cv-Be-Be
- Demo: Ales / wav2vec2-cv-be-lm
- Code: Navalnica / wav2vec2-belarusien
chuchoter:
- Modèles Openai / Whisper originaux
- Modèles Whisper ajustés sur la voix commune du Biélorusse 11 DataSet:
  - Chuchotement petit:
    - Modèle: Ales / Whisper-Small-Bearusan
    - test sur CommonVoice11: 6.79
    - Demo: Ales / Whisper-Small-Bearussian-Demo
    - Code: Navalnica / Whisper-Finetuning-Be
  - Base de chuchotement:
    - Modèle: Ales / Whisper-Base-Bearusan
    - Code: Navalnica / Whisper-Finetuning-Be
Modèles Nvidia Nemo:
- nvidia / stt_be_conformer_ctc_large
  - [Métrique autodéclarée de câlins] Test Wer sur CommonVoice10: 4.8
- nvidia / STT_BE_CONFORMER_TRANSDUCER_LARGE
  - [Métrique autodéclarée de câlins] Test Wer sur CommonVoice10: 3.8
- nvidia / stt_be_fastconformer_hybrid_large_pc
  - [Métrique autodéclarée de câlins] Test Wer sur CommonVoice12: 2.72
  - [Métrique autodéclarée de HuggingFace] Test Wer P&C CommonVoice12: 3.87
ESPNET:
- ESPNET / BELARUSIAN_COMMONVOICE_BLSTM

Comparaisons de modèles regroupées par ensemble de données. FAIRE

Koichiyasuoka / Roberta-Small-Bearusian-upos
Stanfordnlp / Stanza-Be
Poritski / yabc_tagger. Pos-Tagger basée sur des règles et lemmatizer.
Écrit en perl. Utilise Poritski / YABC comme base de grammaire (?)
Volchek / Beltagger. Une version améliorée de Poritski / YABC_TAGGER basée sur des règles de règle et de lemmatizer.
Multiplateforme, écrite en C ++.
Problèmes connus:
- nécessite des données d'entrée pour être incrofiées dans Windows-1251, ne prend pas en charge UTF-8;
- Tagset n'est pas entièrement compatible avec la base de tagset et de grammaire de Bnkorpus
- La base de grammaire utilisée n'est pas assez pleine. Le Bélarus / Grammardb est une meilleure source de paradigmes mais n'est pas encore incorporé
- Le script de calcul de la table de suffixe n'est pas porté de Perl à C ++
- Le code utilise Boost Libarary