be_nlp_speech_resources下載be_nlp_speech_resources源代碼下載

中文(繁体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首頁>編程相關>Ai源碼

be_nlp_speech_resources

Ai源碼

1.0.0

下載

白俄羅斯NLP和語音處理資源

該存儲庫包含與白俄羅斯自然語言以及語音處理資源和數據集的鏈接。

它的靈感來自烏克蘭語音處理資源的類似項目：egorsmkv/secement-cognition-uk

托多斯：

在列表項目中添加詳細說明
評估基準測試模型並記錄其性能

？語音到文本

？實施

在公共語音8 + KENLM語言模型上受過訓練的公共語音8：
- 型號：ALES/WAV2VEC2-CV-BE
- 演示：ALES/WAV2VEC2-CV-BE-LM
- 代碼：Navalnica/wav2Vec2-Belarusian
耳語：
- 原始的Openai/Whisper模型
- 在白俄羅斯普通語音11數據集上微調的耳語模型：
  - 小聲說：
    - 型號：啤酒/竊竊私語的貝拉魯斯人
    - 在CommunVoice11： 6.79上測試
    - 演示：啤酒/竊竊私語的貝拉魯斯人
    - 代碼：Navalnica/Whisper-Finetuning-Be
  - 耳語基地：
    - 型號：啤酒/耳語基礎 - 貝拉魯斯人
    - 代碼：Navalnica/Whisper-Finetuning-Be
NVIDIA NEMO模型：
- nvidia/stt_be_conformer_ctc_large
  - [Huggingface自我報告的度量]在CommunVoice 10： 4.8上測試
- nvidia/stt_be_conformer_transducer_large
  - [Huggingface自我報告的度量]在CommunVoice 10： 3.8上測試
- nvidia/stt_be_fastConformer_hybrid_large_pc
  - [Huggingface自我報告的度量]在CommunVoice12： 2.72上測試
  - [Huggingface自我報告的度量]測試p＆c commonVoice12： 3.87
ESPNET：
- ESPNET/BERARUSIAN_COMMONVOICE_BLSTM

？基準

模型比較由數據集分組。托多

？數據集

常見的聲音。語音識別數據集
來自Knihi.com的數據集。 TODO：數據集的類型是什麼？
Google/Fleurs
SSRLAB：托多。語音識別數據集

？文本到語音

？實施

Coquiai實施
- JHLFRFUFYFN/BEL-TTS。 Glowtts + Hifigan
  - 代碼
  - 模型
  - 在擁抱面上的演示
  - 自定義網頁上的演示。演示頁面的源代碼：此處
- Alex73/Belarusian-TTS。 Yurii Paniv（@Robinhad）的Coquiai實施。
  原始倉庫和模型已刪除 - 現在只有叉

NLP

POS標記

Koichiyasuoka/Roberta-Small-Belarusian-Upos
Stanfordnlp/stanza-be
poritski/yabc_tagger。基於規則的Pos-Tagger和Lemmatizer。
用珀爾寫。將Poritski/YABC用作語法基礎（？）
Volchek/Beltagger。 Poritski/Yabc_tagger規則的改進版本，基於Pos-Tagger和Lemmatizer。
跨平台，用C ++編寫。
已知問題：
- 需要在Windows-1251中解釋輸入數據，不支持UTF-8；
- 標籤集與BNKorpus的標籤和語法基礎不完全兼容
- 使用的語法基礎不夠飽滿。白俄羅斯/grammardb是一個更好的範式來源，但尚未合併
- 後綴表計算腳本未從Perl移植到C ++
- 代碼使用Boost Libarary

其他

PKASILA/BEL -SKLONY-與白俄羅斯名詞Declension的網頁。演示：sklony.pkasila.net

蒙版語言建模

Koichiyasuoka/Roberta-Small-Belarusian

數據集

奧斯卡
MC4
poritski/yabc -эксперы執ы完全
白俄羅斯/grammardb-白俄羅斯語言的語法數據庫
tsimafeip/translator-與俄羅斯 - 貝拉魯斯翻譯對的數據集
通用依賴關係數據集：
- 頁
- GitHub存儲庫
tatoeba白俄羅斯句子

？ ‍♀️？社區和平台：

BY語料庫
ssrlab.by
bnkorpus.info
Github上的白俄羅斯組織
nlproc.通過github的社區

？未分類

現在什麼都沒有

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-08-19
大小 2.45KB
來自於 Github

相關應用

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
麗華資料分析引擎免費版3.0_搜尋_導航_採集_輿情_排行_api

2022-06-28

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部