be_nlp_speech_resources下载be_nlp_speech_resources源代码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

be_nlp_speech_resources

Ai源码

1.0.0

下载

白俄罗斯NLP和语音处理资源

该存储库包含与白俄罗斯自然语言以及语音处理资源和数据集的链接。

它的灵感来自乌克兰语音处理资源的类似项目：egorsmkv/secement-cognition-uk

托多斯：

在列表项目中添加详细说明
评估基准测试模型并记录其性能

？语音到文本

？实施

在公共语音8 + KENLM语言模型上受过训练的公共语音8：
- 型号：ALES/WAV2VEC2-CV-BE
- 演示：ALES/WAV2VEC2-CV-BE-LM
- 代码：Navalnica/wav2Vec2-Belarusian
耳语：
- 原始的Openai/Whisper模型
- 在白俄罗斯普通语音11数据集上微调的耳语模型：
  - 小声说：
    - 型号：啤酒/窃窃私语的贝拉鲁斯人
    - 在CommunVoice11： 6.79上测试
    - 演示：啤酒/窃窃私语的贝拉鲁斯人
    - 代码：Navalnica/Whisper-Finetuning-Be
  - 耳语基础：
    - 型号：啤酒/耳语基础 - 贝拉鲁斯人
    - 代码：Navalnica/Whisper-Finetuning-Be
NVIDIA NEMO模型：
- nvidia/stt_be_conformer_ctc_large
  - [Huggingface自我报告的度量]在CommunVoice 10： 4.8上测试
- nvidia/stt_be_conformer_transducer_large
  - [Huggingface自我报告的度量]在CommunVoice 10： 3.8上测试
- nvidia/stt_be_fastConformer_hybrid_large_pc
  - [Huggingface自我报告的度量]在CommunVoice12： 2.72上测试
  - [Huggingface自我报告的度量]测试p＆c commonVoice12： 3.87
ESPNET：
- ESPNET/BERARUSIAN_COMMONVOICE_BLSTM

？基准

模型比较由数据集分组。托多

？数据集

常见的声音。语音识别数据集
来自Knihi.com的数据集。 TODO：数据集的类型是什么？
Google/Fleurs
SSRLAB：托多。语音识别数据集

？文本到语音

？实施

Coquiai实施
- JHLFRFUFYFN/BEL-TTS。 Glowtts + Hifigan
  - 代码
  - 模型
  - 在拥抱面上的演示
  - 自定义网页上的演示。演示页面的源代码：此处
- Alex73/Belarusian-TTS。 Yurii Paniv（@Robinhad）的Coquiai实施。
  原始仓库和模型已删除 - 现在只有叉

NLP

POS标记

Koichiyasuoka/Roberta-Small-Belarusian-Upos
Stanfordnlp/stanza-be
poritski/yabc_tagger。基于规则的Pos-Tagger和Lemmatizer。
用珀尔写。将Poritski/YABC用作语法基础（？）
Volchek/Beltagger。 Poritski/Yabc_tagger规则的改进版本，基于Pos-Tagger和Lemmatizer。
跨平台，用C ++编写。
已知问题：
- 需要在Windows-1251中解释输入数据，不支持UTF-8；
- 标签集与BNKorpus的标签和语法基础不完全兼容
- 使用的语法基础不够饱满。白俄罗斯/grammardb是一个更好的范式来源，但尚未合并
- 后缀表计算脚本未从Perl移植到C ++
- 代码使用Boost Libarary

其他

PKASILA/BEL -SKLONY-与白俄罗斯名词Declension的网页。演示：sklony.pkasila.net

蒙版语言建模

Koichiyasuoka/Roberta-Small-Belarusian

数据集

奥斯卡
MC4
poritski/yabc -эксперы执ы完全
白俄罗斯/grammardb-白俄罗斯语言的语法数据库
tsimafeip/translator-与俄罗斯 - 贝拉鲁斯翻译对的数据集
通用依赖关系数据集：
- 页
- GitHub存储库
tatoeba白俄罗斯句子

？‍♀️？社区和平台：

BY语料库
ssrlab.by
bnkorpus.info
Github上的白俄罗斯组织
nlproc.通过github的社区

？未分类

现在什么都没有

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-19
大小 2.45KB
来自于 Github

相关应用

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
丽华数据分析引擎免费版3.0_搜索_导航_采集_舆情_排行_api

2022-06-28

为您推荐

chat.petals.dev

其他源码

1.0.0
GPT Prompt Templates

其他源码

1.0.0
GPTyped

其他源码

GPTyped 1.0.5
ML stack

Ai源码

1.0.0
awesome free chatgpt

Ai源码

1.0.0
pywin_contextmenu

Ai源码

Version update
Google Dorks

其他源码

1.0
shepherd

其他源码

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源码

v1.1.0-rc-3

相关资讯全部