Sprachtechnologien für Russisch
Kommunikation
- https://t.me/speech_recognition_ru - Gruppe "Spracherkennung"
- https://t.me/speech_recognition - Gruppe in Englisch
- https://t.me/speechtech - Nachrichtensender
- https://t.me/betterdatacommunity/15 - Sprachgemeinschaft in Datacommunity
- https://t.me/voitsestuff https://t.me/voice_stuff_chat - Frappucinos Raum
- https://t.me/teraspace https://t.me/teraspace_chat - teras Raum
Kurse
- https://github.com/markovka17/dla
- https://github.com/yandexdataschool/speech_course
- https://github.com/severilov/dl- audio-course
- https://hugingface.co/learn/audio-couurse/en/chapter0/Introduction - Spielen Sie mit Soundmodellen HF
- https://www.youtube.com/playlist?list=plyg3whdp5cwvrxljxzblqiqtwy_qjkmz - Deep Learning for Audio
Daten für das Training
- https://github.com/salute-developers/golos
- https://github.com/snakers4/open_stt
- https://github.com/georgefedosev/deepspeech
- https://github.com/sovaai/sova-dataset
- https://www.openslr.org/96/ - Russian Librispeech
- https://commonvoice.mozilla.org/ru/datasets - MCV
Sprachsynthese
- https://www.caito.de/2019/01/03/the-m-ailabs-speech-dataset/-m-ailabs Dataset (von Librivox)
- https://rulan-corpus.github.io/
- https://github.com/sovaai/sova-tts
- https://hugingface.co/bene-ges/tts_ru_hifigan_ruslan
- https://github.com/alphacep/vosk-tts
- https://github.com/rhvoice
- https://github.com/snakers4/silero-models#text-tospech
- https://github.com/tera2space/teratts
- https://hugingface.co/mogr/xts--Ru-ipa
Sprachtransformationen
- https://www.Weights.gg/ru - eine Reihe von Modellen für RVC
- https: // 2ch- ai.gitgud.sit/wiki/speech/ - Schule und Dual
- https://lunaiproject.uwu.ai/ - russischer Diffsinger
- Es gibt eine Reihe von Telegrammkanälen, hauptsächlich schlammige Orientierung
General Counting for Synthese
- https://github.com/sovaai/sova-tts-tps
- https://github.com/snakers4/silero-models#text-enhancement
- https://github.com/snakers4/russian_stt_text_normalization
- https://www.kagghe.com/competitions/text-normalization-preussian--laguage/verview alte Wettbewerb für Kaggle
- https://github.com/ppleskov/text-normalization-chalenge-russian-laguage-one der Gewinner
- https://github.com/shigabeev/russian_tts_normalization
- https://github.com/saarus72/text_normalization/tree/dev - basierend auf Fred -T5
- https://github.com/den4ika/runorm - Zahlen in Text, Verarbeitung englischer Wörter, Offenlegung von Abkürzungen
- https://github.com/just-a/multilingual-text-parser
Stress, phonetische Wörterbücher und G2P
- https://github.com/reynoldsnlp/udar
- https://github.com/einhornus/russian_accentuation
- https://github.com/wilpert/ruphonetizer
- https://hugingface.co/bene-ges/ru_g2p_ipa_bert_large
- https://github.com/desklop/stressrnn
- https://github.com/nsu- arussian_g2p
- https://github.com/nsu- ai-team/russian_g2p_neuro
- https://github.com/suralmasha/Rutranscript
- https://github.com/mashapo/Russress
- https://hugingface.co/yagusev/ru-word-sstress-transformer
- https://github.com/aishutin/rustress
- https://github.com/koziev/stressModel
- https://github.com/mogr/omogre
- https://github.com/den4ika/ruaccent - Aufschlüsseler, Stress und Auflösung von Homographen
Wörterbuch
- https://github.com/reynoldsnlp/udar/blob/src/src/resources/src/tixonov.txt - Morphematum -orphographische Wörterbuch von Tikhonove
- http://aot.ru - Die Quelle des Wörterbuchs des Moors im Maschinenformat
- https://github.com/gramdict/gramdict - Eine moderne Version
- http://odict.ru/ - Eine weitere Entwicklung
- http://opencorpora.org/ - markiertes morphologisches Wörterbuch
- https://ru.wiktionary.org - wiktionary
- https://kaikki.org/dictionary/russian/ - Dump Wiktionary in einem bequemen Format
Yeufhores
- https://github.com/sovaai/sova-tts-tps
- https://github.com/e2yo/eyo-cernel
- https://github.com/kalashnikovisne/karamzin
- https://github.com/text-extend-tools/python-yoficator
- https://github.com/emacsmiror/yoficator
- https://github.com/unabashed/yoficator
Anerkennung von Emotionen
- https://github.com/aniemore/aniemore
- https://hugingface.co/xbgoose/hubert-lage-speech-motion-recognition-russian-dusha-finetified
- https://github.com/salute-developers/golos/tree/master/dusha
Spracherkennungsmodelle
Vergleich der Modelle hier.
- Vosk Small https://alphacephei.com/vosk/models/vosk-model-small-0.22.zip
- Vosk big 0.22 https://alphacephei.com/vosk/models/vosk-model-0.22.zip
- Vosk big 0.42 https://alphacephei.com/vosk/models/vosk-model-0.42.zip
- Nvidia rnnt groß https://hugingface.co/nvidia/stt_ru_conformer_transducer_large
- Whisper Medium https://github.com/openai/whisper
- Flüstermedium adaptiertes Medium https://hugingface.co/Mitcheldehaven/whisper-medium-rou
- Whisper adaptiert große https://hugingface.co/Mitcheldehaven/whisper-large-v2-u2-
- Wav2Veclm https://hugingface.co/jonatasgrosman/wav2vec2-xls-r --1b-russian
- Wav2Veclm Bond005 https://hugingface.co/bond005/wav2vec2-large-ru-golos (Version 03.2023)
- Grußcitrinet https://github.com/salute-developers/golos
- Funasr Russian https://modelscope.cn/models/damo/speech_uniasr_asr_2pass-6k-common-vocab1664-sorflow1-offline/summary
Nicht getestet (schlechter als Qualität)
- https://github.com/sovse/base_rus_whisper_stt
Linguistik (Wörter Listen, Morphologie)
- http://aot.ru
- https://natasha.github.io
Zeichensetzung und Titelbriefe
https://alphacephei.com/vosk/models/vosk-recasepunch-en-0.22.zip
https://hugingface.co/kontur-a/sbert_punch_case_ru
https://github.com/kotikkontantin/ru-upopunction
https://github.com/vlomme/bert-russian-punctual
https://github.com/lesha17/punctual
https://github.com/gleb-Skoobinsky/ru_punct
https://github.com/sviperm/neuro-commma
https://github.com/snakers4/silero-models
https://github.com/marlon-br/neuro-commma
https://github.com/sviperm/neuro-commma
https://github.com/averkij/multipunct
https://github.com/denisbeerezutskiy-lad/transcription-tbert-punctuator-scripts sugingface
https://hugingface.co/ai-forever/sage-fredt5-distilled-95m-set von SAGE-Modellen
Geschichte
- A.A. Grammatikwörterbuch
- OTipple ist eine Abteilung und eine Trennung der theoretischen und angewandten Sprachwissenschaft der Fakultät für Philologie der Moskauer State University
- Lobanov Boris Methodich
- IPPPI - Sorokin Victor Nikolaevich
- IPA Ras History
- Digitale Verarbeitung und Erkennung der Sprachsignale des WC Ras
Alphacep
- 2005 begann mit der Arbeit am Festival -Synthesizer
- Festlang Clunits
- Russische Sprache auf Voxforge
- Cmusphinx