Tecnologías del habla para ruso
Comunicación
- https://t.me/speech_recognition_ru - Grupo "Reconocimiento de voz"
- https://t.me/speech_recognition - Grupo en inglés
- https://t.me/speechtech - canal de noticias
- https://t.me/betterdatacommunity/15 - Comunidad del habla en DataCommunity
- https://t.me/voitsestuff https://t.me/voice_stuff_chat - Frappucino's Space
- https://t.me/teraspace https://t.me/teraspace_chat - el espacio de Tera
Cursos
- https://github.com/markovka17/dla
- https://github.com/yandexdataschool/speech_course
- https://github.com/severilov/dl- audio-course
- https://hugingface.co/learn/audio-couurse/en/chapter0/introduction - Reproducir con modelos de sonido HF
- https://www.youtube.com/playlist?list=plyg3whdp5cwvrxljxzblqiqtwy_qjkmz - aprendizaje profundo para audio
Datos para la capacitación
- https://github.com/salute-developers/golos
- https://github.com/snakers4/open_stt
- https://github.com/georgefedoseeV/deepspeech
- https://github.com/sovaai/sova-dataset
- https://www.openslr.org/96/ - Librispeech ruso
- https://commonvoice.mozilla.org/ru/datasets - MCV
Síntesis del habla
- https://www.caito.de/2019/01/03/the-m-ailabs-speech-dataset/-m-ilabs DataSet (de Librivox)
- https://ruslan-corpus.github.io/
- https://github.com/sovaai/sova-tts
- https://hugingface.co/bene-ges/tts_ru_hifigan_ruslan
- https://github.com/alphacep/vosk-tts
- https://github.com/rhvoice
- https://github.com/snakers4/silero-models#text-to-spech
- https://github.com/tera2space/teratts
- https://hugingface.co/mogr/xts-ru-ipa
Transformaciones de voz
- https://www.weights.gg/ru - un montón de modelos para RVC
- https: // 2ch- ai.gitgud.site/wiki/speech/ - escuela y dual
- https://lunaiproject.uwu.ai/ - Diffsinger ruso
- Hay un montón de canales de telegrama, principalmente orientación fangosa
Contando general para la síntesis
- https://github.com/sovai/sova-tts-tps
- https://github.com/snakers4/silero-models#text-enhancement
- https://github.com/snakers4/russian_stt_text_normalization
- https://www.kagghe.com/competitions/text-normalization-prussian-laguage/verview antiguo para kaggle
- https://github.com/pplekov/text-normalization-challenge-russian-laguage- one de los ganadores
- https://github.com/shigabeev/russian_tts_normalization
- https://github.com/saarus72/text_normalization/tree/dev - basado en Fred -T5
- https://github.com/den4ika/runorm - Números en texto, procesamiento de palabras en inglés, divulgación de abreviaciones
- https://github.com/just-a/multilingual-text-parser
Spreading Stress, diccionarios fonéticos y G2P
- https://github.com/reynoldsnlp/udar
- https://github.com/einhornus/russian_accentuation
- https://github.com/wilpert/rusphonetizer
- https://hugingface.co/bene-ges/ru_g2p_ipa_bert_large
- https://github.com/desklop/stressrnn
- https://github.com/nsu- arussian_g2p
- https://github.com/nsu- ai- Team/russian_g2p_neuro
- https://github.com/suralmasha/rutranscript
- https://github.com/mashapo/russtress
- https://hugingface.co/ilyagusev/ru-word-stressformer
- https://github.com/aishutin/RusSess
- https://github.com/koziev/stressmodel
- https://github.com/mogr/omogre
- https://github.com/den4ika/ruaccent - Yelifier, estrés y resolución de homógrafos
Diccionario
- https://github.com/reynoldsnlp/udar/blob/src/src/resources/src/tixonov.txt - morfematum -orfográfico de tikhonov
- http://aot.ru - La fuente del diccionario del pantano en el formato de la máquina
- https://github.com/gramdict/gramdict - una versión moderna
- http://odict.ru/ - otro desarrollo
- http://opencorpora.org/ - Diccionario morfológico marcado
- https://ru.wiktionary.org - Wiktionario
- https://kaikki.org/dictionary/russian/ - Dump Wiktionario en un formato conveniente
Yeephores
- https://github.com/sovai/sova-tts-tps
- https://github.com/e2yo/eyo-cernel
- https://github.com/kalhnikovisme/karamzin
- https://github.com/text-extend-tools/python-yoficator
- https://github.com/emacsmiror/yoficator
- https://github.com/unabashed/yoficator
Reconocimiento de emociones
- https://github.com/aniemore/aniemore
- https://hugingface.co/xbgoose/hubert-lage-speech-motion-recognition-russian-dusha-finetified
- https://github.com/salute-developers/golos/tree/master/dusha
Modelos de reconocimiento de voz
Comparación de modelos aquí.
- Vosk pequeño https://alphacephei.com/vosk/models/vosk-model-small-ru-0.22.zip
- Vosk Big 0.22 https://alphacephei.com/vosk/models/vosk-model-0.22.zip
- Vosk Big 0.42 https://alphacephei.com/vosk/models/vosk-model-0.42.zip
- Nvidia rnnt grande https://hugingface.co/nvidia/stt_ru_conformer_transducer_large
- Whisper Medium https://github.com/openai/whisper
- Whisper adaptado medio https://hugingface.co/mitcheldehaven/whisper-medium-ru
- Whisper adaptado grandes https://hugingface.co/mitcheldehaven/whisper-large-v2-u2-
- Wav2veclm https://hugingface.co/jonatasgrosman/wav2vec2-xls-r-1b-russian
- Wav2veclm bond005 https://hugingface.co/bond005/wav2vec2-large-ru-gros (versión 03.2023)
- Salute Citrinet https://github.com/salute-developers/golos
- Funasr ruso https://modelscope.cn/models/damo/speech_uniasr_asr_2pass-6k-common-vocab1664-tensorflow1 offline/summary
No probado (peor que la calidad)
- https://github.com/sovse/base_rus_whisper_stt
Lingüística (listas de palabras, morfología)
- http://aot.ru
- https://natasha.github.io
Puntuación y cartas de título
https://alphacephei.com/vosk/models/vosk---recasepunch-en-0.22.zip
https://hugingface.co/kontur-a/sbert_punch_case_ru
https://github.com/kotikkontantin/ru upoPunction
https://github.com/vlomme/bert-russian-punctual
https://github.com/lesha17/punctual
https://github.com/gleb-skobinsky/ru_punct
https://github.com/sviperm/neuro-commma
https://github.com/snakers4/silero-models
https://github.com/marlon-br/neuro-commma
https://github.com/sviperm/neuro-commma
https://github.com/averkij/multipunt
https://github.com/denis-berezutskiy-lad/transcription-bert-punctuator-scripts Hugingface
https://hugingface.co/ai-forever/sage-fredt5-distilled-95m-set de modelos de sabio
Historia
- AUTOMÓVIL CLUB BRITÁNICO. Diccionario gramática
- Otipple es un departamento y una separación de la lingüística teórica y aplicada de la Facultad de Filología de la Universidad Estatal de Moscú
- Lobanov Boris Methodich
- IPPPI - Sorokin Victor Nikolaevich
- Historia de IPA Ras
- Procesamiento digital y reconocimiento de las señales de habla del WC RAS
Alphacep
- 2005 comenzó a trabajar en el sintetizador del festival
- Festlang clunits
- Idioma ruso en Voxforge
- Cmusphinx