Téléchargement shanghainese tts - Téléchargement du code source shanghainese tts

shanghainese tts

Code Source AI

2023.06.06

Télécharger

TTS Shanghaineais

Dartmouth Ling 48 Projet final: Amélioration des TT pour les shanghaineais
Yuanhao Chen [email protected] printemps 2023

But

Pour construire un système de texte à dispection (TTS) pour les shanghaineais à partir de zéro, cherchant à améliorer la production de Tone Sandhi par rapport aux modèles existants en accordant une attention particulière au prétraitement du texte.

Description

Voir écriture / main.pdf.

Dépendances

pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt  # for analysis of questionnaire results

Usage

Voir speech_synthesis/README.md .

Structure

phonemisation/ : contient le module de phonémisation
- Voir Explication de la sortie dans phonemisation/__init__.py
- Utilisation: python -m phonemisation "text to phonemise"
- Mécanisme: phrase chinoise - Segmentation des mots ⟶ Mots chinois - Romanisation ⟶ Shanghainese Pinyin - Phonémisation ⟶ Phonèmes shanghaineais
  - jieba est utilisée pour la segmentation des mots
  - Un dictionnaire shanghaineais que j'ai fait précédemment est utilisé pour la romanisation
    - Utilise le module Qieyun pour ajouter la tonalité numéro 1 aux syllabes de la tonalité 陰平yinping / inbin ; Les autres tons sont phonologiquement non marqués
  - La fonction romanisation_to_ipa dans romanisation.py contient la fonction de phonémisation
make_metadata.py : utilise le module phonemisation pour convertir la transcription en IPA et générer des métadonnées pour la formation
- Voir ci-dessous dans data/
data/ : contient l'ensemble de données utilisé pour la formation
- Les transcriptions et les fichiers audio sont adaptés de ce repo
  - Échantillonné à 16 kHz pour la formation
  - Actuellement, seul shh.dict.cn/ est utilisé pour la formation
- Les fichiers */metadata.txt sont générés par make_metadata.py
training/
- Cahier Juptyer pour la formation du modèle
- Destiné à être téléchargé et exécuté dans Google Colab Environment; doit être modifié pour un usage local
- Utilise le repo coqui-ai/TTS , qui contient une implémentation de VITS
writeup/ : l'écriture
speech_synthesis/ : contient le modèle de synthèse de la parole
- Voir speech_synthesis/README.md pour plus de détails
comparison_questionnaire/ : contient le questionnaire et les fichiers audio utilisés pour comparer la parole produite par ce modèle, le modèle Apple et un haut-parleur humain
- *-1.wav : produit par ce modèle
- *-2.wav : produit par Apple Voiceover (MacBook Pro 14 pouces, 2021; MacOS Ventura 13.0.1)
- *-3.wav : parlé par moi-même
- stats.ipynb : cahier Jupyter pour analyser les résultats du questionnaire

Développer

Informations supplémentaires

Version 2023.06.06
Type Code Source AI
Date de mise à jour 2025-08-22
taille 581.42MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Informations en anglais sur le développement vocal (TTS User Guide Delphi version)

2009-05-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout