arduino simple tts

arduino simple tts

Code Source AI

October 2024 - Many Changes

Télécharger

Les microcontrôleurs n'ont pas suffisamment de ressources pour fournir une fonctionnalité de texte de haute qualité à la parole. Cependant, il peut souvent être assez bon de fournir une solution qui est basée sur un audio pré-enregistré.

Je me demandais les limites de cette approche et j'ai décidé de mettre en œuvre une petite bibliothèque Arduino prototype basée sur les outils audio Arduino pour la sortie audio.

Pour garder les choses simples, j'ai commencé avec une simple implémentation qui peut traiter les numéros et en plus de celle d'un autre qui lit le temps. Le point de départ est donc quelques classes qui traduisent les nombres en texte. Le texte est ensuite utilisé pour identifier les fichiers audio pré-enregistrés.

Cette fonctionnalité peut être utilisée, par exemple pour créer certains

horloges qui parlent
Écailles parlantes

Conversion en représentation de texte

Nombres à SMS

NumberTotext traduit l'entrée de numéro dans un vecteur audio_tools :: des mots. Dans les exemples suivants, nous les imprimons:

NumberToText ntt;

auto result = ntt.say( 700123.431 );

for ( auto str : result){
    Serial. print (str);
    Serial. print ( " " );
}

Le résultat est: sept cent mille cent vingt-trois points quatre trois un zéro zéro zéro

Il est temps d'envoyer des SMS

Pour traiter le temps dont vous avez besoin pour fournir les heures et les minutes en entrée.

TimeToText ttt;

auto result = ttt.say( 12 , 00 );

for ( auto str : result){
    Serial. print (str);
    Serial. print ( " " );
}

Le résultat est: midi

Nombres avec des unités

Vous pouvez également traiter les numéros avec les unités correspondantes

NumberUnitToText utt;

auto result = utt.say( 1.01 , " usd " );

for ( auto str : result){
    Serial. print (str);
    Serial. print ( " " );
}

Le résultat est: un dollar américain et un cent

Texte à la parole

Si nous enregistrons les mots dans MP3, nous pourrions même nous en sortir avec la nécessité d'un lecteur SD séparé car nous pouvons stocker l'audio dans la mémoire du programme. Les valeurs d'exampleaudictionaryary contient les fichiers MP3 préenregistrés qui sont stockés dans le progmem.

# include " SimpleTTS.h "
# include " AudioTools/AudioCodecs/CodecMP3Helix.h "

I2SStream i2s;  // audio output via I2S
MP3DecoderHelix mp3;  // mp3 decoder
AudioDictionary dictionary (ExampleAudioDictionaryValues);
TextToSpeech tts (i2s, mp3, dictionary);

void setup (){
    Serial. begin ( 115200 );
    // setup i2s
    auto cfg = i2s. defaultConfig (); 
    cfg. sample_rate = 24000 ;
    cfg. channels = 1 ;
    i2s. begin (cfg);

    tts. say ( " BILLION " );
}

void loop () {
}

Le mot "milliard" est prononcé via les I2.

Vous pouvez également utiliser les classes de génération de texte décrites ci-dessus:

# include " SimpleTTS.h "
# include " AudioTools/AudioCodecs/CodecMP3Helix.h "

TimeToText ttt; // Text source
I2SStream i2s;  // audio output via I2S
MP3DecoderHelix mp3;  // mp3 decoder
AudioDictionary dictionary (ExampleAudioDictionaryValues);
TextToSpeech tts (ttt, i2s, mp3, dictionary);

void setup (){
    Serial. begin ( 115200 );
    // setup i2s
    auto cfg = i2s. defaultConfig (); 
    cfg. sample_rate = 24000 ;
    cfg. channels = 1 ;
    i2s. begin (cfg);

    ttt. say ( 14 , 40 );
}

void loop () {
}

Cela sortira le résultat audio via I2S.

Utilisation de la mémoire

Voici les informations pour un croquis qui fournit une prise en charge de temps et des numéros de discussion et stocke tous les fichiers audio sous forme de MP3 dans progmem sur ESP32:

 Sketch uses 740438 bytes (23%) of program storage space. Maximum is 3145728 bytes.
Global variables use 23632 bytes (7%) of dynamic memory, leaving 304048 bytes for

Je pense que cela laisse beaucoup de marge et vous avez toujours la possibilité de stocker l' audio sur un lecteur SD ...

Documentation

Voici le lien vers la documentation de classe générée. De plus amples informations peuvent être trouvées dans le wiki et dans mes blogs

Dépendances

Outils audio Arduino - obligatoire
Arduino-libhelix un décodeur MP3 et AAC de RealNetworks - Obligatoire Si vous utilisez le MP3 des examens ou de tout autre décodeur pris en charge.
Bibliothèque SDFAT - Facultatif pour les exemples SD (ou vous pouvez utiliser la bibliothèque SD à la place: voir Wiki)
Arduino-Audio-Driver - Facultatif Si vous utilisez l'Audiokit (vous pouvez également remplacer le AudioboardStream dans les exemples par, par exemple un i2SStream)

Développer

Informations supplémentaires

Version October 2024 - Many Changes
Type Code Source AI
Date de mise à jour 2025-08-19
taille 1.48MB
Provenant de Github

Applications connexes

F5 TTS ComfyUI

2024-11-02
Le CMS simplifié

2014-02-07
Blog PHP simple

2012-05-02
Logiciel de groupe simple

2012-03-15
Le CMS simplifié

2011-08-22
Liste d'annuaire simple

2009-05-08

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout