Este paquete proporciona un cliente para el texto de los servicios cognitivos (servicios de voz) de Azure a la API del habla. Los usuarios del cliente pueden especificar la lanaguage (tipo Region ), una cadena que contiene el texto deseado para hablar, así como el género (tipo Gender ) en el que se debe representar el audiofile. La biblioteca obtiene el audio representado en el formato de su elección (consulte los tipos de AudioOutput para formatos compatibles).
Documentos de interés API
Se requiere una clave API de servicios cognitivos (Kind = Speech Services) para acceder a la URL. Este servicio se puede habilitar en el portal de Azure.
Lo siguiente sintetizará la cadena 64 BASIC BYTES FREE. READY. , usando el lugar en-us, desgarbado con una voz femenina. El formato de archivo de salida es un archivo de audio MP3 de un solo canal de 32kbit de 32 kbits.
import tts "github.com/jesseward/azuretexttospeech"
func main () {
# See TextToSpeechAPI and TokenRefreshAPI types for list of endpoints and regions .
azureSpeech , _ := tts . New ( "YOUR-API-KEY" , tts . RegionEastUS )
ctx := context . Background ()
payload , _ := az . SynthesizeWithContext (
ctx ,
"64 BASIC BYTES FREE. READY." ,
tts . LocaleEnUS , // Region type
tts . GenderFemale , // Gender type
tts . Audio16khz32kbitrateMonoMp3 ) // AudioOutput type
// the response `payload` is your byte array containing audio data.
}