Este pacote fornece um cliente para o texto dos Serviços Cognitivos (Serviços de Speech) do Azure para a API de fala. Os usuários do cliente podem especificar o Lanaguage (tipo Region ), uma string que contém o texto desejado para falar, bem como o gênero (tipo Gender ) em que o audiofil deve ser renderizado. A biblioteca busca o áudio renderizado no formato de sua escolha (consulte Tipos de AudioOutput para obter formatos suportados).
Documentos de interesse da API
É necessária uma chave de API de serviços cognitivos (Kind = Speech Services) para acessar o URL. Este serviço pode ser ativado no portal do Azure.
A seguir, sintetizará a string 64 BASIC BYTES FREE. READY. , usando a localidade en-us, rasgando com uma voz feminina. O formato do arquivo de saída é um arquivo de áudio MP3 de canal único de 16kHz de 32kbit.
import tts "github.com/jesseward/azuretexttospeech"
func main () {
# See TextToSpeechAPI and TokenRefreshAPI types for list of endpoints and regions .
azureSpeech , _ := tts . New ( "YOUR-API-KEY" , tts . RegionEastUS )
ctx := context . Background ()
payload , _ := az . SynthesizeWithContext (
ctx ,
"64 BASIC BYTES FREE. READY." ,
tts . LocaleEnUS , // Region type
tts . GenderFemale , // Gender type
tts . Audio16khz32kbitrateMonoMp3 ) // AudioOutput type
// the response `payload` is your byte array containing audio data.
}