Неофициальный ElevenLabs.io (11.ai) голосовой синтез клиент
Эта библиотека ни в коем случае не связана с одиннадцатилетними.
Официальная документация API ElevenLabs, на которой был получен этот клиент, можно найти здесь.
Этот клиент GO предоставляет простой интерфейс для создания синтезированных голосов и запросов TTS (текст в речь) на ElevenLabs.io
Как предпосылка, вы уже должны иметь аккаунт с ElevenLabs.io. После создания своей учетной записи вы можете получить свой ключ API отсюда.
Чтобы протестировать пример, say , запустить:
go install github.com/taigrr/elevenlabs/cmd/say@latest
Установите переменную среды XI_API_KEY и поручите ей текст, чтобы дать ей водоворот!
Чтобы использовать эту библиотеку, создайте новый клиент и отправьте запрос TTS на голос. Следующий кодовый блок показывает, как можно воспроизвести команду SAY/espeak, используя потоковую конечную точку. Я решил пойти с пакетом Beep's Faipace, но вы также можете сохранить файл в MP3-диск.
package main
import (
"bufio"
"context"
"io"
"log"
"os"
"time"
"github.com/faiface/beep"
"github.com/faiface/beep/mp3"
"github.com/faiface/beep/speaker"
"github.com/taigrr/elevenlabs/client"
"github.com/taigrr/elevenlabs/client/types"
)
func main () {
ctx := context . Background ()
// load in an API key to create a client
client := client . New ( os . Getenv ( "XI_API_KEY" ))
// fetch a list of voice IDs from elevenlabs
ids , err := client . GetVoiceIDs ( ctx )
if err != nil {
panic ( err )
}
// prepare a pipe for streaming audio directly to beep
pipeReader , pipeWriter := io . Pipe ()
reader := bufio . NewReader ( os . Stdin )
text , _ := reader . ReadString ( 'n' )
go func () {
// stream audio from elevenlabs using the first voice we found
err = client . TTSStream ( ctx , pipeWriter , text , ids [ 0 ], types. SynthesisOptions { Stability : 0.75 , SimilarityBoost : 0.75 , Style : 0.0 , UseSpeakerBoost : true })
if err != nil {
panic ( err )
}
pipeWriter . Close ()
}()
// decode and prepare the streaming mp3 as it comes through
streamer , format , err := mp3 . Decode ( pipeReader )
if err != nil {
log . Fatal ( err )
}
defer streamer . Close ()
speaker . Init ( format . SampleRate , format . SampleRate . N ( time . Second / 10 ))
done := make ( chan bool )
// play the audio
speaker . Play ( beep . Seq ( streamer , beep . Callback ( func () {
done <- true
})))
<- done
}Следующий пример демонстрирует, как генерировать звуковые эффекты с использованием API генерации звука:
package main
import (
"context"
"os"
"github.com/taigrr/elevenlabs/client"
)
func main () {
ctx := context . Background ()
// Create a new client with your API key
client := client . New ( os . Getenv ( "XI_API_KEY" ))
// Generate a sound effect and save it to a file
f , err := os . Create ( "footsteps.mp3" )
if err != nil {
panic ( err )
}
defer f . Close ()
// Basic usage (using default duration and prompt influence)
err = client . SoundGenerationWriter ( ctx , f , "footsteps on wooden floor" , 0 , 0 )
if err != nil {
panic ( err )
}
// Advanced usage with custom duration and prompt influence
audio , err := client . SoundGeneration (
ctx ,
"heavy rain on a tin roof" ,
5.0 , // Set duration to 5 seconds
0.5 , // Set prompt influence to 0.5
)
if err != nil {
panic ( err )
}
os . WriteFile ( "rain.mp3" , audio , 0644 )
}