Um cliente baseado em digitação para interagir com a API de texto em fala (TTS) da Microsoft Edge. Este pacote é compatível com os ambientes Node.Js e do navegador, tornando -o versátil para vários casos de uso.
https://www.npmjs.com/package/edge-tts-client
Para instalar o pacote, execute:
npm install edge-tts-client import { EdgeTTSClient , ProsodyOptions , OUTPUT_FORMAT } from 'edge-tts-client' ;
// Initialize the client
const ttsClient = new EdgeTTSClient ( ) ;
// Set metadata for synthesis
await ttsClient . setMetadata ( 'en-US-GuyNeural' , OUTPUT_FORMAT . AUDIO_24KHZ_48KBITRATE_MONO_MP3 ) ;
// Define SSML options
const options = new ProsodyOptions ( ) ;
options . pitch = 'medium' ;
options . rate = 1.2 ;
options . volume = 90 ;
// Synthesize text to a stream
const stream = ttsClient . toStream ( 'Hello, world!' , options ) ;
// Handle the audio stream
stream . on ( 'data' , ( audioChunk ) => {
console . log ( 'Received audio chunk:' , audioChunk ) ;
} ) ;
stream . on ( 'end' , ( ) => {
console . log ( 'Synthesis complete.' ) ;
} ) ; EdgeTTSClientA classe principal para interagir com TTS de borda.
setMetadata(voiceName: string, outputFormat: OUTPUT_FORMAT, voiceLocale?: string): Promise<void>
toStream(input: string, options?: ProsodyOptions): EventEmitter
close(): void
ProsodyOptionsDefine as opções de prosódia para a síntese SSML:
pitch : Pitch of the Voice (por exemplo, 'medium' , 'high' ).rate : velocidade do discurso (por exemplo, 1.0 , 1.2 ).volume : volume do áudio (por exemplo, 90 , 'loud' ).OUTPUT_FORMATUma enumeração definindo os formatos de saída disponíveis, como:
AUDIO_24KHZ_48KBITRATE_MONO_MP3WEBM_24KHZ_16BIT_MONO_OPUS Para construir o projeto, execute:
npm run buildPara executar testes com o Vitest:
npm run test As contribuições são bem -vindas! Abra um problema ou envie uma solicitação de tração para quaisquer alterações ou melhorias.