Descarga lobe tts - Descargar el código fuente lobe tts

lobe tts

Código Fuente de IA

v1.25.8

Descargar

LOBE TTS

Una biblioteca TTS/STT confiable y de alta calidad para servidor y navegador

Documentos · ChangeLog · Informe de error · Función de solicitud

Tabla de contenido

Tocarse

Introducción
? Uso
- Generar discurso en el servidor
- Use el componente React
? Instalación
- Compilar con next.js
⌨️ Desarrollo local
? Que contribuye
? Patrocinador
? Campo de golf
- Más productos
- Recursos de diseño
- Recursos de desarrollo

Introducción

? El chat de lóbulo admite tecnologías de texto a voz (TTS) y de voz a texto (STT), lo que permite que nuestra aplicación convierta los mensajes de texto en salidas de voz claras, lo que permite a los usuarios interactuar con nuestro agente conversacional como si estuvieran hablando con una persona real. Los usuarios pueden elegir entre una variedad de voces para emparejar con el agente.

En el proceso de implementación de esta función, descubrimos que no había una biblioteca frontend de TTS (texto a voz) satisfactoria disponible en el mercado. Como resultado, invertimos mucho esfuerzo, incluida la conversión de datos, la gestión del progreso de audio y la visualización del habla, entre otras tareas.

Nota

Por lo tanto, decidimos refinar nuestra implementación y hacerlo de código abierto, con la esperanza de ayudar a los desarrolladores que desean implementar TTS. @LobeHub/TTS es un kit de herramientas TTS de alta calidad desarrollado en TypeScript, que admite el uso tanto en el lado del servidor como en el navegador.

Lado del servidor: con solo 15 líneas de código, puede lograr capacidades de generación de voz de alta calidad comparables al servicio TTS de OpenAI. Actualmente es compatible con EdGespeechtts, Microsofttts, OpenAitts y OpenAistt.
Lado del navegador: proporciona ganchos reactos de alta calidad y componentes de audio visual, que admiten funciones comunes como cargar, reproducir, detener y arrastrar la línea de tiempo. Además, ofrece un conjunto muy rico de capacidades para ajustar los estilos de pista de audio.

? Uso

Generar discurso en el servidor

Ejecute el script a continuación Use Bun: bun index.js

 // index.js
import { EdgeSpeechTTS } from '@lobehub/tts' ;
import { Buffer } from 'buffer' ;
import fs from 'fs' ;
import path from 'path' ;

// Instantiate EdgeSpeechTTS
const tts = new EdgeSpeechTTS ( { locale : 'en-US' } ) ;

// Create speech synthesis request payload
const payload = {
  input : 'This is a speech demonstration' ,
  options : {
    voice : 'en-US-GuyNeural' ,
  } ,
} ;

// Call create method to synthesize speech
const response = await tts . create ( payload ) ;

// generate speech file
const mp3Buffer = Buffer . from ( await response . arrayBuffer ( ) ) ;
const speechFile = path . resolve ( './speech.mp3' ) ;

fs . writeFileSync ( speechFile , mp3Buffer ) ;

Audio.mp4

Importante

Ejecutar en node.js

Como el entorno Node.js carece de la instancia WebSocket , necesitamos pololear WebSocket. Esto se puede hacer importando el paquete WS.

 // import at the top of the file
import WebSocket from 'ws' ;

global . WebSocket = WebSocket ;

Use el componente React

 import { AudioPlayer , AudioVisualizer , useAudioPlayer } from '@lobehub/tts/react' ;

export default ( ) => {
  const { ref , isLoading , ... audio } = useAudioPlayer ( url ) ;

  return (
    < Flexbox align = { 'center' } gap = { 8 } >
      < AudioPlayer audio = { audio } isLoading = { isLoading } style = { { width : '100%' } } />
      < AudioVisualizer audioRef = { ref } isLoading = { isLoading } />
    </ Flexbox >
  ) ;
} ;

audio-vis.mp4

? Instalación

Importante

Este paquete es solo ESM.

Para instalar @lobehub/tts , ejecute el siguiente comando:

$ pnpm i @lobehub/tts

$ bun add @lobehub/tts

Compilar con next.js

Nota

Por el trabajo correcto con Next.js SSR, agregue transpilePackages: ['@lobehub/tts'] a next.config.js . Por ejemplo:

 const nextConfig = {
  transpilePackages : [ '@lobehub/tts' ] ,
} ;

⌨️ Desarrollo local

Puede usar GitHub CodeSpaces para el desarrollo en línea:

O clonarlo para el desarrollo local:

$ git clone https://github.com/lobehub/lobe-tts.git
$ cd lobe-tts
$ bun install
$ bun dev

? Que contribuye

Las contribuciones de todos los tipos son más que bienvenidas, si está interesado en contribuir con código, no dude en consultar nuestros problemas de GitHub para atascarse para mostrarnos de qué está hecho.

? Patrocinador

¡Cada bit cuenta y su donación única brilla en nuestra galaxia de apoyo! Eres una estrella fugaz, que tiene un impacto rápido y brillante en nuestro viaje. Gracias por creer en nosotros: su generosidad nos guía hacia nuestra misión, un destello brillante a la vez.

? Campo de golf

Más productos

? Chat del lóbulo : un marco de chatbot de alto rendimiento, extensible (llamado), marco de chatbot de alto rendimiento. Admite una implementación gratuita de un clic de su aplicación web privada de chatgpt/llm.
? ️ Tema del lóbulo : el tema moderno para la webui de difusión estable, el diseño de interfaz exquisito, la interfaz de usuario altamente personalizable y las características de aumento de eficiencia.
? LOBE VIDOL - Experimente la magia de la creación de ídolos virtuales con lóbulo vidol, disfrute de la elegancia de nuestro exquisito diseño de interfaz de usuario, baile con soporte de danza MMD y entere en conversaciones suaves.

Recursos de diseño

? LOBE UI : una biblioteca de componentes de interfaz de usuario de código abierto para construir aplicaciones web AIGC.
? Iconos del lóbulo : logotipo de marca de modelo AI / LLM SVG y colección de iconos.
Gráficos de lóbulo : los componentes reaccionados de los gráficos modernos construidos en los reinversiones

Recursos de desarrollo

? LOBE TTS : una biblioteca TTS/STT de alta calidad y confiable para servidor y navegador
? LOBE I18N - Herramienta AI de automatización para el proceso de traducción I18N (internacionalización).

Más recursos