Transforme el contenido escrito en discurso utilizando Google AI (Gemini) para la generación de texto y la recuperación de información basada en Internet.
Este proyecto se basa en un ejemplo en Test/App.ts. Realiza los siguientes pasos:
Este proyecto ha sido probado en Linux (Ubuntu 24.04 LTS x86_64). Los usuarios de Windows pueden instalar Sox a través de SourceForge. La información específica de MacOS no está disponible actualmente.
| Tarea | Prioridad | Estado |
|---|---|---|
| Implementar chat de Géminis | Alto | ✅ Completado |
| Desarrollar el reconocimiento de voz | Alto | ✅ Completado |
| Implementar la detección de lenguaje de audio | Alto | ✅ Completado |
| Implementar la detección de idiomas de texto | Medio | ✅ Completado |
| Implementar un reproductor de audio | Bajo | ✅ Completado |
| Definir enums | Bajo | ✅ Completado |
| Integrar la depuración | Bajo | ✅ Completado |
Antes de usar este repositorio, asegúrese de que las siguientes dependencias estén instaladas en su sistema:
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (usando Chocolatey) o descargar desde el sitio web oficial Las instrucciones de instalación específicas de MacOS no están disponibles en este momento.
Para instalar el paquete, use uno de los siguientes comandos basado en su administrador de paquetes preferido:
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trustAntes de sumergirse en los ejemplos, asegúrese de tener las siguientes claves y credenciales de API:
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )Asegúrese de almacenar estas claves API de forma segura y nunca comprometerlas con el control de versiones. Considere usar variables de entorno o un sistema de gestión de claves seguro.
Aquí hay un ejemplo conciso que demuestra cómo generar una respuesta utilizando la API de Google Gemini:
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;Apreciamos las contribuciones de todos nuestros colaboradores. El esfuerzo de cada persona ayuda a mejorar este proyecto. ¡Un agradecimiento especial a todos nuestros contribuyentes que han ayudado a dar forma a este proyecto!