Transformez le contenu écrit en discours à l'aide de Google AI (Gemini) pour la génération de texte et la récupération d'informations basée sur Internet.
Ce projet est basé sur un exemple de test / app.ts. Il effectue les étapes suivantes:
Ce projet a été testé sur Linux (Ubuntu 24.04 LTS X86_64). Les utilisateurs de Windows peuvent installer des SOX via Sourceforge. Les informations spécifiques au macOS ne sont actuellement pas disponibles.
| Tâche | Priorité | Statut |
|---|---|---|
| Implémenter le chat Gemini | Haut | ✅ Terminé |
| Développer la reconnaissance vocale | Haut | ✅ Terminé |
| Implémenter la détection du langage audio | Haut | ✅ Terminé |
| Implémenter la détection du langage texte | Moyen | ✅ Terminé |
| Implémenter un lecteur audio | Faible | ✅ Terminé |
| Définir les énumérations | Faible | ✅ Terminé |
| Intégrer le débogage | Faible | ✅ Terminé |
Avant d'utiliser ce référentiel, assurez-vous que les dépendances suivantes sont installées sur votre système:
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (utilisant Chocolatey) ou télécharger à partir du site officiel Les instructions d'installation spécifiques au macOS ne sont pas disponibles pour le moment.
Pour installer le package, utilisez l'une des commandes suivantes en fonction de votre gestionnaire de package préféré:
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trustAvant de plonger dans les exemples, assurez-vous d'avoir les clés API et les informations d'identification suivantes:
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )Assurez-vous de stocker ces clés API en toute sécurité et de ne jamais les engager dans le contrôle des versions. Envisagez d'utiliser des variables d'environnement ou un système de gestion des clés sécurisé.
Voici un exemple concis montrant comment générer une réponse à l'aide de l'API Google Gemini:
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;Nous apprécions les contributions de tous nos collaborateurs. L'effort de chaque personne aide à améliorer ce projet. Un merci spécial à tous nos contributeurs qui ont contribué à façonner ce projet!