Verwandeln Sie schriftliche Inhalte mit Google AI (Gemini) in Sprache für Textgenerierung und internetbasiertes Informationsabruf.
Dieses Projekt basiert auf einem Beispiel in Test/App.ts. Es führt die folgenden Schritte aus:
Dieses Projekt wurde auf Linux (Ubuntu 24.04 LTS x86_64) getestet. Windows -Benutzer können SOX über SourceForge installieren. Die macOS-spezifischen Informationen sind derzeit nicht verfügbar.
| Aufgabe | Priorität | Status |
|---|---|---|
| Gemini Chat implementieren | Hoch | ✅ abgeschlossen |
| Spracherkennung entwickeln | Hoch | ✅ abgeschlossen |
| Implementieren Sie die Erkennung von Audiosprachen | Hoch | ✅ abgeschlossen |
| Textspracherkennung implementieren | Medium | ✅ abgeschlossen |
| Einen Audio -Player implementieren | Niedrig | ✅ abgeschlossen |
| Definieren Sie Enums | Niedrig | ✅ abgeschlossen |
| Debugging integrieren | Niedrig | ✅ abgeschlossen |
Stellen Sie vor der Verwendung dieses Repositorys sicher, dass die folgenden Abhängigkeiten in Ihrem System installiert sind:
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (mit Schokoladen) oder herunterladen von der offiziellen Website MacOS-spezifische Installationsanweisungen sind derzeit nicht verfügbar.
Verwenden Sie zum Installieren des Pakets einen der folgenden Befehle basierend auf Ihrem bevorzugten Paketmanager:
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trustStellen Sie vor dem Eintauchen in die Beispiele sicher, dass Sie die folgenden API -Schlüssel und Anmeldeinformationen haben:
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )Stellen Sie sicher, dass diese API -Schlüssel sicher speichern und niemals zur Versionskontrolle verpflichten. Erwägen Sie, Umgebungsvariablen oder ein sicheres Schlüsselverwaltungssystem zu verwenden.
Hier ist ein prägnantes Beispiel, das zeigt, wie eine Antwort mit der Google Gemini -API generiert wird:
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;Wir schätzen die Beiträge aller unserer Mitarbeiter. Die Bemühungen jeder Person helfen, dieses Projekt besser zu machen. Ein besonderer Dank geht an alle unsere Mitwirkenden, die dieses Projekt gestaltet haben!