GTTS
v0.0.8
使用Google AI(Gemini)將書面內容轉換為語音,以進行文本生成和基於Internet的信息檢索。
該項目基於test/app.ts中的示例。它執行以下步驟:
該項目已在Linux(Ubuntu 24.04 LTS X86_64)上進行了測試。 Windows用戶可以通過SourceForge安裝Sox。 MacOS特定的信息當前不可用。
| 任務 | 優先事項 | 地位 |
|---|---|---|
| 實施雙子座聊天 | 高的 | ✅完成 |
| 發展語音識別 | 高的 | ✅完成 |
| 實施音頻語言檢測 | 高的 | ✅完成 |
| 實施文本語言檢測 | 中等的 | ✅完成 |
| 實施音頻播放器 | 低的 | ✅完成 |
| 定義枚舉 | 低的 | ✅完成 |
| 集成調試 | 低的 | ✅完成 |
在使用此存儲庫之前,請確保您的系統上安裝以下依賴關係:
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (使用巧克力)或從官方網站下載目前尚不可用MACOS特定的安裝說明。
要安裝軟件包,請根據您首選的軟件包管理器使用以下命令之一:
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trust在研究示例之前,請確保您擁有以下API鍵和憑據:
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )確保將這些API鍵安全地存儲,並且永遠不要將其投入版本控制。考慮使用環境變量或安全的密鑰管理系統。
這是一個簡潔的示例,演示瞭如何使用Google Gemini API生成響應:
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;我們感謝所有合作者的貢獻。每個人的努力有助於使這個項目更好。特別感謝我們所有幫助塑造該項目的貢獻者!