GTTSダウンロードGTTSソースコードのダウンロード

GTTS

AI ソースコード

v0.0.8

ダウンロード

ジェミニのテキストからスピーチ

書面によるコンテンツを、テキスト生成およびインターネットベースの情報検索のためにGoogle AI（Gemini）を使用してスピーチに変換します。

corkesそれがどのように機能するか

このプロジェクトは、test/app.tsの例に基づいています。次の手順を実行します。

音声入力を取得します
Google Gemini APIにリクエストを送信して、AIに生成された応答を受信します
テキストツーチー（TTS）テクノロジーを使用して音声への応答を自動的に変換する
生成されたオーディオを再生します

？プロジェクトノート

このプロジェクトは、Linux（Ubuntu 24.04 LTS X86_64）でテストされています。 Windowsユーザーは、SourceForgeを介してSOXをインストールできます。 MacOS固有の情報は現在利用できません。

タスク	優先度	状態
Geminiチャットを実装します	高い	✅完了しました
音声認識を開発します	高い	✅完了しました
オーディオ言語検出を実装します	高い	✅完了しました
テキスト言語の検出を実装します	中くらい	✅完了しました
オーディオプレーヤーを実装します	低い	✅完了しました
酵素を定義します	低い	✅完了しました
デバッグを統合します	低い	✅完了しました

？プロジェクトのインストール

このリポジトリを使用する前に、システムに次の依存関係がインストールされていることを確認してください。

Linux

Sox ： sudo apt-get install sox
libsox-fmt-all ： sudo apt-get install libsox-fmt-all
ffmpeg ： sudo apt install ffmpeg

Windows

ソックス：SourceForgeからダウンロード
ffmpeg ： choco install ffmpeg （チョコレートを使用）または公式ウェブサイトからダウンロード

macos

現時点では、MacOS固有のインストール手順は利用できません。

パッケージをインストールするには、希望するパッケージマネージャーに基づいて、次のコマンドのいずれかを使用します。

 # npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trust

？プロジェクトの例

例に飛び込む前に、次のAPIキーと資格情報があることを確認してください。

Google Gemini APIキー（ lib.GoogleGemini ）
- Google Cloud Consoleから入手してください
Tiktok SessionId （ lib.TextToSpeech ）
- ログイン後にTiktokブラウザCookieから抽出します
Google Speech APIキー（ lib.VoiceRecognition.fetchTranscriptGoogle ）
- Google Cloud Console資格情報から生成します
Deepgram APIキー（ lib.VoiceRecognition.fetchTranscriptDeepgram ）
- アカウントを作成し、Deepgramコンソールから取得します
Edenai APIキー（ lib.SummarizeText ）
- Edenaiダッシュボードからサインアップして取得します

これらのAPIキーを安全に保存し、バージョン制御にコミットしないようにしてください。環境変数または安全なキー管理システムの使用を検討してください。

Google Gemini APIを使用して応答を生成する方法を示す簡潔な例を次に示します。

 import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;

const gemini = new GoogleGemini ( {
  apiKey : process . env . GEMINI_API_KEY ,
  model : "gemini-1.5-flash" ,
  enableLogging : true ,
} ) ;

async function main ( ) {
  try {
    const question = "When was Facebook launched?" ;
    console . log ( `Question: ${ question } ` ) ;

    const response = await gemini . chat ( question ) ;
    console . log ( `Gemini's response: ${ response } ` ) ;
  } catch ( error ) {
    console . error ( "An error occurred:" , error ) ;
  }
}

main ( ) ;