GTTS 다운로드 GTTS 소스 코드 다운로드

GTTS

AI 소스 코드

v0.0.8

다운로드

쌍둥이 자리 텍스트 음성

텍스트 생성 및 인터넷 기반 정보 검색을 위해 Google AI (Gemini)를 사용하여 서면 콘텐츠를 음성으로 변환하십시오.

❓ 작동 방식

이 프로젝트는 Test/App.ts의 예제를 기반으로합니다. 다음 단계를 수행합니다.

음성 입력을 가져옵니다
Google Gemini API에 요청을 보내 AI 생성 응답을받습니다.
TTS (Text-To-Steece) 기술을 사용하여 스피치로 응답을 자동으로 변환합니다.
생성 된 오디오를 재생합니다

? 프로젝트 노트

이 프로젝트는 Linux에서 테스트되었습니다 (Ubuntu 24.04 LTS X86_64). Windows 사용자는 SourceForge를 통해 SOX를 설치할 수 있습니다. MACOS 별 정보는 현재 사용할 수 없습니다.

일	우선 사항	상태
Gemini 채팅을 구현하십시오	높은	✅ 완료되었습니다
음성 인식을 개발하십시오	높은	✅ 완료되었습니다
오디오 언어 탐지를 구현하십시오	높은	✅ 완료되었습니다
텍스트 언어 탐지를 구현하십시오	중간	✅ 완료되었습니다
오디오 플레이어를 구현하십시오	낮은	✅ 완료되었습니다
열거를 정의하십시오	낮은	✅ 완료되었습니다
디버깅을 통합합니다	낮은	✅ 완료되었습니다

? 프로젝트 설치

이 저장소를 사용하기 전에 시스템에 다음 종속성이 설치되어 있는지 확인하십시오.

리눅스

SOX : sudo apt-get install sox
libsox-fmt-all : sudo apt-get install libsox-fmt-all
ffmpeg : sudo apt install ffmpeg

창

SOX : Sourceforge에서 다운로드
FFMPEG : choco install ffmpeg (초콜릿 사용) 또는 공식 웹 사이트에서 다운로드

마코스

현재 MacOS 특정 설치 지침을 사용할 수 없습니다.

패키지를 설치하려면 선호하는 패키지 관리자를 기반으로 다음 명령 중 하나를 사용하십시오.

 # npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trust

? 프로젝트 예

예제로 뛰어 들기 전에 다음 API 키와 자격 증명이 있는지 확인하십시오.

Google Gemini API 키 ( lib.GoogleGemini )
- Google Cloud Console에서 구입하십시오
Tiktok SessionID ( lib.TextToSpeech )
- 로그인 한 후 Tiktok 브라우저 쿠키에서 추출하십시오
Google Speech API 키 ( lib.VoiceRecognition.fetchTranscriptGoogle )
- Google Cloud Console 자격 증명에서 생성하십시오
DeepGram API 키 ( lib.VoiceRecognition.fetchTranscriptDeepgram )
- 계정을 만들고 DeepGram 콘솔에서 얻습니다
Edenai API 키 ( lib.SummarizeText )
- 에데 나이 대시 보드에서 가입하고 검색하십시오

이 API 키를 단단히 저장하고 버전 제어에 절대 커밋하지 마십시오. 환경 변수 또는 안전한 키 관리 시스템을 고려하십시오.

Google Gemini API를 사용하여 응답을 생성하는 방법을 보여주는 간결한 예는 다음과 같습니다.

 import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;

const gemini = new GoogleGemini ( {
  apiKey : process . env . GEMINI_API_KEY ,
  model : "gemini-1.5-flash" ,
  enableLogging : true ,
} ) ;

async function main ( ) {
  try {
    const question = "When was Facebook launched?" ;
    console . log ( `Question: ${ question } ` ) ;

    const response = await gemini . chat ( question ) ;
    console . log ( `Gemini's response: ${ response } ` ) ;
  } catch ( error ) {
    console . error ( "An error occurred:" , error ) ;
  }
}

main ( ) ;