GTTS
v0.0.8
텍스트 생성 및 인터넷 기반 정보 검색을 위해 Google AI (Gemini)를 사용하여 서면 콘텐츠를 음성으로 변환하십시오.
이 프로젝트는 Test/App.ts의 예제를 기반으로합니다. 다음 단계를 수행합니다.
이 프로젝트는 Linux에서 테스트되었습니다 (Ubuntu 24.04 LTS X86_64). Windows 사용자는 SourceForge를 통해 SOX를 설치할 수 있습니다. MACOS 별 정보는 현재 사용할 수 없습니다.
| 일 | 우선 사항 | 상태 |
|---|---|---|
| Gemini 채팅을 구현하십시오 | 높은 | ✅ 완료되었습니다 |
| 음성 인식을 개발하십시오 | 높은 | ✅ 완료되었습니다 |
| 오디오 언어 탐지를 구현하십시오 | 높은 | ✅ 완료되었습니다 |
| 텍스트 언어 탐지를 구현하십시오 | 중간 | ✅ 완료되었습니다 |
| 오디오 플레이어를 구현하십시오 | 낮은 | ✅ 완료되었습니다 |
| 열거를 정의하십시오 | 낮은 | ✅ 완료되었습니다 |
| 디버깅을 통합합니다 | 낮은 | ✅ 완료되었습니다 |
이 저장소를 사용하기 전에 시스템에 다음 종속성이 설치되어 있는지 확인하십시오.
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (초콜릿 사용) 또는 공식 웹 사이트에서 다운로드 현재 MacOS 특정 설치 지침을 사용할 수 없습니다.
패키지를 설치하려면 선호하는 패키지 관리자를 기반으로 다음 명령 중 하나를 사용하십시오.
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trust예제로 뛰어 들기 전에 다음 API 키와 자격 증명이 있는지 확인하십시오.
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )이 API 키를 단단히 저장하고 버전 제어에 절대 커밋하지 마십시오. 환경 변수 또는 안전한 키 관리 시스템을 고려하십시오.
Google Gemini API를 사용하여 응답을 생성하는 방법을 보여주는 간결한 예는 다음과 같습니다.
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;모든 공동 작업자의 기여에 감사드립니다. 각 사람의 노력은이 프로젝트를 개선하는 데 도움이됩니다. 이 프로젝트를 형성하는 데 도움을 준 모든 기고자들에게 특별한 감사를드립니다!