Transforme o conteúdo escrito em fala usando o Google AI (Gemini) para geração de texto e recuperação de informações baseadas na Internet.
Este projeto é baseado em um exemplo no teste/app.ts. Ele executa as seguintes etapas:
Este projeto foi testado no Linux (Ubuntu 24.04 LTS x86_64). Os usuários do Windows podem instalar o SOX via fonte doforg. Atualmente, as informações específicas do MacOS não estão disponíveis.
| Tarefa | Prioridade | Status |
|---|---|---|
| Implementar o bate -papo de Gêmeos | Alto | ✅ Concluído |
| Desenvolver reconhecimento de voz | Alto | ✅ Concluído |
| Implementar a detecção de linguagem de áudio | Alto | ✅ Concluído |
| Implementar a detecção de linguagem de texto | Médio | ✅ Concluído |
| Implementar um player de áudio | Baixo | ✅ Concluído |
| Definir enums | Baixo | ✅ Concluído |
| Integrar a depuração | Baixo | ✅ Concluído |
Antes de usar este repositório, verifique se as seguintes dependências estão instaladas em seu sistema:
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (usando chocolatey) ou download no site oficial As instruções de instalação específicas do MacOS não estão disponíveis no momento.
Para instalar o pacote, use um dos seguintes comandos com base no seu gerenciador de pacotes preferido:
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trustAntes de mergulhar nos exemplos, verifique se você possui as seguintes chaves e credenciais da API:
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )Certifique -se de armazenar essas teclas da API com segurança e nunca as comprometa com o controle da versão. Considere o uso de variáveis de ambiente ou um sistema de gerenciamento de chaves seguros.
Aqui está um exemplo conciso, demonstrando como gerar uma resposta usando a API do Google Gemini:
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;Agradecemos as contribuições de todos os nossos colaboradores. O esforço de cada pessoa ajuda a melhorar esse projeto. Um agradecimento especial a todos os nossos colaboradores que ajudaram a moldar esse projeto!