Преобразовать письменный контент в речь с помощью Google AI (Gemini) для получения текста и поиска информации на основе Интернета.
Этот проект основан на примере в Test/App.ts. Он выполняет следующие шаги:
Этот проект был протестирован на Linux (Ubuntu 24.04 LTS X86_64). Пользователи Windows могут установить SOX через Sourceforge. Специфичная информация MacOS в настоящее время недоступна.
| Задача | Приоритет | Статус |
|---|---|---|
| Реализовать чат Близнецов | Высокий | ✅ завершен |
| Разработать распознавание голоса | Высокий | ✅ завершен |
| Внедрить обнаружение звука языка | Высокий | ✅ завершен |
| Реализовать обнаружение текстового языка | Середина | ✅ завершен |
| Внедрить аудиоплеер | Низкий | ✅ завершен |
| Определите перечисления | Низкий | ✅ завершен |
| Интеграция отладки | Низкий | ✅ завершен |
Перед использованием этого хранилища убедитесь, что в вашей системе установлены следующие зависимости:
sudo apt-get install soxsudo apt-get install libsox-fmt-allsudo apt install ffmpeg choco install ffmpeg (используя шоколад) или скачать с официального веб -сайта Инструкции по установке, специфичные для MacOS, в настоящее время недоступны.
Чтобы установить пакет, используйте одну из следующих команд на основе вашего предпочтительного диспетчера пакетов:
# npm
$ npm install git+https://github.com/Stawa/GTTS.git --legacy-peer-deps
# Bun
$ bun install git+https://github.com/Stawa/GTTS.git --trustПрежде чем погрузиться в примеры, убедитесь, что у вас есть следующие ключи API и учетные данные:
lib.GoogleGemini )lib.TextToSpeech )lib.VoiceRecognition.fetchTranscriptGoogle )lib.VoiceRecognition.fetchTranscriptDeepgram )lib.SummarizeText )Убедитесь, что эти клавиши API надежно надежно и никогда не совершайте их контроля версий. Рассмотрите возможность использования переменных среды или безопасной системы управления ключами.
Вот краткий пример, демонстрирующий, как генерировать ответ, используя API Google Gemini:
import { GoogleGemini } from "@stawa/gtts" ;
import dotenv from "dotenv" ;
dotenv . config ( ) ;
const gemini = new GoogleGemini ( {
apiKey : process . env . GEMINI_API_KEY ,
model : "gemini-1.5-flash" ,
enableLogging : true ,
} ) ;
async function main ( ) {
try {
const question = "When was Facebook launched?" ;
console . log ( `Question: ${ question } ` ) ;
const response = await gemini . chat ( question ) ;
console . log ( `Gemini's response: ${ response } ` ) ;
} catch ( error ) {
console . error ( "An error occurred:" , error ) ;
}
}
main ( ) ;Мы ценим вклад всех наших сотрудников. Усилия каждого человека помогают сделать этот проект лучше. Особая благодарность всем нашим участникам, которые помогли сформировать этот проект!