Assistant GNU/Linux-AI-Voice-это универсальный интерфейс на основе терминала, который использует различные инструменты с открытым исходным кодом, предлагая бесшовное взаимодействие с LLMS, различные услуги и функции. Основными компонентами помощника являются:
Glava-это не просто инструмент для прохождения теста Тьюринга, это динамическая помощница командной строки, готовая помочь вам с множеством задач и запросов. В его сердце лежит сила крупных языковых моделей (LLMS), море знаний, ожидающих использования.
Это не просто инструмент для поиска информации. Это компаньон, готов помочь вам с широким спектром задач, что делает ваш опыт командной линии более приятным и эффективным.
С помощью мультимодального взаимодействия он может взаимодействовать с вами в текстовом или голосовом формате. Он может извлекать информацию из различных источников, генерировать команды оболочки, изображения и даже просматривать Интернет. Это ваш помощник по всем вашим информационным и развлекательным потребностям.
Glava использует силу LLM для обеспечения широкого спектра функциональных возможностей. Если вы предпочитаете взаимодействовать с ним, используя клавишные или голос, Glava имеет вашу спину. Он отвечает как в текстовом, так и в формате голоса, обеспечивая беспрепятственное взаимодействие.
Glava позволяет вам диктовать ваши команды, используя голос или ввести их.
Для распознавания голоса мы используем Vosk, бесплатный. Легкий, эффективный и инструментарий с открытым исходным кодом для распознавания речи. Vosk работает в качестве отдыха WebSocket, обеспечивая точную и транскрипцию в реальном времени.
Чтобы ваши уши были удовлетворены, Глава не просто говорящий, это мастер текста в речь (TTS). Он использует Piper, мощный инструмент, который можно использовать с HTTP Websockets, где текст свергается, чтобы получить голос или с помощью двоичного файла Piper.
Слушайте здесь голосовые образцы
Glava может делать речь к текстовому тексту, используя диктовку NERD, которая очень точна и может быть легко настроена с помощью сценариев Python, которые действуют как Config. (Использует Vosk-API)
Вот конфигурация, которую использует этот проект, который включает в себя «начать писать», «перестать писать» команды для включения/отключения голосовой диктовки, а также мало пунктуаций, слова капитализации и т. Д.
Пользователь может запросить информацию и вычисления с использованием API Wolfram API.
Glava может запросить новости от Newsapi и Google News и получить результат как в формате текста, так и в формате голоса, делая обучение и оставаясь в курсе в восхитительном путешествии.
Glava - это не просто инструмент для поиска информации. Он может генерировать команды оболочки и выполнять их, позволяя вам легко редактировать, прервать и выполнять команды. Это все равно, что иметь личного помощника, готовый помочь вам с задачами, которые в противном случае могли бы занять время и усилия.
Glava может открыть веб -браузер для различных веб -сайтов, что делает ваш опыт просмотра. Он может искать различные веб -сайты и Википедию для получения информации, предоставляя вам необходимую информацию, когда вам это нужно.
Просмотрите свои любимые сайты, такие как YouTube, Github, Wikipedia, Amazon и Reddit, или используйте DuckDuckgo с пользовательскими параметрами поиска в качестве поисковой системы по умолчанию.
Glava может воспроизводить любую песню или видео из источников YouTube, используя YT-DLP, MPD и MPV. Он может воспроизводить их как в формате звука, так и в видео, что делает его вашим личным создателем плейлиста.
Glava может запросить информацию о любом фильме от IMDB, предоставляя вам множество информации о фильме, включая его сюжет, актерский состав и рейтинги.
Glava может помочь вам генерировать изображения с текстом, используя бесплатные услуги https://pollinations.ai/
Прежде чем начать, убедитесь, что вы выполнили следующие требования:
Следуйте этим шагам, чтобы установить и настроить проект:
Клонировать репозиторий:
git clone https://github.com/akhil3417/glava
Перейдите к каталогу проекта:
cd glava
Запустите сценарий установки:
chmod +x installer.sh
./installer.sh
Обратите внимание, что сценарий установщика только устанавливает Vosk-Model-Small-EN-US-0.15 (Voice_Recognition) и модели EN_US-HFC_FEMALE-medium (TTS). Чтобы добавить свои дополнительные модели, загрузите их из Piper, Vosk и извлеките их в каталог ./extensions/piper/models/ или ./extensions/vosk .
Вы можете прослушать голосовые образцы для Piper TTS здесь для Piper и загрузить предпочтительную модель соответственно.
Убедитесь, что у вас есть ShellGPT, если не увидите установку ShellGPT.
Теперь вы можете начать проект с следующей командой:
./start.sh
or
. .env/bin/activate
python3 main.py
Все пользовательские вопросы совпадают с ключами в словаре команд, если он существует, то соответствующая функция выполняется, если ничто не соответствует ShellGPT.
Для получения дополнительной информации см. Команды DICT в main.py.
Теперь вы можете взаимодействовать с проектом, используя голосовые команды или ваши клавишные.
Пользователь может отредактировать config.ini в соответствии с их потребностями (имени помощника, Api-Keys и т. Д.).
Если вы хотите внести свой вклад в этот проект, придерживайтесь следующих руководств:
git checkout -b feature/AmazingFeature .git commit -m 'Add some AmazingFeature' .git push origin feature/AmazingFeature .Этот проект находится в раннем развитии, поэтому ошибки ожидаются и будут исправлены в будущем.
Здесь еще несколько инструментов, основанных на Vosk.
Этот проект лицензирован по лицензии MIT. Для получения более подробной информации, пожалуйста, обратитесь к файлу License.md в репозитории.
Для любых запросов или предложений не стесняйтесь обращаться к сопровождающему проекту по адресу [добавлю скоро]. Я был бы рад помочь вам с вашими потребностями.