Загрузка IncarnaMind - Загрузка исходного кода IncarnaMind

IncarnaMind

Другой исходный код

1.0.0

Скачать

? Иккарнат

? В двух словах

Incarnamind позволяет вам общаться с вашими личными документами? (PDF, TXT) Используя большие языковые модели (LLMS), такие как GPT (Обзор архитектуры). В то время как OpenAI недавно запустил API с тонкой настройкой для моделей GPT, он не позволяет базовым предварительному моделям изучать новые данные, а ответы могут быть подвержены фактическим галлюцинациям. Используйте наш механизм раздвижного окна, а ансамблевой ретривер позволяет эффективно запросить как мелкозернистую, так и крупную информацию в ваших наземных документах истины, чтобы увеличить LLMS.

Не стесняйтесь использовать его, и мы приветствуем какие -либо отзывы и новые предложения функций?

Новые обновления

Поддержка с открытым исходным кодом и местной LLMS

Рекомендуемая модель: мы в основном протестировали с моделями серии Llama2 и рекомендуем использовать Llama2-70B-чат (либо полная версия, либо версия GGUF) для оптимальной производительности. Не стесняйтесь экспериментировать с другими LLMS.
Системные требования: требуется более 35 ГБ оперативной памяти графического процессора для запуска квантовой версии GGUF.

Альтернативные варианты LLMS с открытым исходным кодом

Недостаточная оперативная память: если вы ограничены оперативной памятью GPU, рассмотрите возможность использования API oblide.ai. Он поддерживает Llama2-70B-чат и большинство других LLMS с открытым исходным кодом. Кроме того, вы получаете 25 долларов в бесплатном использовании.
Предстоящее: в будущем будут выпущены меньшие и экономичные, тонкие модели.

Как использовать модели GGUF

Для получения инструкций по получению и использованию квантового GGUF LLM (аналогично GGML), пожалуйста, обратитесь к этому видео (с 10:45 до 12:30) ..

Вот сравнительная таблица различных моделей, которые я протестировал, только для справки:

Метрики	GPT-4	GPT-3.5	Клод 2.0	Llama2-70b	Llama2-70b-Gguf	Llama2-70B-API
Рассуждение	Высокий	Середина	Высокий	Середина	Середина	Середина
Скорость	Середина	Высокий	Середина	Очень низкий	Низкий	Середина
Графический баран	N/a	N/a	N/a	Очень высоко	Высокий	N/a
Безопасность	Низкий	Низкий	Низкий	Высокий	Высокий	Низкий

Демо

Demo.mp4

Проблемы решаются

Фиксированный кункинг : традиционные тряпичные инструменты полагаются на фиксированные размеры кусок, ограничивая их адаптивность в обработке различной сложности и контекста данных.
Точность против семантики : текущие методы поиска обычно фокусируются либо на семантическом понимании, либо в точном поиске, но редко оба.
Ограничение с одним документом .
Стабильность : Iccarnamind совместим с OpenAI GPT, Anpropic Claude, Llama2 и другими LLMS с открытым исходным кодом, обеспечивая стабильный анализ.

Ключевые функции

Адаптивная подставка : наша техника раздвижного окна динамически настраивает размер и положение окна для тряпичной тряпки, балансируя мелкозернистый и крупнозернистый доступ к данным на основе сложности и контекста данных.
Многодокументированный разговорной QA : поддерживает простые и многообогативные запросы по нескольким документам одновременно, разрушая ограничение с одним годом.
Совместимость файлов : поддерживает форматы файлов PDF и TXT.
Совместимость модели LLM : поддерживает OpenAI GPT, Anpropic Claude, Llama2 и другие LLMS с открытым исходным кодом.

? Архитектура

Архитектура высокого уровня

Раздвижное окно блюдо

Начиная

1. Установка

Установка проста, вам просто нужно запустить несколько команд.

1.0. Предварительные условия

3.8 ≤ Python <3.11 с Conda
Один/весь ключ API Openai, Ключ API Claude Claud
И, конечно, ваши собственные документы.

1.1. Клонировать репозиторий

git clone https://github.com/junruxiong/IncarnaMind
cd IncarnaMind

1.2. Настраивать

Создайте виртуальную среду Conda:

conda create -n IncarnaMind python=3.10

Активировать:

conda activate IncarnaMind

Установите все требования:

pip install -r requirements.txt

Установите Llama-CPP отдельно, если вы хотите запустить квантованные локальные LLMS:

Для поддержки GPU NVIDIA используйте cuBLAS

CMAKE_ARGS= " -DLLAMA_CUBLAS=on " FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Для поддержки Apple Metal ( M1/M2 ) используйте

CMAKE_ARGS= " -DLLAMA_METAL=on "  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Установите свой/все клавиши API в файле configparser.ini :

[tokens]
OPENAI_API_KEY = (replace_me)
ANTHROPIC_API_KEY = (replace_me)
TOGETHER_API_KEY = (replace_me)
# if you use full Meta-Llama models, you may need Huggingface token to access.
HUGGINGFACE_TOKEN = (replace_me)

(Необязательно) Настройка пользовательских параметров в файле configparser.ini :

[parameters]
PARAMETERS 1 = (replace_me)
PARAMETERS 2 = (replace_me)
...
PARAMETERS n = (replace_me)

2. Использование

2.1. Загрузите и обработайте свои файлы

Поместите все свои файлы (пожалуйста, правильно назовите каждый файл, чтобы максимизировать производительность) в каталог /data , и запустите следующую команду для употребления всех данных: (вы можете удалить примеры файлов в каталоге /data , прежде чем запустить команду)

python docs2db.py

2.2. Бегать

Чтобы начать разговор, запустите команду как:

python main.py

2.3. Поболтать и задавать любые вопросы

Подождите, пока сценарий требует вашего ввода, как ниже.

Human:

2.4. Другие

Когда вы запустите чат, система автоматически генерирует файл incarnamind.log . Если вы хотите отредактировать журнал, пожалуйста, отредактируйте в файле configparser.ini .

[logging]
enabled = True
level = INFO
filename = IncarnaMind.log
format = %(asctime)s [%(levelname)s] %(name)s: %(message)s

Ограничения

Цитация не поддерживается для текущей версии, но скоро выпустит.
Ограниченные асинхронные возможности.

Предстоящие функции

Frontend UI Interface
Тонко настроенные маленькие размеры LLMS
Поддержка OCR
Асинхронная оптимизация
Поддержать больше форматов документов

? Благодарности

Особая благодарность Langchain, Chroma DB, Localgpt, Llama-CPP за их неоценимый вклад в сообщество с открытым исходным кодом. Их работа сыграла важную роль в том, чтобы сделать проект «Играминанда» реальностью.

? Цитирование

Если вы хотите процитировать нашу работу, используйте следующую запись Bibtex:

 @misc { IncarnaMind2023 ,
  author = { Junru Xiong } ,
  title = { IncarnaMind } ,
  year = { 2023 } ,
  publisher = { GitHub } ,
  journal = { GitHub Repository } ,
  howpublished = { url{https://github.com/junruxiong/IncarnaMind} }
}

? Лицензия

Apache 2.0 Лицензия

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-02-27
размер 49.32MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22