Первый этап
- Тряпичный файл
- Большая языковая модель:
- Языковая модель: «DataBricks/DBRX-Instruct»: https://huggingface.co/databricks/dbrx-instruct
- Клиент NVIDIA: https://build.nvidia.com/databricks/dbrx-instruct
- Векторная база данных:
- Милвус: https://milvus.io/
- Модель встраивания: https://huggingface.co/thenlper/gte-base
- Поддержка ОС: Linux
- В настоящее время не поддерживает ОС Windows, потому что Milvus_Lite не поддерживает ОС Windows
- В будущем выберет различную базу данных, чтобы решить эту проблему
- PDF_TO_TXT -файл
- Текущая ручка:
- PDF (текст) в TXT
- Необходимо улучшить предварительную обработку по заказу, чтобы подавать модель RAG
- Прогресс (01.10.2024): упрощенная версия работает на Linux, с одной способностью запроса
- (10/02/2024): способен повторно использовать коллекцию для запроса
Второй этап (ток)
- Создание читателя PDF с использованием OCR
- Принять загруженный PDF
- Читать с помощью easyocr
- хранить результаты в файлах, предпочтительно по одному файлу для каждого PDF
- Rag -файл поддерживает рекурсивный вопрос и ответ
- Способен хранить исторический QA в соответствующих файлах
Этап третий
- Объединить тряпку с PDF -читателем
- Поддержка LLM долгосрочная память
- Добавить историю QA в другое хранилище
- Объединить ответы с историей
Очистка внедрения и оптимизировать
- оптимизация, скорость и память
Развертывание?