Используйте новый API GPT-4, чтобы создать чат-бот ChatGPT для нескольких больших файлов PDF.
Используется технический стек включает в себя Langchain, Pinecone, TypeScript, OpenAI и Next.js. Langchain - это структура, которая облегчает создание масштабируемых приложений AI/LLM и чат -ботов. PineCone - это векторная магазина для хранения внедрения и вашего PDF в тексте, чтобы позже получить аналогичные документы.
Учебное видео
Присоединяйтесь к раздора, если у вас есть вопросы
Визуальное руководство этого репо и учебника находится в папке visual guide .
Если вы столкнетесь с ошибками, просмотрите раздел по устранению неполадок дальше вниз по этой странице.
Prelude: Пожалуйста, убедитесь, что вы уже загрузили узел в своей системе, а версия - 18 или более.
git clone [github https url]
Сначала запустите npm install yarn -g для установки пряжи во всем мире (если вы еще этого не сделали).
Затем беги:
yarn install
После установки вы должны увидеть папку node_modules .
.env.env.example в .env Ваш файл .env должен выглядеть так: OPENAI_API_KEY=
PINECONE_API_KEY=
PINECONE_ENVIRONMENT=
PINECONE_INDEX_NAME=
.env . В папке config замените PINECONE_NAME_SPACE на namespace , где вы хотели бы сохранить свои вставки в Pinecone, когда вы запускаете npm run ingest . Это пространство имен позже будет использоваться для запросов и поиска.
В utils/makechain.ts цепочка измените QA_PROMPT для вашего собственного использования. Измените modelName в new OpenAI на gpt-4 , если у вас есть доступ к API gpt-4 . Пожалуйста, проверьте за пределами этого репо, что у вас есть доступ к API gpt-4 , в противном случае приложение не будет работать.
Этот репо может загрузить несколько файлов PDF
Внутри папки docs добавьте свои файлы PDF или папки, содержащие файлы PDF.
Запустите сценарий yarn run ingest чтобы «Ingest» и встройте ваши документы. Если вы столкнетесь с ошибками, не устраняйте ошибку ниже.
Проверьте приборную панель Pinecone, чтобы проверить ваше пространство имен и векторы.
После того, как вы подтвердили, что встроенные и контент были успешно добавлены в ваш Pinecone, вы можете запустить приложение npm run dev для запуска локальной среды Dev, а затем ввести вопрос в интерфейсе чата.
В целом, следите за разделом issues и discussions этого репо для решений».
Общие ошибки
node -vConsole.log переменные env и убедитесь, что они выставлены..env , который содержит ваши допустимые (и работающие) клавиши API, среду и имя индекса.modelName в OpenAI , убедитесь, что у вас есть доступ к API для соответствующей модели.env из проекта будет перезаписан Variable Systems env .process.env , если все еще есть проблемы.Ошибки Pinecone
environment Pinecone Dashboard и index совпадает в файлах pinecone.ts и .env .1536 .Ледовый фронт этого репо вдохновлен Langchain-Chat-nextjs