新しいGPT-4 APIを使用して、複数の大型PDFファイルのChatGPTチャットボットを構築します。
使用される技術スタックには、Langchain、Pinecone、TypeScript、Openai、およびnext.jsが含まれます。 Langchainは、スケーラブルなAI/LLMアプリとチャットボットを簡単に構築できるようにするフレームワークです。 Pineconeは、埋め込みとPDFをテキストに保存するためのVectorStoreです。後で同様のドキュメントを取得します。
チュートリアルビデオ
ご質問がある場合は、不一致に参加してください
このレポとチュートリアルのビジュアルガイドは、 visual guideフォルダーにあります。
エラーが発生した場合は、このページのさらに下のトラブルシューティングセクションを確認してください。
プレリュード:システムにノードを既にダウンロードしていることを確認してください。バージョンは18歳以上であることを確認してください。
git clone [github https url]
最初にnpm install yarn -gグローバルにYARNをインストールします(まだおかしい場合は)。
その後、実行:
yarn install
インストール後、 node_modulesフォルダーが表示されるようになりました。
.envファイルを設定します.env.example into .env your .envファイルは次のようになります。 OPENAI_API_KEY=
PINECONE_API_KEY=
PINECONE_ENVIRONMENT=
PINECONE_INDEX_NAME=
.envファイルに挿入します。 configフォルダーで、 PINECONE_NAME_SPACE namespaceに置き換えますnpm run ingest実行するときに、埋め込みをPineconeに保存します。この名前空間は、後でクエリと取得に使用されます。
utils/makechain.tsチェーンでは、独自のユーザーのQA_PROMPT変更します。 gpt-4 APIにアクセスできる場合は、 new OpenAIのgpt-4にmodelName変更します。 gpt-4 APIにアクセスできることをこのレポの外部で確認してください。そうしないと、アプリケーションが機能しません。
このレポは、複数のPDFファイルをロードできます
docsフォルダー内で、PDFファイルを含むPDFファイルまたはフォルダーを追加します。
スクリプトを実行してyarn run ingest 「摂取」してドキュメントを埋め込みます。エラーが発生した場合は、以下のトラブルシューティングを行います。
Pineconeダッシュボードを確認して、名前空間とベクトルが追加されていることを確認してください。
埋め込みとコンテンツがPineconeに正常に追加されたことを確認したら、App npm run devを実行してローカル開発環境を起動し、チャットインターフェイスに質問を入力できます。
一般に、ソリューションについては、このリポジトリのissuesとdiscussionsセクションに注意してください。
一般的なエラー
node -vを実行しますConsole.log env変数を調整し、それらが公開されていることを確認します。.envファイルを作成したことを確認してください。OpenAIでmodelName変更する場合は、適切なモデルのAPIにアクセスできることを確認してください。envファイルはSystems env変数によって上書きされます。process.envにハードコーディングしてみてください。ENV変数まだ問題がある場合。松ぼっくりエラー
pinecone.tsおよび.envファイルのPineconeダッシュボードenvironmentとindex環境と一致することを確認してください。1536に設定していることを確認してください。このレポのフロントエンドは、Langchain-chat-nextjsに触発されています