Eine Streamlit-App, die Langchain-, OpenAI-Einbettungsdings, GPT 3.5-Turbo- und Pnecone-Vektor-Datenbanken verwendet, um ein von Benutzer bereitgestellter Dokument zu verarbeiten. Das Dokument ist unterteilt und dann unter Verwendung von OpenAI -Einbettungen in Worteinbettdings umgewandelt. Die Einbettungen werden in einen Pnecone -Index eingefügt, der nach der Laufzeit gelöscht wird. Langchain wird verwendet, um Informationen über die QA abzurufen
Laden Sie das Dokument in die Seitenleiste hoch: .pdf, .docx und .txt -Dateien werden unterstützt. Sie können die Chunk -Größe auch steuern, um die Qualität der Antworten zu verbessern.
Verwenden Sie streamlit run doc_chat.py, um die App auszuführen, das Dokument hochzuladen und dann mit dem DOC zu chatten. Vergessen Sie nicht, den Pnecone -Index am Ende der Sitzung zu löschen.