Proyek ini mengimplementasikan sistem kueri dokumen bertenaga AI menggunakan model bahasa Langchain, Chromadb, dan Openai. Ini memungkinkan pengguna untuk membuat database yang dapat dicari dari dokumen Markdown dan menanyakannya menggunakan bahasa alami.

requirements.txt python -m venv .venv
source .venv/bin/activate # On Windows, use `.venvScriptsactivate`
pip install -r requirements.txt
.env : OPENAI_API_KEY=your_api_key_here
Ikuti langkah-langkah ini untuk mengatur dengan cepat dan menggunakan mesin kueri VectorDB-llm berbasis RAG:
Buat database dari dokumen penurunan harga Anda:
python create_database.py --data_folder data/go-docs --chroma_db_path chroma_go_docs/
Perintah ini akan memproses file-file Markdown di direktori Data/ GO-DOCS dan membuat database vektor di folder/ folder CHROMA_GO_DOCS.
Permintaan database dengan pertanyaan bahasa alami:
python query_data.py --query_text "Explain goroutines in go in a sentence" --chroma_db_path chroma_go_docs/ --prompt_model gpt-3.5-turbo
Lihat respons yang dihasilkan AI:
Goroutines are lightweight, concurrent functions or methods in Go that run independently, managed by the Go runtime, allowing for efficient parallel execution and easy implementation of concurrent programming patterns.
Untuk instruksi penggunaan yang lebih rinci, lihat bagian berikut:
Buat database
python create_database.py --data_folder path/to/your/markdown/files --chroma_db_path path/to/save/database
Meminta database
python query_data.py --query_text "Your question here" --chroma_db_path path/to/database --prompt_model gpt-3.5-turbo
create_database.py : skrip pembuatan databasequery_data.py : skrip permintaan databaseestimate_cost.py : Modul Estimasi Biayaget_token_count.py : utilitas penghitungan tokendata/ : Direktori Dokumen Markdownchroma/ : Penyimpanan Basis Data Chromadb (GitIgnored) text-embedding-3-small untuk embeddings dan gpt-3.5-turbo untuk tanggapan secara defaultdata/ atau tentukan jalur khususchroma/ (GitIgnored) Proyek ini dilisensikan berdasarkan ketentuan lisensi MIT. Untuk informasi lebih lanjut, silakan merujuk ke file lisensi.
Untuk pertanyaan atau masalah, silakan buka masalah di Github Repository.