Dirancang untuk penggunaan offline, template aplikasi RAG ini didasarkan pada tutorial Andrej Baranovskij. Ini menawarkan titik awal untuk membangun pipa kain lokal Anda sendiri, terlepas dari API online dan layanan LLM berbasis cloud seperti OpenAI. Ini memberdayakan pengembang untuk bereksperimen dan menggunakan aplikasi Rag di lingkungan yang terkontrol.
Aplikasi FullStack UI yang dihasilkan menggunakan create-llama dan disesuaikan untuk proyek ini dapat ditemukan di https://github.com/tyrell/llm-ollama-llamaindex-bootstrap-ui
Posting blog saya memberikan lebih banyak konteks, motivasi, dan pemikiran di balik proyek -proyek ini.
Aplikasi RAG ini berjalan sepenuhnya offline, memanfaatkan CPU lokal Anda untuk menghasilkan/mengambil/peringkat respons tanpa memerlukan akses internet. Penyebaran kain ini hanya bergantung pada CPU lokal Anda untuk perhitungan. Harap dicatat bahwa memproses kumpulan data besar atau menggunakan model intensif sumber daya dapat memperlambat kinerja.
docker compose up -d
pip install -r requirements.txt
Instal ollama dan tarik model LLM yang disukai yang ditentukan dalam config.yml
Salin teks file pdf ke folder data
Jalankan skrip, untuk mengonversi teks ke vektor embeddings dan simpan di Weaviate:
python ingest.py
python main.py "Who are you?"
Menjawab:
Answer:
I am an AI language model, designed to assist and provide information based on the context provided. In this case, the context is related to an invoice from Chapman, Kim and Green to Rodriguez-Stevens for various items such as wine glasses, stemware storage, corkscrew parts, and stemless wine glasses.
Here are some key details from the invoice:
- Invoice number: 61356291
- Date of issue: 09/06/2012
- Seller: Chapman, Kim and Green
- Buyer: Rodriguez-Stevens
- VAT rate: 10%
The invoice includes several items with their respective quantities, unit measures (UM), net prices, net worth, gross worth, and taxes. The summary section provides the total net worth, VAT amount, and gross worth of the invoice.
==================================================
Time to retrieve answer: 37.36918904201593
Anda dapat menemukan lebih banyak prompt di prompt.txt untuk menguji aplikasi template. Setelah Anda membaca basis kode, memperluas kain ke kebutuhan spesifik Anda.
Apache 2.0
~ Tyrell Perera