FASTAPI - FASTAPI adalah kerangka kerja web modern, cepat (berkinerja tinggi), untuk membangun API dengan Python 3.7+ berdasarkan petunjuk tipe Python standar.
LLAMAINDEX - LLAMAINDEX adalah kerangka data untuk aplikasi berbasis LLM yang mendapat manfaat dari augmentasi konteks. Sistem LLM semacam itu telah disebut sebagai sistem kain, berdiri untuk “generasi yang dibeli dengan pengambilan”. LlamAinDex memberikan abstraksi penting untuk lebih mudah menelan, struktur, dan mengakses data pribadi atau khusus domain untuk menyuntikkan ini dengan aman dan andal ke LLM untuk pembuatan teks yang lebih akurat.
MongoDB Atlas - MongoDB Atlas adalah database cloud yang dikelola penuh yang dikembangkan oleh orang yang sama yang membangun MongoDB.
Pencarian Vektor Atlas - Pencarian Vektor Atlas memungkinkan Anda mencari data yang tidak terstruktur. Anda dapat membuat embeddings vektor dengan model pembelajaran mesin seperti openai dan memeluk wajah, dan menyimpan dan mengindeksnya di atlas untuk pengambilan generasi augmented (RAG), pencarian semantik, mesin rekomendasi, personalisasi dinamis, dan kasus penggunaan lainnya.
Catatan: Anda perlu membuat indeks KNN untuk menggunakan pencarian vektor atlas.
Atlas Search . Pilih mode "JSON Editor" dan atur indeks dengan konten berikut: {
"mappings": {
"dynamic": true,
"fields": {
"embedding": {
"dimensions": 1536,
"similarity": "cosine",
"type": "knnVector"
}
}
}
}
Instal dengan puisi:
pip install poetry
poetry config virtualenvs.in-project true
poetry shell
poetry install
uvicorn app.main:app --host 127.0.0.1 --port 9080
docker build -t insight-chat .
docker run -d --name insight-chat -p 8080:8080 insight-chat






Singkatnya, LlamAinDex menggunakan pola berikut untuk menyimpan informasi dokumen:
Teks dokumen dibagi menjadi beberapa node, juga dikenal sebagai "potongan"; Menggunakan ID dokumen sebagai kunci utama, objek yang mewakili setiap dokumen, terutama metadata seperti nama file dan hash, disimpan di toko dokumen, bersama dengan daftar node untuk dokumen itu; Menggunakan Node ID sebagai kunci utama, embedding node disimpan di toko vektor.

Tiga implementasi MongoDB untuk toko digunakan dalam proyek ini:
https://medium.com/@luoning.nici/llamaindex-in-depth-practice-how-to-build-a-eliable-storage-subsystem-with-mongodb-atlas-f306bf2fb480
https://docs.llamaindex.ai/en/stable/index.html
https://www.mongodb.com/atlas