FASTAPI - Fastapi ist ein modernes, Fast (High -Performance) -Web -Framework zum Erstellen von APIs mit Python 3.7+ basierend auf Standard -Tipps für Python -Typ.
Llamaindex - llamaNdex ist ein Datenrahmen für LLM -basierte Anwendungen, die von der Kontextvergrößerung profitieren. Solche LLM-Systeme wurden als Lag-Systeme bezeichnet, die für die „Abruferzeugung“ stehen. Llamaindex liefert die wesentlichen Abstraktionen, um private oder domänenspezifische Daten leichter aufzunehmen, zu strukturieren und zuzugreifen, um diese sicher und zuverlässig in LLMs für eine genauere Textgenerierung zu injizieren.
MongoDB Atlas - MongoDB Atlas ist eine vollständig verwaltete Cloud -Datenbank, die von denselben Personen entwickelt wurde, die MongoDB erstellen.
Atlas Vektorsuche - Mit Atlas Vectorsuche können Sie unstrukturierte Daten durchsuchen. Sie können Vektor -Einbettungen mit maschinellem Lernmodellen wie OpenAI und Hugging Face erstellen und sie in Atlas für die Abrufen von Augmented Generation (RAG), semantische Suche, Empfehlungsmotoren, dynamische Personalisierung und andere Anwendungsfälle speichern und indizieren.
Hinweis: Sie müssen einen KNN -Index erstellen, um die Atlas -Vektor -Suche zu verwenden.
Atlas Search . Wählen Sie den Modus "JSON -Editor" und setzen Sie den Index mit den folgenden Inhalten fest: {
"mappings": {
"dynamic": true,
"fields": {
"embedding": {
"dimensions": 1536,
"similarity": "cosine",
"type": "knnVector"
}
}
}
}
Mit Gedichten installieren:
pip install poetry
poetry config virtualenvs.in-project true
poetry shell
poetry install
uvicorn app.main:app --host 127.0.0.1 --port 9080
docker build -t insight-chat .
docker run -d --name insight-chat -p 8080:8080 insight-chat






Kurz gesagt, Llamaindex verwendet das folgende Muster, um Dokumenteinformationen zu speichern:
Der Text eines Dokuments ist in mehrere Knoten unterteilt, auch als „Stücke“ bezeichnet. Unter Verwendung der Dokument -ID als Primärschlüssel werden die Objekte, die jedes Dokument repräsentieren, hauptsächlich Metadaten wie Dateinamen und Hash, im Dokumentstore zusammen mit der Liste der Knoten für dieses Dokument gespeichert. Unter Verwendung der Knoten -ID als Primärschlüssel wird die Einbettung des Knotens im Vektorspeicher gespeichert.

Die drei MongoDB -Implementierungen für die Geschäfte werden in diesem Projekt verwendet:
https://medium.com/@luoning.nici/llamaindex-in-depth-practice-how-to-build-a-relable-storage-subsystem-bith-mongodb-atlas-f306bf2fb480
https://docs.llamaindex.ai/en/stable/index.html
https://www.mongodb.com/atlas