تم تصميم نماذج لغوية كبيرة للقيام بمهام باللغة البشرية بشكل فعال مثل الترجمة والتلخيص والتفكير والتصنيف ، والتقاط المعلومات السياقية ، والتقاط الدلالات وتجنيد اللغات ، ولكن في الآونة الأخيرة بعد نشوئها من GPT-3.5 ، والتعليمات المفتوحة ، والمصادر المفتوحة ، مثلما تشبه النماذج ، والتصنيع ، والتصنيع ، والتصنيع ، والتقنيات ، والتقنيات ، في التصميمات الكمية ، رمز تصحيح الأخطاء ، قدم بعض المعلومات حول حالات استخدام المجال المحددة ، وأكثر من ذلك .. بالطبع يمكن أن يقدم الكثير منهم إجابات على الكثير من الأسئلة ، ولكن بمجرد أن نبدأ في طرح الأسئلة على الأسئلة ، لا تعرف LLMs أي شيء عنها أو لا يمكنهم حفظها ، فإنها تهين ، وتقديم إجابات خاطئة.
حل لهذه المشكلة لاستخدام LLMS بشكل فعال ، وتوفير المعلومات المحدثة هو باستخدام قواعد بيانات المتجهات وتقنيات الهندسة السريعة لبناء أنظمة توليد من أجل الاسترجاع ، والتي يمكن:: يمكن:
هذه التقنية تقلل من الهلوسة ، وتوفر LLMs مع السياق (المعرفة) يحتاجون إلى الإجابة على الأسئلة بفعالية.
mkdir data/db
mkdir data/newsmkdir sts
cd sts
git lfs install
git clone https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2poetry installmake qdrantإنها أبسط خطوة فقط تشغيل هذا الأمر
make run date= ' 2023-11-09 '