اشتعلت فيه البحث الدلالي السريع عن قنوات الخلاف
يمكّن ask-discord المستخدمين من البحث بشكل دلالي من خلال مجموعة بيانات من رسائل Discord. هناك وضعان رئيسيان للبحث:
استنساخ المستودع :
git clone https://github.com/yourusername/ask-discord.git
cd ask-discordتثبيت التبعيات :
pip install -r requirements.txt إعداد متغيرات البيئة : قم بإنشاء ملف .env في دليل الجذر وأضف مفتاح API Openai:
OPENAI_KEY = your_openai_api_keyابدأ Milvus : اتبع دليل تثبيت Milvus لإعداد وبدء Milvus. (يتطلب تثبيت Docker حديث)
إنشاء البيانات : قم بتنزيل قنوات الاهتمام باستخدام مصدر دردشة Discord. اقرأ هذا الدليل إذا كنت تواجه مشكلة في الحصول على معرفات الرمز المميز والقناة. هذا ليس تأييدًا لأن قنوات التنزيل قد تنتهك TOS Discord.
قم بتحميل البيانات : تأكد من أن ملف بيانات JSON في المسار الصحيح المحدد في configs . تعديل المسار في الملف الرئيسي إذا لزم الأمر.
قم بتشغيل تطبيق SPEREMLIT :
streamlit run ask-discord.py الوصول إلى التطبيق : افتح متصفح الويب الخاص بك وانتقل إلى http://localhost:8501 .
Chatbot التي تتولى الاستعلام عن Milvus والتفاعل مع وضع Raw/LLM. تتم إدارة التكوينات من خلال قاموس في ask-discord.py . وتشمل هذه:
OPENAI_CLIENT : مثيل عميل Openai.CHAT_MODEL : النموذج الذي يجب استخدامه للدردشة (على سبيل المثال ، gpt-4o ).EMBEDDING_MODEL : النموذج الذي يجب استخدامه لتوليد التضمينات.JSON_DATA_PATH : مسار إلى ملف بيانات JSON.EMBEDDING_DIMENSIONS : أبعاد المتجهات.MAX_MESSAGE_LENGTH : الحد الأقصى لعدد الأحرف في رسالة يجب مراعاتها.MIN_MESSAGE_LENGTH : الحد الأدنى لعدد الأحرف في رسالة يجب مراعاتها.COLLECTION_NAME : اسم مجموعة Milvus.MAX_SIMILAR_EXAMPLES : الحد الأقصى لعدد الرسائل المماثلة لاسترداده.SIMILARITY_SCORE_CUTOFF : قطع لدرجة التشابه. المساهمات مرحب بها! يرجى إرسال طلب سحب أو فتح مشكلة لمناقشة أي تغييرات.
هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. انظر ملف الترخيص لمزيد من التفاصيل.