Genaius KT هو Qاقين chatbot مصمم لإدارة المعرفة داخل الشركة. يساعد الموظفين ، وخاصة المتدربين والمتدربين الجدد ، في فهم المشاريع المستمرة والسابقة. يستجيب chatbot للاستفسارات المتعلقة بالمحتوى التعليمي وتفاصيل المشروع ، مما يجعل نقل المعرفة سلسًا وفعالًا.
GenAIus/
├── backend/
│ ├── Data/
│ │ └── (Initial raw data of multiple formats)
│ ├── DataChunks/
│ │ └── (Extracted data chunks from all_extracted_data.txt)
│ ├── Downloads/
│ │ └── (Connected with MongoDB to download data)
│ ├── AllCleanData.txt
│ ├── ExtractedRawData.txt
│ ├── app.py
│ ├── cleaningChunks.py
│ ├── downloadRawFiles.py
│ ├── embeddings.json
│ ├── environment.yml
│ ├── extractor.py
│ ├── model.py
│ ├── ScrapeHTML.py
│ ├── splittingDataToChunks.py
│ └── uploadRawFiles.py
├── frontend/
│ └── (Next.js files)
├── README.md
└── LICENSEيتكون خط الأنابيب لـ Genaius chatbot من عدة خطوات:
تتضمن الخطوة الأولى في خط الأنابيب جمع البيانات من مستندات الشركة المختلفة ، بما في ذلك:
نظرًا لأن بيانات الشركة غالبًا ما تكون سرية ، فقد تم إنشاء بيانات وهمية ولكن واقعية في هذه التنسيقات.
يتم تنفيذ استخراج البيانات النصية باستخدام العديد من مكتبات Python ، والتي تقرأ محتويات تنسيقات الملفات المختلفة وحفظها في ملف نصي موحد ( ExtractedRawData.txt ). تشمل المكتبات المستخدمة:
osdocxcsvopenpyxlPyPDF2cv2pytesseractpptxselenium (للبيانات المستندة إلى الويب) تتم معالجة البيانات النصية المستخرجة مسبقًا باستخدام نموذج Google Gemini AI. بالنظر إلى مجموعة البيانات الكبيرة ، يتم قطع البيانات إلى قطع أصغر ومعالجتها على دفعات. يتم حفظ البيانات التي تم تنظيفها في ملف يسمى AllCleanData.txt .
يستخدم المشروع مفتاح Gemini API لقطع غيار تنظيف البيانات والتدريب. بعد استنساخ المشروع أو وضعه ، تأكد من استبدال العنصر النائب في ملف .env بمفتاح Gemini API الخاص بك.
بمجرد تنظيف البيانات ، تتمثل الخطوة التالية في إنشاء تضمينات متجه باستخدام نموذج Gemini AI. يستخدم chatbot هذه التضمينات لاسترداد المعلومات ذات الصلة بناءً على استعلامات المستخدم ، مما يضمن تركيزه على مجاله.
الواجهة الخلفية القارورة هي المسؤولة عن توصيل الواجهة الأمامية بمنطق معالجة chatbot. تعالج الواجهة الخلفية الطلبات والاستجابات بين واجهة المستخدم ونموذج الذكاء الاصطناعي.
تم تصميم واجهة المستخدم باستخدام Next.js ، مما يوفر واجهة دردشة سهلة الاستخدام للموظفين للتفاعل مع Genaius chatbot. يؤكد تصميم الواجهة الأمامية على إمكانية الوصول وسهولة الاستخدام.
لإعداد المشروع محليًا ، اتبع هذه الخطوات:
استنساخ المستودع:
git clone https://github.com/Pree-04/Team-GenAIus
cd GenAIus
هام: بعد استنساخ المشروع أو تفعيله ، تأكد من تغيير الدلائل والمسارات في الكود لتعكس المسارات المحلية الخاصة بك حيث قمت بحفظ ملفات المشروع.
تثبيت التبعيات الخلفية: CD Backend PIP تثبيت -r متطلبات. txt
قم بإعداد الواجهة الأمامية: تثبيت CD Frontend NPM
إنشاء ملف .env في دليل الواجهة الخلفية وأضف مفتاح API Gemini: gemini_api_key = your_gemini_api_key_here
لتشغيل خادم الواجهة الخلفية: CD الخلفي Python app.py
لبدء الواجهة الأمامية: CD Frontend NPM Run Dev
تفضل بزيارة http: // localhost: 3000 للتفاعل مع chatbot.
التكامل من طرف إلى طرف: نشر تطبيق الويب بالكامل مع تكامل شامل لـ chatbot لتعزيز إمكانية وصوله. التحكم في الوصول الهرمي: قم بتنفيذ ميزة تقيد الوصول إلى البيانات السرية بناءً على موقف الموظف داخل المؤسسة. هذا يضمن أن المعلومات الحساسة لا يمكن الوصول إليها إلا لأولئك الذين يعانون من التطهير المناسب.
المساهمات مرحب بها! يرجى إنشاء طلب سحب أو فتح مشكلة للمناقشة.
هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. انظر ملف الترخيص للحصول على التفاصيل.