تلخيص ورقة البحث: نهج متكامل مع أساليب جذابة وتكنولوجيا الخرقة
نظرة عامة على المشروع
يهدف هذا المشروع إلى تطوير نظام شامل لتلخيص الأوراق البحثية ، والجمع بين أحدث التطورات في AI و NLP. يشمل منهجيتين أساسيتين:
- تلخيص النص الخبيث : باستخدام الشبكات العصبية العميقة مع ترميز التشفير وآلية الاهتمام ، تهدف هذه الطريقة إلى توليد ملخصات موجزة وأعيد صياغة للأوراق البحثية.
- دمج LLMS وتكنولوجيا الخرقة : تسخير قدرات نماذج اللغة الكبيرة (LLMs) والجيل المتمثل في الاسترجاع (RAG) ، يركز هذا النهج على إنتاج ملخصات تفاعلية واستخراج رؤى قيمة من الأوراق البحثية.
المنهجية
تلخيص النص الجذاب
- الهدف: لإنتاج ملخصات إعادة صياغة تغلف الأفكار الأساسية للأوراق البحثية.
- التقنيات: نموذج ترميز التشفير مع آلية الانتباه ، ونقل التعلم.
نماذج لغة كبيرة وتكنولوجيا خرقة
- الهدف: لاستخدام LLMS للتلخيص التفاعلي.
- العملية: ضبط LAMINI LLM ، تطوير الرسوم البيانية المعرفة مع NEO4J ، وتنفيذ منهجية RAG.
مصدر البيانات
مصادر البيانات الأولية هي أوراق بحثية من مختلف المجالات ، مع التركيز على مقدمةها ومنهجيتها وأقسام الاستنتاج.
️ القيود
- الاعتماد على توافر وجودة بيانات ورقة البحث.
- يمكن أن تتحدى الطبيعة المتنوعة للأوراق البحثية عملية التلخيص.
- صقل كثيف المكثف للموارد من LLMs.
- التحديات غير المتوقعة المحتملة مع منهجية خرقة.
؟ خاتمة
يسعى مشروعنا إلى دمج تلخيص النص الخبيث مع LLMs وتكنولوجيا RAG لتطوير نهج فريد لاستخراج رؤى من الأوراق البحثية.
؟ مراجع
- وو مينغاو وآخرون. "Lamini-LM: قطيع متنوع من النماذج المقطرة من تعليمات واسعة النطاق." Arxiv preprint Arxiv: 2304.14402 (2023).
- لويس باتريك وآخرون. "جيل من أجل الاسترجاع لمهام NLP كثيفة المعرفة." التقدم في أنظمة معالجة المعلومات العصبية 33 (2020): 9459-9474.
- نالاباتي راميش وآخرون. "تلخيص النص الخبيث باستخدام RNNs التسلسل إلى التسلسل وما بعده." Arxiv preprint Arxiv: 1602.06023 (2016).
مساهمو المشروع: سميت شاه ، مايور بهانوشالي ، إندراجيت روي