هذا بنية تجريبية جديدة لمحرك استرجاع مقياس الإنترنت مدعوم من LLM. تختلف هذه الهندسة المعمارية تمامًا عن عوامل البحث الحالية ، والتي تم تصميمها كمحركات إجابة .
يمكنك رؤية بعض نتائج المثال هنا: https://deep- seek.vercel.app/ (لاحظ أن هذا لن يتيح لك إجراء استعلامات حقيقية ، لأنني لن أتمكن من تحمله؟)
الفرق الرئيسي بين المفاهيم 2 ينقسم إلى:
النتيجة النهائية لمحرك الإجابة هي تقرير بحثي ، والنتيجة النهائية لمحرك الاسترجاع هي جدول مع جميع الكيانات التي تم استردادها والأعمدة المخصبة.
إليك ما تبدو عليه النتيجة النهائية (تم تكبيرها للمقياس): 
هذا هو في الواقع جزء صغير من النتيجة لهذا الاستعلام. النتيجة الفعلية كبيرة جدًا ، من المستحيل لقطة الشاشة. هناك 94 سجلًا في النتيجة النهائية ، التي جمعها الوكيل وخصمها بعد تصفحها من خلال 356 مصدرًا.
يقوم العامل أيضًا بإنشاء درجة ثقة للبيانات في خلايا الجدول أثناء إثراءها. لاحظ أن هناك بعض الخلايا التي تم تسليط الضوء عليها باللون الأصفر - تلك هي الخلايا ذات الثقة المنخفضة. هذه هي الحالات التي قد تتعارض فيها المصادر ، أو لا توجد مصادر على الإطلاق ، لذا فإن الوكيل قد قدم أفضل تخمينًا. هذا في الواقع رقم بين 0 - 1 ، لذلك يمكن أن يكون هناك بالتأكيد واجهة مستخدم أفضل وأكثر إبداعًا لعرض النتيجة في الإخلاص العالي.
تثبيت أي واحد من مديري الحزم التالية
اتبع الإرشادات الواردة في التثبيت لتثبيت مدير الحزمة وتبعيات المشروع
لتشغيل خادم DEV ، استخدم أحد الأوامر التالية وفقًا لمدير الحزمة الخاص بك
npm run dev
# or
yarn dev
# or
pnpm dev
# or
bun devافتح http: // localhost: 3000 مع متصفحك للبدء في البحث أو استكشاف الأمثلة التي تم بناؤها مسبقًا. لاحظ أن الأمثلة لن تدير الوكيل فعليًا (يكلف الكثير من $) ، فهو أكثر هناك لإظهار الطاقة وعيوب الهندسة المعمارية من خلال السماح لك بفحص النتائج.
إذا كان لديك مجموعة متغيرات البيئة ، فيمكنك تشغيله بنفسك. لاحظ أن الأمر يستغرق حوالي 5 دقائق وقد يكلف ما بين 0.1 - 3 دولارات من الاعتمادات ، اعتمادًا على عدد الكيانات التي تم استردادها ومقدار البيانات التي تحتاج إلى تخصيب.
عند تشغيل الوكيل ، تحقق من المحطة لمشاهدة سجلات ما يحدث وراء الكواليس.
تأكد من أن لديك مفاتيح API للأنثروبور و EXA.
قم بإنشاء ملف .env ، ووضعه في متغيرات البيئة التالية:
ANTHROPIC_KEY="anthropic_api_key"
EXA_KEY="exa_api_key"
يعمل النظام كعامل أبحاث متعدد الخطوات. يتم تقسيم استعلام المستخدم الأولي إلى خطة ويتم إنشاء الإجابة بشكل متكرر أثناء تدفقه عبر النظام. اسم آخر لهذا النوع من الهندسة المعمارية هو هندسة التدفق.
يتم تقسيم خط أنابيب البحث إلى 4 خطوات رئيسية:
الخطة - بناءً على استعلام المستخدم ، يقوم المخطط ببناء شكل النتيجة النهائية. يقوم بذلك عن طريق تحديد نوع الكيان للاستخراج ، وكذلك الأعمدة المختلفة في الجدول الناتج. تمثل الأعمدة بيانات إضافية ذات صلة باستعلام المستخدم المتعلق بالكيانات.
البحث - نستخدم كل من البحث عن الكلمات الرئيسية القياسية والبحث العصبي للعثور على المحتوى ذي الصلة للمعالجة (يتم توفير كلا النوعين من البحث بواسطة EXA). البحث عن الكلمات الرئيسية أمر رائع في العثور على محتوى تم إنشاؤه للمستخدم يتحدث عن الكيانات التي يمكن العثور عليها (مثل المراجعات ، القوائم .. إلخ). البحث العصبي رائع في العثور على كيانات محددة نفسها (على سبيل المثال الشركات ، الأوراق .. إلخ).
المستخلص - تتم معالجة جميع المحتوى الموجود في البحث عبر LLM لاستخراج كيانات محددة ومحتوياتها المرتبطة بها. يتم ذلك من خلال تقنية جديدة أختبرها حيث يتم إدراج الرموز المميزة الخاصة بين الجمل (تقسيم عبر نموذج اللغة الصغيرة في Winknlp) في المحتوى ، ويتم تكليف LLM بتحديد نطاق المحتوى للاستخراج عن طريق الإشارة إلى الرموز المبدئية والنهاية. هذا فائق السرعة والكفاءة الرمزية.
إثراء - لدينا بالفعل وكيل إجابة أصغر ضمن وكيل الاسترجاع الأكبر هذا ، وتتمثل مهمته في إثراء جميع الأعمدة المحددة من قبل المخطط لكل كيان. هذا هو الجزء الأكثر استهلاكًا للوقت في العملية بأكملها ، ولكن هذا هو السبب أيضًا في أن هذا الوكيل دقيق للغاية.
إليك تدفق أكثر تفصيلاً لكيفية عمله: 
لأي شخص يستكشف هذه الهندسة المعمارية - إذا وجدت حالة استخدام جيدة أو مثيرة للاهتمام ، فيرجى إضافتها إلى قائمة الأمثلة حتى يتمكن الآخرون من التحقق من ذلك! هناك ملف examples.ts ضمن app مع جميع البيانات الأولية للأمثلة. يمكنك الحصول على بيانات RAW عبر وحدة التحكم في المتصفح بعد الانتهاء من تشغيل الاستعلام (فقط نسخه إلى ملف الأمثلة).
فرز / ترتيب الكيانات التي تم استردادها حسب الأهمية - هذا مهم بشكل خاص للاستعلامات مع تصفيات مثل "Best" أو "الأحدث" ... وما إلى ذلك. يجب إضافة هذا كخطوة إضافية في نهاية خط الأنابيب.
قرار أفضل للكيانات للكشف عن الكيانات المكررة - لا يزال الوكيل يتعثر من خلال أشياء مثل M2 vs M3 MacBooks في بعض الأحيان ، هناك تقنيات لتحسين عناوين كيان تنسيق يمكن أن تؤدي إلى أداء أفضل هنا.
فيما يتعلق بالنقطة السابقة ، تحقق أفضل من المصادر عند إثراءها للتأكد من توصيلها بالكيان البطني.
دعم للتصفح العميق للمصادر - في بعض الأحيان ، يجب على الوكيل النقر حول صفحة الويب للحفر حقًا في المحتوى ، سيكون هذا مطلوبًا للقيام بعمل جيد في البحث من خلال أوراق البحث على Arxiv ، على سبيل المثال.
دعم البث في البيانات - سيكون من المدهش رؤية القائمة المأهولة بالسكان والخلايا التي يتم تخصيبها في الوقت الفعلي في واجهة المستخدم. في الوقت الحالي ، يمكنك فقط الحصول على إحساس بالتقدم من خلال مشاهدة السجلات على المحطة.
إذا كنت ترغب في التعاون في هذا أو ترغب فقط في مناقشة الأفكار ، فلا تتردد في مراسلتي عبر البريد الإلكتروني على [email protected] أو Ping Me على Twitter.