يساعد Aimon المطورين على بناء تطبيقات LLM ، ومراقبة LLM بشكل أكثر ثقة وموثوقة مع نظامها الحديث ، متعدد الطرازات لاكتشاف مشكلات جودة LLM. يساعد بسلاسة مع كل من التقييمات غير المتصلة بالإنترنت ومراقبة الإنتاج المستمر. يقدم AIMON الكشف عن الهلوسة بسرعة وموثوقة وفعالة من حيث التكلفة. كما يدعم مقاييس الجودة المهمة الأخرى مثل الاكتمال ، ودقيق السمية والسمية. اقرأ منشور المدونة لدينا لمزيد من التفاصيل.
انضم إلى مجتمعنا على Slack

فيما يلي قائمة بمقاييس الجودة المتوفرة حاليًا وعلى خريطة الطريق الخاصة بنا. يرجى التواصل للتعبير عن اهتمامك بأي من هذه.
| متري | حالة |
|---|---|
| الهلوسة النموذجية (مستوى المرور والجملة) | ✓ |
| اكتمال | ✓ |
| الدقة | ✓ |
| سمية | ✓ |
| الالتزام بالتعليم | ✓ |
يدعم AIMON الأجهزة غير المتزامنة أو الاكتشافات المتزامنة للمقاييس المذكورة أعلاه. استخدم هذه الخطوات للبدء في استخدام AIMON SDK والمنتج.
pip install aimon في المحطة الخاصة بك. from aimon import Detect
detect = Detect ( values_returned = [ 'context' , 'generated_text' ], config = { "hallucination" : { "detector_name" : "default" }})
@ detect
def my_llm_app ( context , query ):
# my_llm_model is the function that generates text using the LLM model
generated_text = my_llm_model ( context , query )
return context , generated_textanalyze_prod .
لإثبات فعالية نظامنا ، قمنا بتقييمها مع معايير الصناعة الشعبية لمهمة الكشف عن الهلوسة. يوضح الجدول أدناه نتائجنا.
بعض الوجبات الرئيسية:
✅ AIMON هو 10x أرخص من GPT-4 Turbo.
✅ Aimon هو 4x أسرع من GPT-4 Turbo.
✅ يوفر AIMON راحة واجهة برمجة تطبيقات مستضافة بالكامل تتضمن قابلية لشرح المخبوزات.
✅ دعم طول السياق يصل إلى 32000 رمز (مع خطط لزيادة توسيع هذا في المستقبل القريب).
بشكل عام ، يكون AIMON أرخص بعشر مرات ، وأسرع 4 مرات ، وقريبة من أو حتى أفضل من GPT-4 على المعايير مما يجعلها خيارًا مناسبًا لكل من الهلوسة على الإنترنت.
| متري | AIMON تعتمد V1 | GPT-4 Turbo (LLM-AS-A-JUGNE) |
|---|---|---|
| طول السياق | 32000 | 128000 |
| دقة مجموعة البيانات الحقيقية | 0.808 / 0.922 | 0.810 / 0.926 |
| SUMMAC (اختبار) دقة متوازنة | 0.778 | 0.756 |
| Summac (اختبار) AUC | 0.809 | 0.780 |
| اختبار ترتيب أي حال لدقة الهلوسة | 0.665 | 0.741 |
| اختبار الترتيب anyscale للهلوسة rel. دقة | 0.804 | 0.855 |
| متوسط. كمون | 417ms | 1800ms |
| التكلفة (15 متر الرموز عبر جميع مجموعات البيانات القياسية) باستثناء الطبقة المجانية | 15 دولار | 158 دولار |
| استضافتها بالكامل | ✅ | ✅ |
| شرح | درجات على مستوى الجملة التلقائي | التفكير التفصيلي مع هندسة موجهة إضافية |
هناك نقص في مجموعات البيانات القياسية المعيارية لهذه المقاييس. سنقوم بنشر مجموعة بيانات التقييم قريبًا. ابقوا متابعين! ⌛
الرجوع إلى موقع الويب AIMON.AI للحصول على التفاصيل.
انضم إلى مجتمع Slack لدينا للحصول على آخر التحديثات والمناقشات حول موثوقية الذكاء الاصطناعي.