ملاحظات دراسة لانجشين. يعتمد:
openai == 0.27 . 8
langchian == 0.0 . 225بعض الأدوات المشابهة لـ Langchain:
ملاحظة: نظرًا لتحديث Langchain أو Langchain-Chatglm ، قد تكون بعض رموز المصدر والتفسيرات مختلفة.
تضع بعض المقالات مباشرة الروابط وجمعها من الإنترنت.
حاليًا ، هناك مشروعان صينيان يعتمدون على Langchain:
يمكننا أن نتعلم الكثير منه.
propt الأمثل أمر بالغ الأهمية للنتائج.
Yzfly/Langgpt: Langgpt: تمكين الجميع من أن يصبح خبيرًا سريعًا! (github.com): بناء propt منظمة عالية الجودة
على الرغم من أن Langchain يوفر لنا بعض الراحة ، إلا أن هناك أيضًا بعض المشاكل:
لا يمكن حل مشكلة التكنولوجيا الأساسية للنماذج الكبيرة ، وخاصة مشكلة إعادة استخدام propt : أولاً وقبل كل شيء ، العديد من المشكلات في النماذج الكبيرة هي عيوب في التكنولوجيا الأساسية للنماذج الكبيرة ، وليست شيء يمكن أن يحله Langchain. المشكلة الأساسية هي أن العمل الرئيسي لتطوير النماذج على نطاق واسع هو هندسة propt. وهذا يمكن إعادة استخدامه للغاية. ومع ذلك ، فإن هذه الميزات تتطلب جميع proft مكتوبة بخط اليد مخصصة للغاية . كل خطوة في السلسلة تتطلب propt المكتوبة بخط اليد. يجب تنسيق بيانات الإدخال بطريقة محددة للغاية لإنشاء إخراج جيد لخطوة الوظيفة/السلسلة. لا يمثل إنشاء DAG Orchestration لتشغيل هذه السلاسل سوى 5 ٪ من العمل ، و 95 ٪ من العمل هو في الواقع فقط على المطالبة بتنسيقات تسلسل البيانات. هذه الأشياء لا يمكن إعادة استخدامها .
يسبب تجريد Langchain الضعيف و propt المخفية صعوبات في التنمية : ببساطة وضع ، عمل التجريد من Langchain ليس جيدًا بما فيه الكفاية ، لذا يجب بناء العديد من الخطوات بأنفسهم. علاوة على ذلك ، فإن العديد من الدعائم المدمجة من Langchain سيئة ، لذلك فهي ليست جيدة مثل بناءها بنفسك ، لكنها تخفي هذه الدعائم الافتراضية.
يصعب تصحيح أطر Langchain : على الرغم من أن العديد من طرق Langchain توفر معلمات لطباعة المعلومات التفصيلية ، إلا أنها في الواقع لا تملك الكثير من المعلومات القيمة . على سبيل المثال ، من الصعب للغاية إذا كنت ترغب في رؤية استعلامات ProPT أو LLM الفعلية. والسبب هو نفسه كما كان من قبل. لذلك إذا كنت تستخدم Langchain للتطور بشكل سيئ وترغب في تصحيح الرمز لمعرفة ما هي المطالبات التي لديها مشاكل ، فسيكون الأمر صعبًا.
يشجع Langchain قفل الأدوات : يشجع Langchain المستخدمين على تطوير وتشغيل منصتهم ، ولكن إذا كان المستخدمون بحاجة إلى القيام ببعض تدفقات سير العمل غير المشمولة في وثائق Langchain ، فمن الصعب التعديل حتى مع وكيل مخصص. هذا يعني أنه بمجرد أن يبدأ المستخدمون في استخدام Langchain ، قد يجدون أنفسهم محصورة في أدوات وميزات محددة من Langchain ولا يمكنهم التبديل بسهولة إلى أدوات أو منصات أخرى قد تكون أكثر ملاءمة لاحتياجاتهم.
المحتوى أعلاه يأتي من:
في بعض الأحيان ، يمكننا تنفيذ العمليات ذات الصلة لبعض المهام البسيطة من قبل أنفسنا ، بحيث يتم التحكم في كل جزء من قبل أنفسنا ويسهل تعديله.
يقتصر ضبط LLM باستخدام بيانات المجال على حجم موارد الحوسبة ومعلمات النماذج ، وسيتم شائعات النموذج. وهذا ينطوي على سلسلة من القضايا:
الأفكار الأساسية:
1. سؤال المستخدم: يرجى مقارنة منتجات Estee laudert Soft Swear Essence و SK-II للعناية بالبشرة؟
2. توجيه مشكلة Routerchain ، أي كيفية الإجابة على السؤال: (اتصل على LLM مرة واحدة)
3. استخدم المخطط لإنشاء خطوة: (اتصل بـ LLM مرة واحدة)
4. تنفيذ المنفذ ينفذ الخطوات المذكورة أعلاه: (خطوات الاتصال LLM ، N هو مقياس البارامير الذي يشير إلى الحد الأقصى لعدد المكالمات)
5. ملخص جميع النتائج. (اتصل بـ LLM مرة واحدة)
بالمقارنة مع المخطط 1 ، دون استخدام الأدوات ، يتم البحث في قاعدة البيانات مباشرة بناءً على السؤال ، ثم يتم الرد على النتائج التي تم استردادها.
يمكن أن تعتمد طريقة البحث على الكلمات الرئيسية لسؤال معين ، واستخدام أداة ES لاسترداد فقرات TopK مع إجابات محتملة من قاعدة بيانات ضخمة. أرسل هذه الفقرات Topk مع السؤال إلى LLM للإجابة.
يتم تغيير طريقة البحث إلى نموذج المتجه أولاً.

مزايا وعيوب الطريقة أعلاه:
Field Fine Tuning LLM : يتطلب الكثير من القوى العاملة لجمع البيانات والأسئلة والأجوبة في الحقل ، ويتطلب الكثير من طاقة الحوسبة للضبط.
أدوات Langchain + LLM : إنها خدمة LLM كخدمة فرعية. إن توليد LLM غير موثوق به عند استدعاء الأدوات بناءً على المشكلات والأدوات. لا يمكن الاستفادة بشكل جيد من الأدوات. قد لا يكون من الممكن استدعاء الأدوات المناسبة وفقًا للتعليمات ، وقد تكون الخطة سيئة ويصعب السيطرة عليها. المزايا هي: تستخدم لحل المشكلات المعقدة.
Langchain + LLM + Search : الميزة هي بنية الأسئلة والأجوبة الرئيسية في الحقل الحالي ، والعيوب هي أن البحث عن الفقرات التي قد تحتوي على إجابات قد تكون غير دقيقة عند البحث عن إجابات بناءً على السؤال. غير مناسب للأسئلة والأجوبة المعقدة
ملخص: المشكلة الأكبر هي LLM نفسها:
LLM هي قاعدة النظام بأكمله ، ولا يزال هناك العديد من الخيارات المتاحة.
المرجع أعلاه: https://mp.weixin.qq.com/s/fvrchit0c0xhysco_d-sda
اترك بعض الأسئلة للتفكير فيها: قد يكون مرتبطًا بـ Langchain أو نماذج كبيرة
** كيفية اختيار نموذج كبير صيني يعتمد على البيانات في الحقول العمودية؟ ** 1. 2. وفقا لنسخة الترتيب من كل مراجعة. 3. تقييم على بيانات الحقل الخاصة بك. 4. اسحب من نماذج المجال الرأسية الحالية ، مثل النماذج المالية والنماذج القانونية والنماذج الطبية ، إلخ.
** إجابة على البيانات تتكون من سلسلة من الجمل المتصلة. **على سبيل المثال:
怎么能够解决失眠?
1 、保持良好的心情;
2 、进行适当的训练。
3 、可适当使用药物。1. حاول ضبط طول النص المقسم ليكون أكبر. 2. من أجل تجنب الإجابة التي يتم تقسيمها ، يمكنك تعيين نص معين لتكراره بين الفقرات المختلفة. 3. يمكن إرجاع مستندات TOP_K الأولى أثناء البحث. 4. دمج نصوص متعددة تم العثور عليها وتلخيصها باستخدام LLM.
كيفية بناء التضمين في الحقول العمودية؟
كيفية تخزين التضمين الذي تم الحصول عليه؟
كيف توجه LLM للتفكير بشكل أفضل؟ يمكنك استخدام: سلسلة من الأفكار ، اسأل ، رد الفعل .
مقدمة |
مرجع API - ؟؟
https://mp.weixin.qq.com/s/fvrchit0c0xhysco_d-sda
https://python.langchain.com.cn/docs/modules/agents/how_to/custom_llm_chat_agent