
a nanogpt nanogpt ، ولكن تم تحريكها على بيانات المحادثة
جميع التحديثات في التحديثات. md
رابط كولاب
لعرض capabilites ، توجه إلى Colab Link ، ما عليك سوى تشغيل git clone ، pip install ، prepare.py ، ثم قم بتشغيل chat.py مع --init_from=huggingface
مجموعة بيانات متوسطة (حوالي 700 ميجابايت) ، مليئة بمجموعة متنوعة من المحادثات ، وبعض الحساب القليل
النموذج ومجموعات البيانات الجاذبية على Luggingface
(في أحسن الأحوال) ، يمكن أن تتحدث معك حول مجموعة متنوعة من الموضوعات والتبديل بسلاسة بين الموضوعات
GPT-2-Medium 353 مليون معلمة
استنتاج سريع جدا على وحدة معالجة الرسومات
المستخدم لدردشة الروبوت
يحتوي chat.py على وظائف مشابهة لـ Openai API Stop ، ويزيل جميع المحتوى بعد كلمة معينة
تعيين سياق لبدء المحادثة ، وجعل شخصية جديدة بالكامل لدردشة chatbot
!python chat.py --init_from=huggingface --context=""
هذا شوكة من nanogpt ، ولكن تم تدريبها على تنسيق بيانات chatbot مثل chatgpt ، مع التنسيق المستوحى من oasst-pythia-12b
<human> ... <endOfText>
<Bot> ... <endOfText>
<human> ... <endOfText>
<Bot> ... <endOfText>
<human> ... <endOfText>
<Bot> ... <endOfText>
garage-bAInd/Open-Platypus ، etcعلى الرغم من أنه من المحتمل خارج نطاق هذا النموذج ، فإن هذا شيء بالنسبة للنماذج المستقبلية ، مع العديد من النماذج ، يمكنك أن تسأل عما كنت تتحدث عنه فقط أو لتلخيص المحادثة أعلاه. عندما تتم محاولة ذلك مع هذا النموذج:
Human: Dogecoin is cool
Bot: indeed, very shibe
Human: what were we just talking about?
Bot: me and a friend gave up on mining, but now I can
كما نرى ، يستمر مع جملة على التعدين ، مما يؤكد أنه يفهم السياق (معلومات GPT2) ولكنه لا يتمتع بالقدرة على الاستدعاء. أظن أن ذلك يتعلق ببيانات النماذج ، وأنه إذا كنت سأطعم بيانات تكنولوجيا المعلومات مثل بيانات الاتصال وبيانات التلخيص القصير ، فسوف تحصل على هذه القدرات
أي شخص يمكنه المساهمة في الريبو ، يرجى القيام بذلك ، أي وجميع المساهمات موضع ترحيب ، ببساطة إضافة القليل إلى مجموعة البيانات وتوسيع نطاق البيانات سيكون مذهلاً.
لم أقم بإعداد مقالب البيانات/الأجسام التي تشكل هذه البيانات ، ولا يمكنني حساب أي تحيزات ، حيث أن مجموعة البيانات التي تعتمد على محادثات الأشخاص الحقيقيين الذين قد يكونون أو لم يكون لديهم تحيزات. هذا النموذج مخصص لأغراض البحث الأكاديمي ، وليس المقصود من أي سيناريوهات مهمة أو عالية المخاطر. لا تتبع نصيحتها
لأغراض تجارية ، ما عليك سوى أخذ الملفات input1.txt من خلال input36.txt
@misc{zheng2023judging,
title={Judging LLM-as-a-judge with MT-Bench and Chatbot Arena},
author={Lianmin Zheng and Wei-Lin Chiang and Ying Sheng and Siyuan Zhuang and Zhanghao Wu and Yonghao Zhuang and Zi Lin and Zhuohan Li and Dacheng Li and Eric. P Xing and Hao Zhang and Joseph E. Gonzalez and Ion Stoica},
year={2023},
eprint={2306.05685},
archivePrefix={arXiv},
primaryClass={cs.CL}
}