توليد محتوى قالب مثل عنا ، والأخبار الفنية ، وعنوان الأخبار ، ووصف المنتج وما إلى ذلك باستخدام نموذج اللغة المسبق GPT-3
المفاهيم والتقنيات الرئيسية الأساسية لاستخدام API Openai لأي مهمة بما في ذلك:
يمكن تطبيق API Openai على أي مهمة تتضمن فهم أو توليد لغة أو رمز طبيعي.
GPT-3 أو الجيل الثالث من المحولات التي تم تدريبها قبل التدريب ، هو نموذج تعلم آلة الشبكة العصبية المدربين باستخدام بيانات الإنترنت لإنشاء أي نوع من النص. يتطلب كمية صغيرة من نص الإدخال لإنشاء كميات كبيرة من النص ذي الصلة والمتطورة التي يتم إنشاؤها.
الشبكة العصبية العميقة في GPT-3 هي نموذج يحتوي على أكثر من 175 مليار معلمة التعلم الآلي. ونتيجة لذلك ، فإن GPT-3 أفضل من أي نموذج سابق لإنتاج نص مقنع بما يكفي لتبدو وكأنه إنسان يمكن أن يكتبه.
نقطة النهاية completions هي جوهر Openai API وتوفر واجهة بسيطة مرنة وقوية بشكل كبير.
يمكنك إدخال بعض النص على أنه موجه ، وستعود واجهة برمجة التطبيقات إلى إكمال نص يحاول مطابقة أي إرشادات أو سياق قدمناه.
يمكنك التفكير في هذا الإكمال التلقائي المتقدم للغاية - يعالج النموذج موجه النص الخاص بك ويحاول التنبؤ بما يحتمل أن يأتي بعد ذلك. تصميم المطالبة هو في الأساس كيفية "برمجة" النموذج.
في كثير من الحالات ، من المفيد إظهار ما تريده على حد سواء. يمكن أن تساعد إضافة أمثلة إلى المطالبة في توصيل الأنماط أو الفروق الدقيقة.
تشمل معالجة اللغة الطبيعية كواحدة من جيل Langauge الطبيعي. التي تركز على توليد النص الطبيعي Langauge البشري. ومع ذلك ، فإن توليد المحتوى البشري المفهوم يمثل تحديًا للآلات التي لا تعرف حقًا تعقيدات اللغة والفروق الدقيقة. باستخدام النص على الإنترنت ، يتم تدريب GPT-3 على توليد نص إنساني واقعي.
تم استخدام GPT-3 لإنشاء مقالات وشعر وقصص وتقارير إخبارية وحوار باستخدام كمية صغيرة فقط من نص الإدخال الذي يمكن استخدامه لإنتاج كميات كبيرة من نسخ الجودة.
يتم استخدام GPT-3 أيضًا في مهام المحادثة الآلية ، حيث يستجيب لأي نص يكتبه الشخص في الكمبيوتر مع نص جديد مناسب للسياق. يمكن لـ GPT-3 إنشاء أي شيء بهيكل نص ، وليس فقط نص اللغة البشرية. يمكنه أيضًا إنشاء تلخيصات نصية وحتى رمز البرمجة.
GPT-3 هو نموذج تنبؤ اللغة. هذا يعني أنه يحتوي على نموذج تعلم آلة الشبكة العصبية يمكن أن يأخذ نص الإدخال كمدخلات وتحويله إلى ما يتنبأ به النتيجة الأكثر فائدة. يتم تحقيق ذلك عن طريق تدريب النظام على مجموعة واسعة من نص الإنترنت لاكتشاف الأنماط. وبشكل أكثر تحديدًا ، يعد GPT-3 هو الإصدار الثالث من النموذج الذي يركز على توليد النص على أساس تدريبه مسبقًا على كمية هائلة من النص.
هناك ثلاثة إرشادات أساسية لإنشاء مطالبات:
Show and tell : توضيح ما تريده إما من خلال التعليمات أو الأمثلة أو مجموعة من الاثنين. إذا كنت تريد أن يرتب النموذج قائمة العناصر بالترتيب الأبجدي أو لتصنيف فقرة حسب المشاعر ، أظهر ذلك ما تريده.Provide quality data : إذا كنت تحاول إنشاء مصنف أو الحصول على النموذج لمتابعة نمط ، فتأكد من وجود أمثلة كافية. عادة ما يكون النموذج ذكيًا بما يكفي لرؤية أخطاء الإملاء الأساسية ويمنحك استجابة ، ولكنه قد يفترض أيضًا أن هذا مقصود ، ويمكن أن يؤثر على الاستجابة.Check your settings : تتحكم إعدادات درجة الحرارة وإعدادات TOP_P في مدى حتمية النموذج في توليد استجابة. prompt : المطالبة لإنشاء مكتوئات ، مشفرة كسلسلة ، مجموعة من الأوتار ، مجموعة من الرموز ، أو صفيف من المجموعة الرمزية. <|endoftext|> هو فصل المستند الذي يراه النموذج أثناء التدريب ، لذلك إذا لم يتم تحديد موجه ، فسيتم إنشاء النموذج كما لو كان من بداية وثيقة جديدة.engine : Text-Davinci-001 هو طراز GPT-3 الأكثر قدرة. يمكن أن تفعل أي مهمة يمكن أن تفعلها النماذج الأخرى ، غالبًا مع سياق أقل. بالإضافة إلى الاستجابة للمطالبة ، يدعم أيضًا إدخال الإكمال داخل النص.temperature : درجة الحرارة تعني ما هي درجة حرارة أخذ العينات للاستخدام. القيمة الأعلى تعني أن النموذج سيتحمل المزيد من المخاطر ، ويمكننا استخدام 0.9 لتطبيقات أكثر إبداعًا ، و 0 لتلك التي لديها إجابة محددة جيدًا.max_tokens : الحد الأقصى لعدد الرموز التي يجب توليدها في الشكوى. معظم النماذج لها طول سياق 2048.top_p : بديل لأخذ العينات مع درجة الحرارة ، تسمى أخذ عينات النواة. عندما ينظر النموذج في نتيجة الرموز التي تحتوي على كتلة احتمالية TOP_P ، فإن 0.1 تعني فقط الرموز التي تضم كتلة احتمالية أفضل 10 ٪frequency_penalty : تعاقب القيم الإيجابية الرموز الجديدة بناءً على ترددها الحالي في النص حتى الآن ، مما يقلل من احتمال تكرار نفس الخط.presence_penalty : تعاقب القيمة الإيجابية الرموز الجديدة بناءً على ما إذا كانت تظهر في النص حتى الآن ، مما يزيد من احتمال حدوث مواضيع جديدة. إذا لم يكن لديك pip على نظامك ، فيمكنك تنزيله بمساعدة هذا الأمر:
sudo apt-get install python3-pip
يمكنك إنشاء بيئة افتراضية مع Anaconda إذا كان لديك على نظامك ، إنشاء VirtualEnv مع الأمر أدناه:
conda create -n yourenvname python==x.x
conda activate yourenvname
أو يمكنك تثبيت VirtualWrapper مع الأمر أدناه:
sudo pip3 install virtualenvwrapper
sudo pip3 install --upgrade virtualenv
وبعد التثبيت ، قم بإنشاء بيئة افتراضية:
cd/your/path && mkvirtualenv --python=python3 yourenvname
قم بتثبيت الحزم المطلوبة من المتطلبات. txt لتشغيل هذا المشروع:
pip install -r requirements.txt
لتشغيل هذا المشروع ، يكون الشيء الأكثر أهمية هو وجود مفتاح API السري من Openai الذي يمكّن النموذج من إنشاء المحتويات. إذا كان لديك مفتاح API السري ، فيجب عليك تعيينه كمتغير البيئة الخاص بك تحت اسم OPENAI_API_KEY وقراءته باستخدام حزمة python-dotenv .