لقد مر عام منذ إطلاق Torchmoji و Deepmoji. نحن نحاول أن نفهم كيف يتم استخدامه بحيث يمكننا إجراء تحسينات وتصميم نماذج أفضل في المستقبل.
يمكنك مساعدتنا في تحقيق ذلك من خلال الرد على نموذج Google المكون من 4 أسئلة. شكرا لدعمك!
اقرأ منشور مدونةنا حول عملية التنفيذ هنا.
Torchmoji هو تطبيق Pytorch لنموذج Deepmoji الذي تطوره Bjarke Felbo و Alan Misslove و Anders Søgaard و Iyad Rahwan و Sune Lehmann.
تم تدريب هذا النموذج على 1.2 مليار تغريدة مع الرموز التعبيرية لفهم كيفية استخدام اللغة للتعبير عن المشاعر. من خلال التعلم النقل ، يمكن أن يحصل النموذج على الأداء الحديث على العديد من مهام نمذجة النصوص المتعلقة بالعاطفة.
جرب العرض التوضيحي عبر الإنترنت لـ Deepmoji على هذا؟ فضاء! انظر الورقة أو منشور المدونة أو الأسئلة الشائعة لمزيد من التفاصيل.
للبدء مع ، إلقاء نظرة داخل الأمثلة/ الدليل. انظر Score_texts_emojis.py عن كيفية استخدام DeepMoji لاستخراج تنبؤات Emoji ، encode_texts.py لكيفية تحويل النص إلى 2304 ناقلات الميزة العاطفية الأبعاد أو finetune_youtube_last.py لكيفية استخدام النموذج لتعلم النقل على بيانات جديدة.
يرجى النظر في ذكر ورقة DeepMoji إذا كنت تستخدم النموذج أو الرمز (انظر أدناه للاستشهاد).
نحن نفترض أنك تستخدم Python 2.7-3.5 مع تثبيت PIP.
تحتاج أولاً إلى تثبيت Pytorch (الإصدار 0.2+) ، حاليًا بواسطة:
conda install pytorch -c pytorchفي المرحلة الحالية ، لا يمكن للنموذج الاستفادة الفعالة من CUDA. انظر التفاصيل في منشور مدونة Hugging Face.
عند تثبيت Pytorch ، قم بتشغيل ما يلي في دليل الجذر لتثبيت التبعيات المتبقية:
pip install -e .سيؤدي هذا إلى تثبيت التبعيات التالية:
بعد ذلك ، قم بتشغيل البرنامج النصي للتنزيل لتنزيل أوزان Torchmoji المسبق (حوالي 85 ميجابايت) من هنا ووضعها في النموذج/ الدليل:
python scripts/download_weights.pyلتشغيل الاختبارات ، تثبيت الأنف. بعد التثبيت ، انتقل إلى الاختبارات/ الدليل وتشغيله:
cd tests
nosetests -vبشكل افتراضي ، سيؤدي ذلك أيضًا إلى إجراء اختبارات للتشويش. تقوم هذه الاختبارات بتدريب النموذج لعصر واحد ثم تحقق من الدقة الناتجة ، والتي قد تستغرق عدة دقائق حتى تنتهي. إذا كنت تفضل استبعادها ، قم بتشغيل ما يلي بدلاً من ذلك:
cd tests
nosetests -v -a ' !slow ' تم اختبار هذا الرمز للعمل مع Python 2.7 و 3.5 على آلات Ubuntu 16.04 و Macos Sierra. لم يتم تحسينه للكفاءة ، ولكن يجب أن يكون سريعًا بما يكفي لمعظم الأغراض. نحن لا نعطي أي ضمانات بعدم وجود أخطاء - استخدم الرمز على مسؤوليتك الخاصة!
نرحب بطلبات السحب إذا كنت تشعر أنه يمكن تحسين شيء ما. يمكنك أيضًا مساعدتنا بشكل كبير من خلال إخبارنا بما شعرت به عند كتابة تغريداتك الأخيرة. فقط انقر هنا للمساهمة.
تم ترخيص هذا الرمز والنموذج المسبق بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.
يتم تحميل مجموعات البيانات القياسية إلى هذا المستودع لأغراض الراحة فقط. لم يتم إطلاق سراحهم من قبلنا ولا نطالب بأي حقوق عليهم. استخدم مجموعات البيانات على مسؤوليتك وتأكد من تلبية التراخيص التي تم إصدارها بها. إذا كنت تستخدم أي من مجموعات البيانات القياسية ، فيرجى التفكير في الاستشهاد بالمؤلفين الأصليين.
@inproceedings{felbo2017,
title={Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm},
author={Felbo, Bjarke and Mislove, Alan and S{o}gaard, Anders and Rahwan, Iyad and Lehmann, Sune},
booktitle={Conference on Empirical Methods in Natural Language Processing (EMNLP)},
year={2017}
}