Sudah setahun sejak Torchmoji dan Deepmoji dibebaskan. Kami mencoba memahami bagaimana itu digunakan sedemikian rupa sehingga kami dapat membuat perbaikan dan merancang model yang lebih baik di masa depan.
Anda dapat membantu kami mencapai ini dengan menjawab formulir Google 4 pertanyaan ini. Terima kasih atas dukungan Anda!
Baca posting blog kami tentang proses implementasi di sini.
Torchmoji adalah implementasi Pytorch dari model Deepmoji yang dikembangkan oleh Bjarke Felbo, Alan Mislove, Anders Søgaard, Iyad Rahwan dan Sune Lehmann.
Model ini dilatih pada 1,2 miliar tweet dengan emoji untuk memahami bagaimana bahasa digunakan untuk mengekspresikan emosi. Melalui Transfer Learning, model ini dapat memperoleh kinerja canggih pada banyak tugas pemodelan teks terkait emosi.
Coba demo online Deepmoji tentang ini? Ruang angkasa! Lihat koran, posting blog atau FAQ untuk lebih jelasnya.
Untuk memulai, lihatlah ke dalam contoh/ direktori. Lihat SCORE_TEXTS_EMOJIS.py untuk cara menggunakan DeepMoji untuk mengekstrak prediksi emoji, encode_texts.py untuk cara mengubah teks menjadi vektor fitur emosional 2304 dimensi atau finetune_youtube_last.py untuk cara menggunakan model untuk transfer pembelajaran pada dataset baru.
Harap pertimbangkan mengutip kertas DeepMoji jika Anda menggunakan model atau kode (lihat di bawah untuk kutipan).
Kami berasumsi bahwa Anda menggunakan Python 2.7-3.5 dengan Pip terpasang.
Pertama, Anda perlu menginstal pytorch (versi 0.2+), saat ini oleh:
conda install pytorch -c pytorchPada tahap ini model tidak dapat menggunakan CUDA secara efisien. Lihat detail dalam posting blog Face Memeluk.
Saat Pytorch diinstal, jalankan berikut ini di direktori root untuk menginstal dependensi yang tersisa:
pip install -e .Ini akan menginstal dependensi berikut:
Kemudian, jalankan skrip unduhan untuk mengunduh bobot torchmoji pretrained (~ 85MB) dari sini dan memasukkannya ke dalam model/ direktori:
python scripts/download_weights.pyUntuk menjalankan tes, pasang hidung. Setelah menginstal, navigasikan ke tes/ direktori dan jalankan:
cd tests
nosetests -vSecara default, ini juga akan menjalankan tes finetuning. Tes -tes ini melatih model untuk satu zaman dan kemudian memeriksa akurasi yang dihasilkan, yang mungkin membutuhkan waktu beberapa menit untuk menyelesaikannya. Jika Anda lebih suka mengecualikannya, jalankan berikut ini sebagai gantinya:
cd tests
nosetests -v -a ' !slow ' Kode ini telah diuji untuk bekerja dengan Python 2.7 dan 3.5 pada mesin Ubuntu 16.04 dan MacOS Sierra. Ini belum dioptimalkan untuk efisiensi, tetapi harus cukup cepat untuk sebagian besar tujuan. Kami tidak memberikan jaminan bahwa tidak ada bug - gunakan kode atas tanggung jawab Anda sendiri!
Kami menyambut permintaan tarik jika Anda merasa ada sesuatu yang bisa ditingkatkan. Anda juga dapat sangat membantu kami dengan memberi tahu kami bagaimana perasaan Anda saat menulis tweet terbaru Anda. Cukup klik di sini untuk berkontribusi.
Kode ini dan model pretrained dilisensikan di bawah lisensi MIT.
Dataset benchmark diunggah ke repositori ini hanya untuk tujuan kenyamanan. Mereka tidak dibebaskan oleh kami dan kami tidak mengklaim hak apa pun atas mereka. Gunakan kumpulan data sesuai tanggung jawab Anda dan pastikan Anda memenuhi lisensi yang mereka rilis. Jika Anda menggunakan salah satu dataset benchmark, silakan pertimbangkan mengutip penulis asli.
@inproceedings{felbo2017,
title={Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm},
author={Felbo, Bjarke and Mislove, Alan and S{o}gaard, Anders and Rahwan, Iyad and Lehmann, Sune},
booktitle={Conference on Empirical Methods in Natural Language Processing (EMNLP)},
year={2017}
}