Download hate speech and offensive language - hate speech and offensive language

hate speech and offensive language

Kode sumber lainnya

1.0.0

Unduh

Deteksi wicara kebencian otomatis dan masalah bahasa ofensif

Repositori untuk Thomas Davidson, Dana Warmsley, Michael Macy, dan Ingmar Weber. 2017. "Deteksi Pidato Kebencian Otomatis dan Masalah Bahasa Ofensif." ICWSM. Anda membaca makalah di sini.

Catatan: Repositori ini tidak lagi dipertahankan secara aktif. Harap jangan memposting masalah mengenai kompatibilitas kode yang ada dengan versi baru Python atau paket yang digunakan. Saya tidak akan menerima permintaan tarik apa pun. Jika Anda berencana untuk menggunakan data atau kode ini dalam penelitian Anda, silakan tinjau masalah, karena beberapa pengguna GitHub telah menyarankan perubahan atau peningkatan pada basis kode.

Berita 2019

Kami memiliki makalah baru tentang bias rasial dalam dataset ini dan lainnya, Anda dapat membacanya di sini

Peringatan: Data, leksikon, dan buku catatan semuanya berisi konten yang rasis, seksis, homofobik, dan ofensif dalam banyak hal.

Anda dapat menemukan data berlabel kami di direktori data . Kami telah memasukkan mereka sebagai file acar (Python 2.7) dan sebagai CSV. Anda juga akan menemukan buku catatan di direktori src yang berisi kode Python 2.7 untuk mereplikasi analisis kami di koran dan leksikon di direktori lexicons yang kami hasilkan untuk mencoba lebih akurat mengklasifikasikan pidato kebencian. Direktori classifier berisi skrip, instruksi, dan file yang diperlukan untuk menjalankan classifier kami pada data baru, sebuah kasus uji disediakan.

Harap kutip makalah kami dalam setiap karya yang diterbitkan yang menggunakan sumber daya ini.

 @inproceedings{hateoffensive,
  title = {Automated Hate Speech Detection and the Problem of Offensive Language},
  author = {Davidson, Thomas and Warmsley, Dana and Macy, Michael and Weber, Ingmar}, 
  booktitle = {Proceedings of the 11th International AAAI Conference on Web and Social Media},
  series = {ICWSM '17},
  year = {2017},
  location = {Montreal, Canada},
  pages = {512-515}
  }

Kontak Kami juga akan menghargainya jika Anda dapat mengisi formulir singkat ini jika Anda tertarik untuk menggunakan data kami sehingga kami dapat melacak bagaimana data ini digunakan dan menghubungi peneliti yang bekerja pada masalah serupa.

Jika Anda memiliki pertanyaan, silakan hubungi thomas dot davidson at rutgers dot edu .

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-16
ukuran 4.29MB
Berasal dari Github

Aplikasi Terkait

language tools

2024-11-11
efficient language detector

2024-11-06
scene language

2024-11-03
Lubang dan Gi

2023-12-31
Nyali dan Kemuliaan

2022-09-04
Benci Sejati

2022-08-11

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua