ที่เก็บสำหรับ Thomas Davidson, Dana Warmsley, Michael Macy และ Ingmar Weber 2017. "การตรวจจับคำพูดแสดงความเกลียดชังอัตโนมัติและปัญหาของภาษาที่น่ารังเกียจ" ICWSM คุณอ่านกระดาษที่นี่
เรามีบทความใหม่เกี่ยวกับอคติทางเชื้อชาติในชุดข้อมูลนี้และอื่น ๆ คุณสามารถอ่านได้ที่นี่
คำเตือน: ข้อมูลพจนานุกรมและสมุดบันทึกล้วนมีเนื้อหาที่เป็นชนชั้นเหยียดผิวเพศหญิงปรักปรำและน่ารังเกียจในอีกหลายวิธี
คุณสามารถค้นหาข้อมูลที่มีป้ายกำกับของเราในไดเรกทอรี data เราได้รวมไว้เป็นไฟล์ดอง (Python 2.7) และเป็น CSV นอกจากนี้คุณยังจะพบสมุดบันทึกในไดเรกทอรี src ที่มีรหัส Python 2.7 เพื่อทำซ้ำการวิเคราะห์ของเราในกระดาษและพจนานุกรมในไดเรกทอรี lexicons ที่เราสร้างขึ้นเพื่อพยายามจำแนกคำพูดแสดงความเกลียดชังที่แม่นยำยิ่งขึ้น ไดเรกทอรี classifier มีสคริปต์คำแนะนำและไฟล์ที่จำเป็นในการเรียกใช้ตัวจําแนกของเราในข้อมูลใหม่กรณีทดสอบมีให้
โปรดอ้างอิงบทความของเราในงานที่เผยแพร่ใด ๆ ที่ใช้ทรัพยากรเหล่านี้
@inproceedings{hateoffensive,
title = {Automated Hate Speech Detection and the Problem of Offensive Language},
author = {Davidson, Thomas and Warmsley, Dana and Macy, Michael and Weber, Ingmar},
booktitle = {Proceedings of the 11th International AAAI Conference on Web and Social Media},
series = {ICWSM '17},
year = {2017},
location = {Montreal, Canada},
pages = {512-515}
}
การติดต่อ เราจะขอบคุณหากคุณสามารถกรอกแบบฟอร์มสั้น ๆ นี้ได้หากคุณสนใจที่จะใช้ข้อมูลของเราเพื่อให้เราสามารถติดตามวิธีการใช้ข้อมูลเหล่านี้และติดต่อกับนักวิจัยที่ทำงานกับปัญหาที่คล้ายกัน
หากคุณมีคำถามใด ๆ โปรดติดต่อ thomas dot davidson at rutgers dot edu