hate speech and offensive language

hate speech and offensive language

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

การตรวจจับคำพูดแสดงความเกลียดชังอัตโนมัติและปัญหาของภาษาที่น่ารังเกียจ

ที่เก็บสำหรับ Thomas Davidson, Dana Warmsley, Michael Macy และ Ingmar Weber 2017. "การตรวจจับคำพูดแสดงความเกลียดชังอัตโนมัติและปัญหาของภาษาที่น่ารังเกียจ" ICWSM คุณอ่านกระดาษที่นี่

หมายเหตุ: ที่เก็บนี้ไม่ได้รับการดูแลอย่างแข็งขันอีกต่อไป โปรดอย่าโพสต์ปัญหาเกี่ยวกับความเข้ากันได้ของรหัสที่มีอยู่กับ Python เวอร์ชันใหม่หรือแพ็คเกจที่ใช้ ฉันจะไม่รับคำขอดึงใด ๆ หากคุณวางแผนที่จะใช้ข้อมูลหรือรหัสนี้ในการวิจัยของคุณโปรดตรวจสอบปัญหาเนื่องจากผู้ใช้ GitHub หลายคนได้แนะนำการเปลี่ยนแปลงหรือการปรับปรุง codebase

ข่าว 2019

เรามีบทความใหม่เกี่ยวกับอคติทางเชื้อชาติในชุดข้อมูลนี้และอื่น ๆ คุณสามารถอ่านได้ที่นี่

คำเตือน: ข้อมูลพจนานุกรมและสมุดบันทึกล้วนมีเนื้อหาที่เป็นชนชั้นเหยียดผิวเพศหญิงปรักปรำและน่ารังเกียจในอีกหลายวิธี

คุณสามารถค้นหาข้อมูลที่มีป้ายกำกับของเราในไดเรกทอรี data เราได้รวมไว้เป็นไฟล์ดอง (Python 2.7) และเป็น CSV นอกจากนี้คุณยังจะพบสมุดบันทึกในไดเรกทอรี src ที่มีรหัส Python 2.7 เพื่อทำซ้ำการวิเคราะห์ของเราในกระดาษและพจนานุกรมในไดเรกทอรี lexicons ที่เราสร้างขึ้นเพื่อพยายามจำแนกคำพูดแสดงความเกลียดชังที่แม่นยำยิ่งขึ้น ไดเรกทอรี classifier มีสคริปต์คำแนะนำและไฟล์ที่จำเป็นในการเรียกใช้ตัวจําแนกของเราในข้อมูลใหม่กรณีทดสอบมีให้

โปรดอ้างอิงบทความของเราในงานที่เผยแพร่ใด ๆ ที่ใช้ทรัพยากรเหล่านี้

 @inproceedings{hateoffensive,
  title = {Automated Hate Speech Detection and the Problem of Offensive Language},
  author = {Davidson, Thomas and Warmsley, Dana and Macy, Michael and Weber, Ingmar}, 
  booktitle = {Proceedings of the 11th International AAAI Conference on Web and Social Media},
  series = {ICWSM '17},
  year = {2017},
  location = {Montreal, Canada},
  pages = {512-515}
  }

การติดต่อ เราจะขอบคุณหากคุณสามารถกรอกแบบฟอร์มสั้น ๆ นี้ได้หากคุณสนใจที่จะใช้ข้อมูลของเราเพื่อให้เราสามารถติดตามวิธีการใช้ข้อมูลเหล่านี้และติดต่อกับนักวิจัยที่ทำงานกับปัญหาที่คล้ายกัน

หากคุณมีคำถามใด ๆ โปรดติดต่อ thomas dot davidson at rutgers dot edu

ขยาย

ข้อมูลเพิ่มเติม