กอดหน้า การสาธิต วิทยานิพนธ์

Aira เป็นชุดของ chatbots ที่พัฒนาขึ้นเป็นสนามเด็กเล่นสำหรับการจัดตำแหน่งค่า ซีรี่ส์นี้ประกอบด้วยหลายรุ่นที่ประสบความสำเร็จผ่านการปรับแต่งการปรับแต่งและเทคนิคการสร้างแบบจำลองการตั้งค่าเช่นการเรียนรู้การเสริมแรงด้วยการคืนค่าค่าธรรมเนียมของมนุษย์และการเพิ่มประสิทธิภาพการตั้งค่าโดยตรง
ข้อมูลเกี่ยวกับชุดข้อมูลที่ใช้สามารถพบได้ในโฟลเดอร์ "ชุดข้อมูล" การ์ดรุ่นทั้งหมดสามารถใช้งานได้ในโฟลเดอร์ "รุ่น"
Aira มีไว้สำหรับการวิจัยเชิงวิชาการเท่านั้น สำหรับข้อมูลเพิ่มเติมอ่านการ์ดรุ่นของโมเดลของเรา
ในการสาธิตของเราเราให้แผงควบคุมแก่ผู้ใช้เพื่อโต้ตอบกับโมเดลที่ปรับแต่งคำสั่งของเรา การสาธิตนี้ใช้ reward model และ toxicity model เพื่อประเมินคะแนนของการตอบสนองของผู้สมัครแต่ละคนโดยพิจารณาจากการจัดตำแหน่งกับข้อความของผู้ใช้และระดับความเป็นพิษ ฟังก์ชั่นการสร้างจัดเรียงการตอบสนองของผู้สมัครตามลำดับคะแนนของพวกเขาและกำจัดการตอบสนองใด ๆ ที่ถือว่าเป็นพิษหรือเป็นอันตราย ต่อจากนั้นฟังก์ชั่นการสร้างจะส่งคืนการตอบสนองของผู้สมัครด้วยคะแนนสูงสุดที่เกินเกณฑ์ความปลอดภัยหรือข้อความเริ่มต้นหากไม่มีการระบุผู้สมัครที่ปลอดภัย
ภาพหลอน: โมเดลนี้สามารถสร้างเนื้อหาที่สามารถเข้าใจผิดสำหรับความจริง แต่อันที่จริงแล้วทำให้เข้าใจผิดหรือเป็นเท็จทั้งหมดเช่นภาพหลอน
อคติและความเป็นพิษ: แบบจำลองนี้สืบทอดแบบแผนทางสังคมและประวัติศาสตร์จากข้อมูลที่ใช้ในการฝึกอบรม ด้วยอคติเหล่านี้แบบจำลองสามารถผลิตเนื้อหาที่เป็นพิษได้เช่นอันตรายที่น่ารังเกียจหรือเป็นอันตรายต่อบุคคลกลุ่มหรือชุมชน
การทำซ้ำและการใช้คำกริยา: โมเดลอาจติดอยู่กับลูปการทำซ้ำ (โดยเฉพาะอย่างยิ่งหากการลงโทษซ้ำในระหว่างรุ่นถูกตั้งค่าเป็นค่าน้อย) หรือสร้างคำตอบ verbose ที่ไม่เกี่ยวข้องกับพรอมต์ที่ได้รับ
ทุกรุ่นและชุดข้อมูลที่พัฒนาขึ้นเป็นส่วนหนึ่งของวิทยานิพนธ์ระดับปริญญาเอกของ Nicholas Kluge " Dynamic Normativity: เงื่อนไขที่จำเป็นและเพียงพอสำหรับการจัดตำแหน่งค่า " งานวิจัยนี้ได้รับทุนจาก CNPQ (Fundação de Amparo à pesquisa do estado do Rio grande do sul), fapergs (fundação de amparo à pesquisa do estado do rio grande do sul) (Pontifícia Universidade Católica do Rio Grande do Sul) และมหาวิทยาลัยบอนน์
@misc{nicholas22aira,
doi = {10.5281/zenodo.6989727},
url = {https://github.com/Nkluge-correa/Aira},
author = {Nicholas Kluge Corrêa},
title = {Aira},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
}
@phdthesis{kluge2024dynamic,
title={Dynamic Normativity},
author={Kluge Corr{ ^ e}a, Nicholas},
year={2024},
school={Universit{ " a}ts-und Landesbibliothek Bonn}
}ที่เก็บนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต Apache เวอร์ชัน 2.0 ดูไฟล์ใบอนุญาตสำหรับรายละเอียดเพิ่มเติม