นี่คือที่เก็บข้อมูลสำหรับทรัพยากรในกระดาษ Conll 2020 "คุณกำลังพยายามทำอะไร? ที่เก็บนี้มีซอร์สโค้ดและลิงก์ไปยังชุดข้อมูลบางชุดที่ใช้ในกระดาษของเรา
บทความนี้ศึกษางาน การ พิมพ์ความหมายแบบใหม่ งานนี้ได้รับแรงบันดาลใจจากการศึกษาการคำนวณและความรู้ความเข้าใจเกี่ยวกับการทำความเข้าใจเหตุการณ์ซึ่งชี้ให้เห็นว่ากระบวนการทำความเข้าใจเหตุการณ์ของเหตุการณ์มักจะถูกกำกับโดยการตระหนักถึงเป้าหมายแผนหรือความตั้งใจของตัวเอก เราพัฒนาชุดข้อมูลขนาดใหญ่ที่มีกระบวนการเหตุการณ์มากกว่า 60K ซึ่งมีการพิมพ์ที่ละเอียดเป็นพิเศษทั้งในแกนแอ็คชั่นและประเภทวัตถุที่มีคำศัพท์ฉลากขนาดใหญ่มาก (10^3∼10^4) จากนั้นเราเสนอกรอบการเรียนรู้แบบไฮบริด P2GT ซึ่งจัดการกับปัญหาการพิมพ์ที่ท้าทายด้วยการกำกับดูแลทางอ้อมจาก GLOSSES1 และกรอบการเรียนรู้ร่วมกับอันดับ ตามการทดลองของเราระบุว่า P2GT สนับสนุนการระบุความตั้งใจของกระบวนการเช่นเดียวกับประเภทความหมายที่ดีของวัตถุที่ได้รับผลกระทบ นอกจากนี้ยังแสดงให้เห็นถึงความสามารถในการจัดการกรณีการยิงสองสามครั้งและความสามารถทั่วไปที่แข็งแกร่งในกระบวนการนอกโดเมน

python 3.6
Transformers (Huggingface) version 2.11.0 (Important)
PyTorch with CUDA support
nltk 3.4.5
AllenNLP 1.0
./data มีชุดข้อมูลการพิมพ์กระบวนการ WikiHow ที่มีส่วนร่วมในงานนี้ โฟลเดอร์เดียวกันยังมีคำกริยาและคำนามคำนามจาก WordNet และชุดข้อมูล SEMCOR ที่ใช้สำหรับ WSD
ไฟล์ดิบของชุดข้อมูลการพิมพ์กระบวนการ WikiHow จะได้รับเป็น data_seq.tsv ซึ่งแต่ละแถวบันทึกเนื้อหาและประเภทของกระบวนการของกระบวนการ โดยเฉพาะแต่ละแท็บแยกแถวมีลำดับของเนื้อหา subevent และสองเซลล์สุดท้ายคือการกระทำและฉลากวัตถุ
ไฟล์ไบนารีเป็นอินสแตนซ์ที่บันทึกไว้ของ data.py object ใน Utils ซึ่งได้อ่านข้อมูลกระบวนการและคำคัดลอกฉลากแล้วและให้ข้อมูลการจัดทำดัชนีที่จำเป็นเพื่อแยก (สุ่มสถานะ = 777 ควรแยกการฝึกอบรมและการทดสอบเสมอ
./process Archives หลายโปรแกรมสำหรับการประมวลผลชุดข้อมูล
โปรแกรม/run_joint/jointssmrl_roberta_bis.py ดำเนินการทดลองสำหรับการฝึกอบรมและการทดสอบด้วยการแยกการทดสอบ 10% ควรดำเนินการด้วยรูปแบบต่อไปนี้
python jointSSmrl_roberta_bias.py <skip_training> <alpha> <margin_1> <margin_2>
ตัวอย่างเช่น:
CUDA_VISIBLE_DEVICES=4 python jointSSmrl_roberta_bias.py 0 1. 0.1 0.1
./run_joint/console_roberta_bis.py เป็นแอปพลิเคชั่นคอนโซลที่ผู้ใช้สามารถพิมพ์ในกระบวนการเหตุการณ์และรับข้อมูลประเภทหลายแกนในช่วงเวลา เรียกใช้โปรแกรมนี้อย่างง่ายรอจนกว่าจะโหลดโมเดลที่ผ่านการฝึกอบรมมาก่อนและพิมพ์ในกระบวนการเหตุการณ์ที่ subevents ถูกคั่นด้วย '@' ตัวอย่างเช่นอินพุตต่อไปนี้
read papers@attend conferences@go to seminars@write a thesis
จะได้รับข้อมูลประเภทเช่น
[('get', 0.6021211743354797), ('retain', 0.6217673718929291), ('absorb', 0.6397878527641296), ('pass', 0.6577234268188477), ('submit', 0.6673179864883423), ('present', 0.6688072383403778)]
[('doctorate', 0.5141586363315582), ('psychology', 0.5413682460784912), ('genetic', 0.5501004457473755), ('science', 0.5507515966892242), ('determinism', 0.5621879994869232), ('grade', 0.5723227560520172)]
ลิงก์ไปยังโมเดลเต็มรูปแบบที่ผ่านการฝึกอบรมไว้ล่วงหน้า สำหรับการสาธิตคอนโซล: https://drive.google.com/drive/folders/1b8pevvrnanl7r_wnyyt4ppsynroiloft?usp=sharing
ผู้ใช้ยังสามารถฝึกอบรมโมเดลบนชุดข้อมูลกระบวนการ WikiHow เต็มรูปแบบโดยเรียกใช้./runjoint/train_full_roberta_bis.py
การสาธิตเว็บควรทำงานที่ https://cogcomp.seas.upenn.edu/page/demo_view/step 
bibtex:
@inproceedings{chen-etal-2020-what,
title = {``{W}hat {A}re {Y}ou {T}rying {T}o {D}o?'' {S}emantic {T}yping of {E}vent {P}rocesses},
author = "Chen, Muhao and Zhang, Hongming and Wang, Haoyu and Roth, Dan",
booktitle = "Proceedings of the 24th Conference on Computational Natural Language Learning (CoNLL)",
year = "2020",
publisher = "Association for Computational Linguistics"
}