이것은 Conll 2020 Paper의 리소스의 저장소 ""당신은 무엇을 시도하고 있습니까? 이벤트 프로세스의 의미 론적 타이핑 "입니다. 이 저장소에는 소스 코드와 논문에 사용 된 일부 데이터 세트에 대한 링크가 포함되어 있습니다.
이 논문은 이벤트 프로세스를 고려할 때 (i) 프로세스에 의해 수행 된 조치 유형 및 (ii) 프로세스가 영향을 미치는 객체의 유형을 설명하는 새로운 (인지 적으로 동기 부여) 시맨틱 타이핑 작업, 다축 이벤트 프로세스 타이핑을 연구합니다. 이 과제는 이벤트 이해에 대한 계산 및인지 연구에서 영감을 얻어 이벤트의 이해가 종종 주인공의 목표, 계획 또는 의도를 인식함으로써 지시된다는 것을 시사합니다. 우리는 60K가 넘는 이벤트 프로세스가 포함 된 대형 데이터 세트를 개발하는데, 이는 매우 큰 (10^3 ~ 10^4) 라벨 어휘를 갖춘 동작 및 객체 유형 축 모두에 초조한 타이핑을 특징으로합니다. 그런 다음 Hybrid Learning Framework, P2GT를 제안하는 P2GT를 제안합니다. 이는 Glosses1의 간접 감독과 관련된 도전적인 타이핑 문제를 해결하고 공동 학습 대상 프레임 워크를 제안합니다. 우리의 실험에서 알 수 있듯이, P2GT는 과정의 의도를 식별하고 영향을받는 물체의 미세한 의미 유형을지지합니다. 또한 소수의 사례를 처리 할 수있는 능력과 도메인 외 프로세스에 대한 강력한 일반화 가능성을 보여줍니다.

python 3.6
Transformers (Huggingface) version 2.11.0 (Important)
PyTorch with CUDA support
nltk 3.4.5
AllenNLP 1.0
./Data에는이 작업에 기여한 Wikihow 이벤트 프로세스 타이핑 데이터 세트가 포함되어 있습니다. 동일한 폴더에는 WordNet의 동사 및 명사 광택과 WSD에 사용되는 SEMCOR 데이터 세트도 포함되어 있습니다.
Wikihow 이벤트 프로세스 타이핑 데이터 세트의 원시 파일은 Data_Seq.tsv로 제공되며 각 행은 프로세스의 컨텐츠 및 유형 레이블을 기록합니다. 구체적으로, 각 탭 분리 행에는 일련의 하위 이벤트 내용이 포함되어 있으며 마지막 두 셀은 동작 및 객체 레이블입니다.
바이너리 파일은 UTILS의 Data.py Object의 저장된 인스턴스이며, 이미 프로세스 데이터 및 레이블 광택을 읽었으며 분할에 필요한 색인 정보를 제공했습니다 (Random State = 777은 항상 동일한 분할 및 열차 및 테스트를 제공합니다.
./Process Archives 데이터 세트 프로필을위한 여러 프로그램.
프로그램 ./run_joint/jointssmrl_roberta_bias.py는 10% 테스트 분할 제외로 교육 및 테스트 실험을 실행합니다. 다음 패턴으로 실행해야합니다
python jointSSmrl_roberta_bias.py <skip_training> <alpha> <margin_1> <margin_2>
예를 들어:
CUDA_VISIBLE_DEVICES=4 python jointSSmrl_roberta_bias.py 0 1. 0.1 0.1
./run_joint/console_roberta_bias.py는 사용자가 이벤트 프로세스를 입력하고 다축 유형 정보를 즉석에서 입력 할 수있는 콘솔 애플리케이션입니다. 이 프로그램을 간단하게 실행하고 미리 훈련 된 모델을로드 할 때까지 기다렸다가 하위 이벤트가 '@'로 분리되는 이벤트 프로세스를 입력하십시오. 예를 들어, 다음 입력
read papers@attend conferences@go to seminars@write a thesis
다음과 같은 유형 정보를받습니다
[('get', 0.6021211743354797), ('retain', 0.6217673718929291), ('absorb', 0.6397878527641296), ('pass', 0.6577234268188477), ('submit', 0.6673179864883423), ('present', 0.6688072383403778)]
[('doctorate', 0.5141586363315582), ('psychology', 0.5413682460784912), ('genetic', 0.5501004457473755), ('science', 0.5507515966892242), ('determinism', 0.5621879994869232), ('grade', 0.5723227560520172)]
콘솔 데모에 대한 미리 훈련 된 전체 모델에 대한 링크 : https://drive.google.com/drive/folders/1b8pevvrnanl7r_wnyyt4ppsynroiloft?usp=sharing
사용자는 또한 ./runjoint/train_full_roberta_bias.py를 실행하여 전체 Wikihow 이벤트 프로세스 데이터 세트에서 모델을 교육 할 수 있습니다.
웹 데모는 https://cogcomp.seas.upenn.edu/page/demo_view/step에서 실행해야합니다 
Bibtex :
@inproceedings{chen-etal-2020-what,
title = {``{W}hat {A}re {Y}ou {T}rying {T}o {D}o?'' {S}emantic {T}yping of {E}vent {P}rocesses},
author = "Chen, Muhao and Zhang, Hongming and Wang, Haoyu and Roth, Dan",
booktitle = "Proceedings of the 24th Conference on Computational Natural Language Learning (CoNLL)",
year = "2020",
publisher = "Association for Computational Linguistics"
}