การสกัดความสัมพันธ์ที่ยอดเยี่ยม

รายการทรัพยากรที่ยอดเยี่ยมที่อุทิศให้กับการแยกความสัมพันธ์ซึ่งได้รับแรงบันดาลใจจาก Awesome-NLP และการมองเห็นลึกสุดยอด
การบริจาค : โปรดอย่าลังเลที่จะทำการ ร้องขอการดึง
สารบัญ
- แนวโน้มการวิจัยและการสำรวจ
- เอกสาร
- วิธีการดูแล
- แนวทางการกำกับดูแลที่ห่างไกล
- โมเดลที่ใช้ GNN
- รูปแบบภาษา
- การแสดงเข้ารหัสจากหม้อแปลง
- การแสดงตัวถอดรหัสจากหม้อแปลง
- วิธีการใช้กราฟความรู้
- วิธีการเรียนรู้ไม่กี่ครั้ง
- ชุดข้อมูล
- วิดีโอและการบรรยาย
- ระบบ
- เฟรมเวิร์ก
แนวโน้มการวิจัยและการสำรวจ
- ความคืบหน้าของ NLP: การสกัดความสัมพันธ์
- การรับรู้เอนทิตีและการสกัดความสัมพันธ์: สถานะของศิลปะ (Nasar et al., 2021)
- การสำรวจวิธีการเรียนรู้เชิงลึกสำหรับการสกัดสัมพันธ์ (Kumar, 2017)
- การสำรวจการสกัดสัมพันธ์ (Bach and Badaskar, 2017)
- การแยกความสัมพันธ์: การสำรวจ (Pawar et al., 2017)
- การทบทวนการสกัดความสัมพันธ์ของเอนทิตี (Zhang et al., 2017)
- การทบทวนวิธีการสกัดความสัมพันธ์: มีอะไรใหม่? (Konstantinova et al., 2014)
- 100 GitHub ที่ดีที่สุด: การสกัดสัมพันธ์
เอกสาร
วิธีการดูแล
โมเดลที่ใช้ CNN
- เครือข่ายนิวรัลการสกัดความสัมพันธ์ [กระดาษ] [รหัส] [รีวิว]
- Chunyang Liu, Wenbo Sun, Wenhan Chao และ Wanxiang Che
- ADMA 2013
- การจำแนกประเภทความสัมพันธ์ผ่านเครือข่ายประสาทลึก convolutional [กระดาษ] [รหัส] [ตรวจสอบ]
- Daojian Zeng, Kang Liu, Siwei Lai, Guangyou Zhou และ Jun Zhao
- COLING 2014
- การแยกความสัมพันธ์: มุมมองจากเครือข่ายประสาทสัมผัส [กระดาษ] [รหัส] [รีวิว]
- Thien Huu Nguyen และ Ralph Grishman
- NAACL 2015
- การจำแนกความสัมพันธ์โดยการจัดอันดับด้วยเครือข่ายประสาทสัมผัส [กระดาษ] [รหัส]
- Cicero Nogueira dos Santos, Bing Xiang และ Bowen Zhou
- ACL 2015
- เครือข่ายประสาทที่ใช้ความสนใจสำหรับการสกัดความสัมพันธ์แบบความหมาย [กระดาษ] [รหัส]
- Yatian Shen และ Xuanjing Huang
- Coling 2016
- การจำแนกประเภทความสัมพันธ์ผ่านความสนใจหลายระดับ CNNs [กระดาษ] [รหัส]
- Linlin Wang, Zhu Cao, Gerard de Melo และ Zhiyuan Liu
- ACL 2016
- MIT ที่ SEMEVAL-2017 ภารกิจที่ 10: การสกัดสัมพันธ์กับเครือข่ายประสาทสัมผัส [กระดาษ]
- Ji Young Lee, Franck Dernoncourt และ Peter Szolovits
- Semeval 2017
โมเดลที่ใช้ RNN
- การจำแนกความสัมพันธ์ผ่านเครือข่ายประสาทที่เกิดขึ้นซ้ำ [กระดาษ]
- Dongxu Zhang และ Dong Wang
- Arxiv 2015
- เครือข่ายหน่วยความจำระยะสั้นระยะยาวแบบสองทิศทางสำหรับการจำแนกประเภทความสัมพันธ์ [กระดาษ]
- Shu Zhang, Dequan Zheng, Xinchen Hu และ Ming Yang
- Paclic 2015
- การแยกความสัมพันธ์แบบครบวงจรโดยใช้ LSTMs ในลำดับและโครงสร้างต้นไม้ [กระดาษ]
- Makoto Miwa และ Mohit Bansal
- ACL 2016
- เครือข่ายหน่วยความจำระยะยาวระยะยาวแบบสองทิศทางสำหรับการจำแนกประเภทความสัมพันธ์ [กระดาษ] [รหัส]
- Peng Zhou, Wei Shi, Jun Tian, Zhenyu Qi, Bingchen Li, Hongwei Hao และ Bo Xu
- ACL 2016
- การจำแนกความสัมพันธ์แบบความหมายผ่านเครือข่ายประสาทที่เกิดขึ้นตามลำดับชั้นด้วยความสนใจ [กระดาษ]
- Minguang Xiao และ Cong Liu
- Coling 2016
- การจำแนกความสัมพันธ์แบบความหมายผ่านเครือข่าย LSTM แบบสองทิศทางที่มีความสนใจอย่างตระหนักถึงเอนทิตีโดยใช้การพิมพ์เอนทิตีแฝง [กระดาษ] [รหัส]
- Joohong Lee, Sangwoo Seo และ Yong Suk Choi
- Arxiv 2019
แบบจำลองการพึ่งพา
- ความหมายขององค์ประกอบผ่านช่องว่างเมทริกซ์-เวกเตอร์แบบเรียกซ้ำ [กระดาษ] [รหัส]
- Richard Socher, Brody Huval, Christopher D. Manning และ Andrew Y. Ng
- EMNLP-Conll 2012
- แบบจำลองการฝังองค์ประกอบตามปัจจัย [กระดาษ]
- Mo Yu, Matthw R. Gormley และ Mark Dredze
- NIPS Workshop เกี่ยวกับการเรียนรู้ Semantics 2014
- เครือข่ายประสาทตามการพึ่งพาสำหรับการจำแนกความสัมพันธ์ [กระดาษ]
- Yang Liu, Furu Wei, Sujian Li, Heng Ji, Ming Zhou และ Houfeng Wang
- ACL 2015
- การจำแนกความสัมพันธ์ผ่านเครือข่ายหน่วยความจำระยะยาวระยะยาวตามเส้นทางการพึ่งพาที่สั้นที่สุด [กระดาษ] [รหัส]
- Xu Yan, Lili Mou, Ge Li, Yunchuan Chen, Hao Peng และ Zhi Jin
- EMNLP 2015
- การจำแนกความสัมพันธ์แบบความหมายผ่านเครือข่ายประสาทแบบ Convolutional ด้วยการสุ่มตัวอย่างเชิงลบอย่างง่าย [กระดาษ]
- Kun Xu, Yansong Feng, Songfang Huang และ Dongyan Zhao
- EMNLP 2015
- ปรับปรุงการจำแนกความสัมพันธ์โดยเครือข่ายประสาทที่เกิดขึ้นใหม่ด้วยการเพิ่มข้อมูล [กระดาษ]
- Yan Xu, Ran Jia, Lili Mou, Ge Li, Yunchuan Chen, Yangyang Lu และ Zhi Jin
- Coling 2016
- เครือข่ายประสาทแบบ convolutional แบบสองทิศทางสำหรับการจำแนกประเภทความสัมพันธ์ [กระดาษ]
- Rui Cai, Xiaodong Zhang และ Houfeng Wang
- ACL 2016
- การสกัดความสัมพันธ์ของระบบประสาทผ่านการลดเสียงรบกวนภายในประโยคและการถ่ายโอนการเรียนรู้ [กระดาษ]
- Tianyi Liu, Xinsong Zhang, Wanhao Zhou, Weijia Jia
- EMNLP 2018
โมเดลที่ใช้ GNN
- การจับคู่ช่องว่าง: ความคล้ายคลึงกันแบบกระจายสำหรับการเรียนรู้ความสัมพันธ์ [กระดาษ]
- Livio Baldini Soares, Nicholas Fitzgerald, Jeffrey Ling, Tom Kwiatkowski
- ACL 2019
- ความสัมพันธ์ของความสัมพันธ์: กระบวนทัศน์ใหม่ของปัญหาการสกัดความสัมพันธ์ [กระดาษ]
- Zhijing Jin, Yongyi Yang, Xipeng Qiu, Zheng Zhang
- EMNLP 2020
- GDPNET: การกลั่นกราฟหลายมุมมองแฝงสำหรับการสกัดสัมพันธ์ [กระดาษ] [รหัส]
- Fuzhao Xue, Aixin Sun, Hao Zhang, Eng Siong Chng
- Aaai 21
- Recon: การสกัดความสัมพันธ์โดยใช้บริบทกราฟความรู้ในเครือข่ายประสาทกราฟ [parer] [รหัส]
- Anson Bastos, Abhishek Nadgeri, Kuldeep Singh, Isaiah Onando Mulang ', Saeedeh Shekarpour, Johannes Hoffart, Manohar Kaul
- www'21
แนวทางการกำกับดูแลที่ห่างไกล
- การกำกับดูแลที่ห่างไกลสำหรับการสกัดสัมพันธ์โดยไม่มีข้อมูลที่มีป้ายกำกับ [กระดาษ] [ตรวจสอบ]
- Mike Mintz, Steven Bills, Rion Snow และ Dan Jurafsky
- ACL 2009
- การกำกับดูแลที่อ่อนแอตามความรู้สำหรับการสกัดข้อมูลของความสัมพันธ์ที่ทับซ้อนกัน [กระดาษ] [รหัส]
- Raphael Hoffmann, Congle Zhang, Xiao Ling, Luke Zettlemoyer และ Daniel S. Weld
- ACL 2011
- การเรียนรู้แบบหลายฐานข้อมูลหลายฐานสำหรับการสกัดความสัมพันธ์ [กระดาษ] [รหัส]
- Mihai Surdeanu, Julie Tibshirani, Ramesh Nallapati และ Christopher D. Manning
- EMNLP-Conll 2012
- การกำกับดูแลที่ห่างไกลสำหรับการสกัดสัมพันธ์ผ่านเครือข่ายประสาทเทียมเป็นชิ้น ๆ [กระดาษ] [ตรวจสอบ] [รหัส]
- Daojian Zeng, Kang Liu, Yubo Chen และ Jun Zhao
- EMNLP 2015
- การแยกความสัมพันธ์กับเครือข่ายประสาทหลายฐานข้อมูลแบบอินสแตนซ์ [กระดาษ] [รีวิว] [รหัส]
- Xiaotian Jiang, Quan Wang, Peng Li, Bin Wang
- Coling 2016
- การรวมเส้นทางความสัมพันธ์ในการสกัดความสัมพันธ์ของระบบประสาท [กระดาษ] [ทบทวน]
- Wenyuan Zeng, Yankai Lin, Zhiyuan Liu และ Maosong Sun
- EMNLP 2017
- การแยกความสัมพันธ์ของระบบประสาทด้วยความสนใจในการเลือกอินสแตนซ์ [กระดาษ] [รหัส]
- Yankai Lin, Shiqi Shen, Zhiyuan Liu, Huanbo Luan และ Maosong Sun
- ACL 2017
- การเรียนรู้บริบทในท้องถิ่นและระดับโลกโดยใช้แบบจำลองเครือข่ายที่เกิดขึ้นซ้ำ ๆ สำหรับการจำแนกประเภทความสัมพันธ์ในข้อความชีวการแพทย์ [กระดาษ] [รหัส] [รหัส]
- Desh Raj, Sunil Kumar Sahu และ Ashish Anan
- Conll 2017
- การสกัดความสัมพันธ์แบบลำดับชั้นด้วยความสนใจแบบหยาบถึงละเอียด [กระดาษ] [รหัส]
- Xu Han, Pengfei Yu ∗, Zhiyuan Liu, Maosong Sun, Peng Li
- EMNLP 2018
- อาศัยอยู่: การปรับปรุงการสกัดความสัมพันธ์ของระบบประสาทที่อยู่ห่างไกลโดยใช้ข้อมูลด้านข้าง [กระดาษ] [รหัส]
- Shikhar Vashishth, Rishabh Joshi, Sai Suman Prayaga, Chiranjib Bhattacharyya และ Partha Talukdar
- EMNLP 2018
- การสกัดด้านการกำกับดูแลที่ห่างไกลด้วยความสนใจภายในถุงและระหว่างถุง [กระดาษ] [รหัส]
- Zhi-Xiu Ye, Zhen-Hua Ling
- NAACL 2019
รูปแบบภาษา
การแสดงเข้ารหัสจากหม้อแปลง
- เพิ่มคุณค่าแบบจำลองภาษาที่ผ่านการฝึกอบรมมาก่อนด้วยข้อมูลเอนทิตีสำหรับการจำแนกความสัมพันธ์ [กระดาษ]
- Shanchan Wu, Yifan เขา
- Arxiv 2019
- ลุค: การเป็นตัวแทนของนิติบุคคลที่มีบริบทอย่างลึก
- Ikuya Yamada, Akari Asai, Hiroyuki Shindo, Hideaki Takeda, Yuji Matsumoto
- EMNLP 2020
- Spanbert: การปรับปรุงการฝึกอบรมก่อนโดยเป็นตัวแทนและทำนายช่วง [กระดาษ] [รหัส]
- Mandar Joshi, Danqi Chen, Yinhan Liu, Daniel S. Weld, Luke Zettlemoyer และ Omer Levy
- Tacl 2020 (ธุรกรรมของสมาคมภาษาศาสตร์เชิงคำนวณ)
- การสกัดความสัมพันธ์ทางไกลที่มีประสิทธิภาพด้วย DG-Spanbert [Paper]
- Jun Chen, Robert Hoehndorf, Mohamed Elhoseiny, Xiangliang Zhang
การแสดงตัวถอดรหัสจากหม้อแปลง
- การปรับปรุงการสกัดความสัมพันธ์โดยการเป็นตัวแทนภาษาก่อนหน้า [กระดาษ] [รีวิว] [รหัส]
- Christoph Alt, Marc Hübner, Leonhard Hennig
- AKBC 19
วิธีการใช้กราฟความรู้
- KGPOOL: การเลือกบริบทกราฟความรู้แบบไดนามิกสำหรับการสกัดความสัมพันธ์ [กระดาษ] [รหัส]
- Abhishek Nadgeri, Anson Bastos, Kuldeep Singh, Isaiah Onando Mulang, Johannes Hoffart, Saeedeh Shekarpour และ Vijay Saraswat
- ACL 2021 (ผลการวิจัย)
วิธีการเรียนรู้ไม่กี่ครั้ง
- ไม่กี่คน: ชุดข้อมูลการจำแนกประเภทความสัมพันธ์แบบไม่กี่ตัวที่มีการดูแลขนาดใหญ่พร้อมการประเมินที่ทันสมัย [กระดาษ] [เว็บไซต์] [รหัส]
- Xu Han, Hao Zhu, Pengfei Yu, Ziyun Wang, Yuan Yao, Zhiyuan Liu, Maosong Sun
- EMNLP 2018
เบ็ดเตล็ด
- การสกัดความสัมพันธ์ร่วมกันกับความสัมพันธ์ระดับผ่านการจัดอันดับลึกที่มีประสิทธิภาพ [กระดาษ]
- Hai Ye, Wenhan Chao, Zhunchen Luo และ Zhoujun Li
- ACL 2017
- การสกัดความสัมพันธ์ของระบบประสาทแบบครบวงจรด้วยการเพิ่มประสิทธิภาพทั่วโลก [กระดาษ]
- Meishan Zhang, Yue Zhang และ Guohong Fu
- EMNLP 2017
- การฝึกอบรมฝ่ายตรงข้ามสำหรับการสกัดสัมพันธ์ [กระดาษ]
- Yi Wu, David Bamman และ Stuart Russell
- EMNLP 2017
- แบบจำลองข้อต่อประสาทสำหรับเอนทิตีและการสกัดความสัมพันธ์จากข้อความชีวการแพทย์ [กระดาษ]
- Fei Li, Meishan Zhang, Guohong Fu และ Donghong Ji
- BMC Bioinformatics 2017
- การสกัดร่วมกันของหน่วยงานและความสัมพันธ์โดยใช้การเรียนรู้การเสริมแรงและการเรียนรู้อย่างลึกซึ้ง [กระดาษ]
- Yuntian Feng, Hongjun Zhang, Wenning Hao และ Gang Chen
- วารสารการคำนวณข่าวกรองและประสาทวิทยาศาสตร์ 2017
- TDEER: สคีมาการถอดรหัสการแปลที่มีประสิทธิภาพสำหรับการสกัดร่วมกันของเอนทิตีและความสัมพันธ์ [กระดาษ] [รหัส]
- Xianming Li, Xiaotian Luo, Chenghao Dong, Daichuan Yang, Beidi Luan และ Zhen เขา
- EMNLP 2021
กลับไปด้านบน
ชุดข้อมูล
- Semeval-2010 งาน 8 [กระดาษ] [ดาวน์โหลด]
- การจำแนกประเภทความสัมพันธ์เชิงความหมายหลายทางระหว่างคู่ของการเสนอชื่อ
- New York Times (NYT) Corpus [Paper] [ดาวน์โหลด]
- ชุดข้อมูลนี้สร้างขึ้นโดยการจัดแนวความสัมพันธ์ Freebase กับ NYT Corpus โดยมีประโยคจากปี 2548-2549 ใช้เป็นคลังการฝึกอบรมและประโยคจากปี 2550 ที่ใช้เป็นคลังการทดสอบ
- ไม่กี่คน: ชุดข้อมูลการจำแนกประเภทความสัมพันธ์ไม่กี่ครั้ง [PAPER] [เว็บไซต์]
- ชุดข้อมูลนี้เป็นชุดข้อมูลการจำแนกประเภทความสัมพันธ์แบบไม่กี่ตัว คลังข้อมูลคือวิกิพีเดียและฐานความรู้ที่ใช้ในการใส่คำอธิบายประกอบคลังข้อมูลคือวิกิดาต้า
- TACRED: ชุดข้อมูลการแยกความสัมพันธ์ TAC [PAPER] [เว็บไซต์] [ดาวน์โหลด]
- เป็นชุดข้อมูลการสกัดความสัมพันธ์ขนาดใหญ่ที่สร้างขึ้นเหนือ Newswire และข้อความเว็บจากคลังข้อมูลที่ใช้ในความท้าทายฐานความรู้ TAC ฐาน (TAC KBP) ประจำปี
- ACE05: [เว็บไซต์] [Download-info]
- ชุดข้อมูลนี้แสดงถึงข้อความที่แยกออกมาจากแหล่งข้อมูลที่หลากหลาย: การสนทนาออกอากาศ, ข่าวออกอากาศ, กลุ่มข่าว, เว็บบล็อก 6 ประเภทความสัมพันธ์ระหว่าง 7 ประเภทในเอนทิตี: Acility (FAC), Geo-PoliticalEntity (GPE), ที่ตั้ง (LOC), องค์กร (org), บุคคล (ต่อ), ยานพาหนะ (ยานพาหนะ), อาวุธ (WEA)
- Semeval-2018 Task 7 [Paper] [เว็บไซต์] [ดาวน์โหลด]
- คลังข้อมูลถูกรวบรวมจากบทคัดย่อและการแนะนำเอกสารทางวิทยาศาสตร์และมีความสัมพันธ์เชิงความหมายหกประเภท มีสามงานย่อยของมัน: Subtask 1.1 และ Subtask 1.2 คือการจำแนกประเภทความสัมพันธ์กับข้อมูลที่สะอาดและมีเสียงดังตามลำดับ; Subtask 2 คือการสกัดความสัมพันธ์มาตรฐาน
สำหรับผลลัพธ์ที่ทันสมัยตรวจสอบ nlpprogress.com เกี่ยวกับการแยกความสัมพันธ์
กลับไปด้านบน
วิดีโอและการบรรยาย
- มหาวิทยาลัยสแตนฟอร์ด: CS124, Dan Jurafsky
- (วิดีโอ) สัปดาห์ที่ 5: การแยกความสัมพันธ์และคำถาม
- มหาวิทยาลัยวอชิงตัน: CSE517, Luke Zettlemoyer
- (สไลด์) การสกัดความสัมพันธ์ 1
- (สไลด์) การสกัดความสัมพันธ์ 2
- มหาวิทยาลัยนิวยอร์ก: CSCI-GA.2590, Ralph Grishman
- (สไลด์) การสกัดความสัมพันธ์: วิธีการตามกฎ
- มหาวิทยาลัยมิชิแกน: Coursera, Dragomir R. Radev
- (วิดีโอ) การบรรยาย 48: การแยกความสัมพันธ์
- มหาวิทยาลัยเวอร์จิเนีย: CS6501-NLP, Kai-Wei Chang
- (สไลด์) การบรรยาย 24: การสกัดสัมพันธ์
กลับไปด้านบน
ระบบ
- ลึกล้ำ
- สแตนฟอร์ดสกัดความสัมพันธ์
กลับไปด้านบน
เฟรมเวิร์ก
- Opennre [GitHub] [กระดาษ]
- เป็นชุดเครื่องมือโอเพนซอร์ซและขยายได้ซึ่งให้กรอบการทำงานแบบครบวงจรเพื่อใช้แบบจำลองระบบประสาทสำหรับการสกัดสัมพันธ์ (RE) ระหว่างหน่วยงานที่มีชื่อ มันถูกออกแบบมาสำหรับสถานการณ์ต่าง ๆ สำหรับ RE รวมถึงระดับประโยค RE, Re-Level Re, Refer Level ระดับเอกสารและอีกไม่กี่นัด มันมีโมดูล RE ที่ใช้งานได้หลายแบบโดยใช้ทั้ง tensorflow และ pytorch เพื่อรักษาความเป็นโมดูลและการขยายที่เพียงพอทำให้ง่ายต่อการรวมโมเดลใหม่เข้ากับเฟรมเวิร์ก
- Arekit [GitHub] [Paper ที่ใช้งานวิจัยได้]
- เป็นชุดเครื่องมือโอเพนซอร์ซและขยายได้มุ่งเน้นไปที่การเตรียมข้อมูลสำหรับองค์กรสกัดความสัมพันธ์ระดับเอกสาร มันเติมเต็มฟังก์ชั่น OpenNRE เช่นเดียวกับในแง่หลัง การตั้งค่า RE ระดับเอกสารไม่ได้สำรวจอย่างกว้างขวาง (2.4 [กระดาษ]) ฟังก์ชั่นหลักรวมถึง (1) API สำหรับการนำเสนอเอกสารด้วยการเชื่อมโยง EL (เอนทิตี, เช่นวัตถุคำพ้องความหมาย) สำหรับการเตรียมความสัมพันธ์ระดับประโยค (ขนานนามว่าเป็นบริบท) (2) API สำหรับการสกัดบริบท (3) ความสัมพันธ์ที่ถ่ายโอนจากระดับประโยคลงไปในระดับเอกสาร
- dere [gitHub] [กระดาษ]
- เป็นเฟรมเวิร์ก โอ เพนซอร์ซสำหรับ การ ศึกษา ที่ ชัดเจนและอนุญาตให้ประกาศงานของคุณเอง (ใช้ XML Schemas) และใช้โมเดลที่ใช้งานด้วยตนเอง (โดยใช้ API ที่ให้ไว้) การประกาศงานสร้างขึ้นบน ช่วง และ ความสัมพันธ์ระหว่างช่วง ในแง่ของหลังผู้เขียนเสนอ เฟรม ที่ทุกเฟรม yelds ของ: (1) ทริกเกอร์ (span) และ (2) n -slots ซึ่งทุกช่องอาจอ้างถึง เฟรม หรือ ช่วง เฟรมเวิร์กไม่มีข้อ จำกัด ทางทฤษฎีไปยังหน้าต่างที่สกัดเฟรม ดังนั้นแนวคิดนี้อาจครอบคลุมระดับประโยคระดับเอกสารและงานหลายเอกสาร
กลับไปด้านบน
ใบอนุญาต
ตามขอบเขตที่เป็นไปได้ภายใต้กฎหมายจูฮงลีลีได้สละสิทธิ์ลิขสิทธิ์และสิทธิที่เกี่ยวข้องหรือใกล้เคียงกับงานนี้ทั้งหมด