ดาวน์โหลด Cross Domain_NER - ดาวน์โหลดซอร์สโค้ด Cross Domain

Cross Domain_NER

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Cross-domain_ner

ข้ามโดเมนโดยใช้การสร้างแบบจำลองภาษาข้ามโดเมนรหัสสำหรับกระดาษ ACL 2019

การแนะนำ

ner เป็นงานพื้นฐานใน NLP เนื่องจากข้อ จำกัด ของทรัพยากรที่มีป้ายกำกับ Cross-Domain Ner จึงเป็นงานที่ท้าทาย งานก่อนหน้านี้ส่วนใหญ่มุ่งเน้นไปที่สถานการณ์ภายใต้การดูแลใช้ประโยชน์จากข้อมูลที่ติดฉลากสำหรับโดเมนทั้งแหล่งที่มาและเป้าหมาย ข้อเสียของการตั้งค่าดังกล่าวคือพวกเขาไม่สามารถฝึกอบรมสำหรับโดเมนที่ไม่มีข้อมูลที่มีป้ายกำกับ

เราแก้ไขปัญหานี้โดยใช้ Cross-Domain LM เป็นสะพานข้ามโดเมนสำหรับการปรับโดเมน NER การถ่ายโอนข้ามงานและการถ่ายโอนข้ามโดเมนโดยการออกแบบ เครือข่ายการสร้างพารามิเตอร์ ใหม่

การทดลองเกี่ยวกับ ชุดข้อมูลข่าว CBS Scitech แสดงให้เห็นว่าแบบจำลองของเราสามารถอนุญาตให้ปรับตัวโดเมนที่ไม่ได้รับการดูแลได้อย่างมีประสิทธิภาพในขณะที่ยังสามารถรับการปรับตัวของโดเมนภายใต้การดูแลระหว่างโดเมนที่มีประเภทเอนทิตีที่แตกต่างกันอย่างสิ้นเชิง (เช่นข่าวเทียบกับชีวการแพทย์)

พื้นฐานที่ไร้เดียงสาของโมเดลงานเดียว ( STM ในกระดาษ) ส่วนใหญ่เป็นไปตาม NCRF ++

สำหรับรายละเอียดเพิ่มเติมโปรดดูเอกสารของเรา:

ข้ามโดเมนโดยใช้การสร้างแบบจำลองภาษาข้ามโดเมน
Chen Jia, Xiaobo Liang และ Yue Zhang*
(* ผู้เขียนที่เกี่ยวข้อง)
ACL 2019

ความต้องการ

 Python 2 or 3 
PyTorch 0.3

หน่วยความจำของ GPU หนึ่งตัวไม่ควรน้อยกว่า 8GB เพื่อให้พอดีกับรุ่น

ฝังตัว

ถุงมือ 100 มิติคำเวกเตอร์ (อ้างอิงจาก ที่นี่ )

ชุดข้อมูล

แหล่งที่มาของโดเมน:

Conll-2003 ข้อมูลภาษาอังกฤษ

โดเมนเป้าหมาย

unsupervised: CBS Scitech News (ชุดทดสอบ) (ใน: ` unsupervised_domain_adaptation data news_tech tech_test)
ภายใต้การดูแล: ชุดข้อมูล BIONLP13PC และชุดข้อมูล BIONLP13CG

ข้อมูลดิบ LM

RETURE DOMAIN RAW DATA จะถูกปล่อยออกมาพร้อมกับชุดข้อมูล CONLL-2003
Scitech News Domain Data Raw Data
การดาวน์โหลดข้อมูลดิบของสำนักข่าวรอยเตอร์

การใช้งาน

สั่งการ

supervised_domain_adaptation , unsupervised_domain_adaptation และ combined_SDA_and_UDA สามารถใช้คำสั่งต่อไปนี้เพื่อให้ทำงานได้

 python main.py --config train.NER.config

ไฟล์ train.NER.config มีพา ธ ชุดข้อมูลและโมเดล hyperparameters ตาม NCRF ++

รูปแบบอินพุต

เราขอแนะนำให้ใช้รูปแบบฉลาก iBoes สำหรับชุดข้อมูล NER
เราขอแนะนำให้ใช้รูปแบบอินพุตของหนึ่งเซ็นต์ต่อบรรทัดสำหรับข้อมูลดิบที่มีการแบ่งส่วนคำ

อ้างอิง:

หากคุณใช้ข้อมูลหรือรหัสของเราโปรดอ้างอิงบทความของเราดังนี้:

 @inproceedings{jia2019cross,
  title={Cross-domain ner using cross-domain language modeling},
  author={Jia, Chen and Liang, Xiaobo and Zhang, Yue},
  booktitle={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
  pages={2464--2474},
  year={2019}
  organization={Association for Computational Linguistics}
}

อัปเดต

v2. การรวมสถานการณ์ภายใต้การดูแลและสถานการณ์ที่ไม่ได้รับการดูแลใน combined_SDA_and_UDA
v1. สถานการณ์ภายใต้การดูแลก่อนหน้านี้ใน supervised_domain_adaptation ;
สถานการณ์ที่ไม่ได้รับการดูแลก่อนหน้านี้ใน unsupervised_domain_adaptation ;

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-10
ขนาด 330.64KB
มาจาก Github

แอปที่เกี่ยวข้อง

Newsletter_sign up_form

2024-11-01
เวอร์ชันอย่างเป็นทางการของ Indie Cross

2023-06-01
โดเมนไบนารี

2022-08-28
ไม้กางเขน

2022-08-27
โกลเด้นครอส

2022-07-31
Chrono Cross: The Radical Dreamers Edition

2022-07-24

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด