تنزيل COPEN - تنزيل رمز المصدر COPEN

COPEN

كود الذكاء الاصطناعي

1.0.0

تنزيل

كوبن

مجموعة البيانات والرمز لورقة EMNLP 2022 "Copen": التحقيق في المعرفة المفاهيمية في نماذج اللغة المسبقة ". Copen هو معيار المعرفة المفاهيمية المعيار الذي يهدف إلى تحليل قدرات الفهم المفاهيمي لنماذج اللغة التي تم تدريبها مسبقًا (PLMS). على وجه التحديد ، يتكون كوبن من ثلاث مهام:

حكم التشابه المفاهيمي (CSJ). بالنظر إلى كيان الاستعلام والعديد من الكيانات المرشحة ، تتطلب مهمة CSJ تحديد كيان المرشح الأكثر تشابهًا من الناحية المفاهيمية إلى كيان الاستعلام.
حكم الملكية المفاهيمية (CPJ). بالنظر إلى بيان يصف خاصية مفهوم ما ، تحتاج PLMs إلى الحكم على ما إذا كان البيان صحيحًا.
تصور في السياقات (CIC). بالنظر إلى جملة ، كيان مذكور في الجملة ، والعديد من سلاسل المفاهيم من الكيان ، تحتاج PLMs إلى تحديد المفهوم الأنسب وفقًا لسياق الكيان.

أمثلة

تُظهر تجارب مكثفة على أحجام وأنواع مختلفة من PLMs أن PLMs الحالية تفتقر بشكل منهجي إلى المعرفة المفاهيمية وتعاني من ارتباطات زائفة مختلفة. نعتقد أن هذا عنق الزجاجة الحرجة لتحقيق الإدراك الذي يشبه الإنسان في PLMs. هناك حاجة إلى مزيد من الأهداف أو البنى المدرجة في المفاهيم لتطوير PLMs المفاهيمية المعروفة.

Codalab

للحصول على نتائج الاختبار ، تحتاج إلى إرسال نتائجك إلى Codalab.

1. بداية سريعة

يعتمد مستودع الكود على Pytorch و Transformers . يرجى استخدام الأمر التالي لتثبيت جميع التبعية اللازمة. pip install -r requirements.txt

2. تنزيل مجموعات البيانات

يتم وضع معيار Copen على Tsinghua Cloud ، يرجى استخدام الأمر التالي لتنزيل مجموعات البيانات ووضعها في مسار propor.

 cd data/
wget --content-disposition https://cloud.tsinghua.edu.cn/f/f0b33fb429fa4575aa7f/ ? dl=1
unzip copen_data.zip
mkdir task1/data
mkdir task2/data
mkdir task3/data
mv copen_data/task1/ * task1/data
mv copen_data/task2/ * task2/data
mv copen_data/task3/ * task3/data

3. مجموعات البيانات قبل المعالجة

التحقيق

 cd task1
python probing_data_processor.py
cd ../
cd task2
python probing_data_processor.py
cd ../
cd task3
python probing_data_processor.py
cd ../

الكون المثالى

python processor_utils.py task1 mc 
python processor_utils.py task2 sc
python processor_utils.py task3 mc

4. الجري

التحقيق

 cd code/probing
bash task1/run.sh 0 bert bert-base-uncased
bash task2/run.sh 0 bert bert-base-uncased
bash task3/run.sh 0 bert bert-base-uncased

الكون المثالى

 cd code/finetuning
cd task1/ 
bash ../run.sh 0 bert bert-base-uncased task1 mc 42
cd task2/ 
bash ../run.sh 0 bert bert-base-uncased task2 sc 42
cd task3/ 
bash ../run.sh 0 bert bert-base-uncased task3 mc 42

5. استشهد

إذا كانت رموزنا أو القياس الخاص بنا تساعدك ، فيرجى الاستشهاد بنا:

 @inproceedings{peng2022copen,
  title={COPEN: Probing Conceptual Knowledge in Pre-trained Language Models},
  author={Peng, Hao and Wang, Xiaozhi and Hu, Shengding and Jin, Hailong and Hou, Lei and Li, Juanzi and Liu, Zhiyuan and Liu, Qun},
  booktitle={Proceedings of EMNLP},
  year={2022}
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-09
الحجم 10.16MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل