Download do COPEN - Download do código -fonte COPEN

COPEN

Código-Fonte de IA

1.0.0

Baixar

Copen

Conjunto de dados e código para o artigo do EMNLP 2022 '' Copen: sondando conhecimento conceitual em modelos de idiomas pré-treinados ''. O Copen é um conhecimento conceitual que está por referência que visa analisar as capacidades conceituais de compreensão dos modelos de linguagem pré-treinados (PLMs). Especificamente, o COPEN consiste em três tarefas:

Julgamento conceitual de similaridade (CSJ). Dada uma entidade de consulta e várias entidades candidatas, a tarefa CSJ exige selecionar a entidade candidata mais conceitualmente semelhante à entidade de consulta.
Julgamento conceitual da propriedade (CPJ). Dada uma declaração que descreve uma propriedade de um conceito, os PLMs precisam julgar se a declaração é verdadeira.
Conceitualização em contextos (CIC). Dada uma frase, uma entidade mencionada na frase e várias redes conceituais da entidade, os PLMs precisam selecionar o conceito mais apropriado de acordo com o contexto da entidade.

Exemplos

Experiências extensas em diferentes tamanhos e tipos de PLMs mostram que os PLMs existentes não têm sistematicamente conhecimento conceitual e sofrem de várias correlações espúrias. Acreditamos que este é um gargalo crítico para realizar a cognição humana no PLMS. São necessários mais objetivos ou arquiteturas com reconhecimento de conceito para desenvolver PLMs conceituais com conhecimento.

Codalab

Para obter os resultados dos testes, você precisa enviar seus resultados ao Codalab.

1. Início rápido

O repositório de código é baseado em Pytorch e Transformers . Use o seguinte comando para instalar todos os dependentes necessários. pip install -r requirements.txt

2. Baixe conjuntos de dados

A referência Copen é colocada no Tsinghua Cloud, use o seguinte comando para baixar os conjuntos de dados e colocá -los no caminho da proporção.

 cd data/
wget --content-disposition https://cloud.tsinghua.edu.cn/f/f0b33fb429fa4575aa7f/ ? dl=1
unzip copen_data.zip
mkdir task1/data
mkdir task2/data
mkdir task3/data
mv copen_data/task1/ * task1/data
mv copen_data/task2/ * task2/data
mv copen_data/task3/ * task3/data

3. Conjuntos de dados de pré-processamento

Sondagem

 cd task1
python probing_data_processor.py
cd ../
cd task2
python probing_data_processor.py
cd ../
cd task3
python probing_data_processor.py
cd ../

Afinação

python processor_utils.py task1 mc 
python processor_utils.py task2 sc
python processor_utils.py task3 mc

4. Corra

Sondagem

 cd code/probing
bash task1/run.sh 0 bert bert-base-uncased
bash task2/run.sh 0 bert bert-base-uncased
bash task3/run.sh 0 bert bert-base-uncased

Afinação

 cd code/finetuning
cd task1/ 
bash ../run.sh 0 bert bert-base-uncased task1 mc 42
cd task2/ 
bash ../run.sh 0 bert bert-base-uncased task2 sc 42
cd task3/ 
bash ../run.sh 0 bert bert-base-uncased task3 mc 42

5. Cite

Se nossos códigos ou referência o ajudarem, cite -nos:

 @inproceedings{peng2022copen,
  title={COPEN: Probing Conceptual Knowledge in Pre-trained Language Models},
  author={Peng, Hao and Wang, Xiaozhi and Hu, Shengding and Jin, Hailong and Hou, Lei and Li, Juanzi and Liu, Zhiyuan and Liu, Qun},
  booktitle={Proceedings of EMNLP},
  year={2022}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-09
tamanho 10.16MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos