MKG_Analogy Téléchargement - MKG_Analogy Téléchargement du code source

MKG_Analogy

Code Source AI

1.0.0

Télécharger

Mkg_analogie

Code et ensembles de données pour l'article ICLR2023 "raisonnement analogique multimodal sur les graphiques de connaissances"

❗New: Nous fournissons une démo en étreinte sur https://huggingface.co/spaces/zjunlp/mkg_analogy, amusez-vous!
❗New: Nous avons publié les points de contrôle sur Google Drive pour la reproductibilité.
❗New: Nous avons publié le PowerPoint sur ICLR2023_MKG_ANALOGY.pdf.

Liens rapides

Mkg_analogie
- Aperçu
- Exigences
- Préparation des données
- Évaluer sur des mehods de référence
  - Méthodes de représentation des connaissances multimodales
  - Méthodes basées sur le transformateur
- Citation

Aperçu

Dans ce travail, nous proposons une nouvelle tâche de raisonnement analogique multimodal sur le graphique de connaissances. Un aperçu de la tâche de raisonnement analogique multimodal peut être considéré comme suit:

Nous fournissons un graphique de connaissances pour soutenir et diviser davantage la tâche en modèles uniques et mélangés. Notez que la relation marquée par des flèches en pointillés ( $ dashRightarrow $ ) et le texte autour des parenthèses sous images ne concerne que l'annotation et non fournis dans l'entrée.

Exigences

 pip install -r requirements.txt

Collecte de données et prétraitement

Pour prendre en charge la tâche de raisonnement analogique multimodal, nous collectons un jeu de données de graphiques de connaissances multimodal MarkG et un jeu de données de raisonnement analogique multimodal Mars. Un aperçu visuel de la collecte de données comme indiqué dans la figure suivante:

Nous collectons les ensembles de données suivant les étapes ci-dessous:

Collectez des entités et des relations analogiques
Lien vers Wikidata et récupérer les voisins
Acquérir et valider des images
Exemples de données de raisonnement analogique

Les statistiques des deux ensembles de données sont présentées dans les chiffres suivants:

Nous mettons les données de texte sous MarT/dataset/ , et les données d'image peuvent être téléchargées via Google Drive ou le Baidu Pan (Terabox) (code: 7HOC) et placés sur MarT/dataset/MARS/images . Veuillez vous référer à Mart pour plus de détails.

La structure attendue des fichiers est:

 MKG_Analogy
 |-- M-KGE	# multimodal knowledge representation methods
 |    |-- IKRL_TransAE   
 |    |-- RSME
 |-- MarT
 |    |-- data          # data process functions
 |    |-- dataset
 |    |    |-- MarKG    # knowledge graph data
 |    |    |-- MARS     # analogical reasoning data
 |    |-- lit_models    # pytorch_lightning models
 |    |-- models        # source code of models
 |    |-- scripts       # running scripts
 |    |-- tools         # tool function
 |    |-- main.py       # main function
 |-- resources   # image resources
 |-- requirements.txt
 |-- README.md

Évaluer sur des mehods de référence

Nous sélectionnons certaines méthodes de référence pour établir les résultats de référence initiaux sur Mars, y compris les méthodes de représentation des connaissances multimodales (IKRL, Transae, RSME), les modèles pré-formés en langue de vision (Visualbert, Vilbert, Vilt, Flava) et une méthode d'achèvement du graphique de connaissances multimodales (MKGFORMER).

De plus, nous suivons la théorie de la cartographie de la structure pour considérer l'induction de la mappage d'abudction comme des étapes explicites de ligne de pip pour les méthodes de représentation des connaissances multimodales. Quant aux méthodes basées sur les transformateurs, nous proposons en outre Mart, un nouveau cadre qui combine implicitement ces trois étapes pour accomplir la tâche de raisonnement analogique multimodal de bout en bout, ce qui peut éviter la propagation des erreurs pendant le raisonnement analogique. L'aperçu des méthodes de base peut être vu dans la figure ci-dessus.

Méthodes de représentation des connaissances multimodales

1. Ikrl

Nous reproduisons les modèles IKRL via Transae Framework, pour évaluer sur IKRL, exécutant le code suivant:

 cd M-KGE/IKRL_TransAE
python IKRL.py

Vous pouvez choisir un pré-transfort / affineur et un transe / analogie en modifiant les paramètres finetune et analogy dans IKRL.py , respectivement.

2. Transae

Pour évaluer sur IKRL, exécuter le code suivant:

 cd M-KGE/IKRL_TransAE
python TransAE.py

Vous pouvez choisir un prétraitement / affiner et un transe / analogie en modifiant les paramètres finetune et analogy dans TransAE.py , respectivement.

3. RSME

Nous ne fournissons qu'une partie des données pour RSME. Pour évaluer sur RSME, vous devez générer les données complètes en suivant les scripts:

 cd M-KGE/RSME
python image_encoder.py  # -> analogy_vit_best_img_vec.pickle
python utils.py          # -> img_vec_id_analogy_vit.pickle

Tout d'abord, pré-entraînez les modèles sur Markg:

bash run.sh

Modifiez ensuite le paramètre --checkpoint et affinez les modèles sur Mars:

bash run_finetune.sh

Plus de détails de formation sur les modèles ci-dessus peuvent faire référence à leurs référentiels officiels.

Méthodes basées sur le transformateur

Nous tirons parti du cadre MART pour les modèles basés sur les transformateurs. MART contient deux étapes: prétraitement et affinure.

Pour former les modèles rapidement, nous codons les données de l'image à l'avance avec ce script (notez que la taille des données codées est d'environ 7 Go):

 cd MarT
python tools/encode_images_data.py

Prenant l'exemple de mkgformer, pré-entraînez d'abord le modèle via le script suivant:

bash scripts/run_pretrain_mkgformer.sh

Après la pré-formation, affinez le modèle via le script suivant:

bash scripts/run_finetune_mkgformer.sh

? Nous fournissons les meilleurs points de contrôle des modèles basés sur les transformateurs lors des phrases finales et pré-formation sur ce Google Drive. Téléchargez-les et ajoutez --only_test dans scripts/run_finetune_xxx.sh pour tester des expériences.

Citation

Si vous utilisez ou étendez notre travail, veuillez citer le papier comme suit:

 @inproceedings {
zhang2023multimodal,
title = { Multimodal Analogical Reasoning over Knowledge Graphs } ,
author = { Ningyu Zhang and Lei Li and Xiang Chen and Xiaozhuan Liang and Shumin Deng and Huajun Chen } ,
booktitle = { The Eleventh International Conference on Learning Representations } ,
year = { 2023 } ,
url = { https://openreview.net/forum?id=NRHajbzg8y0P }
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-10
taille 25.67MB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Chien_Renard_Lapin

2022-08-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout