BERT AttributeExtraction Téléchargement - BERT AttributeExtraction Code source Téléchargement

BERT AttributeExtraction

Autre code source

1.0.0

Télécharger

Bert-Attribute-Extraction

Extraction d'attribut de graphique de connaissances basée sur Bert

Utilisation de Bert pour l'extraction d'attribut dans Knowledgegraph avec deux méthode, du réglage fin et de l'extraction de fonctionnalités.

Graphique de connaissance Baidu Encyclopedia Caractor Entry Attribut Extraction, Des expériences ont été réalisées en utilisant la méthode de réglage fin et d'extraction de fonctions du réglage fin basé sur Bert.

Condition préalable

 Tensorflow >=1.10
scikit-learn

Modèles pré-formés

BERT-Base, Chinese : chinois simplifié et traditionnel, 12 couches, 768, 12 têtes, 110 m de paramètres

Installation

Aucun

Ensemble de données

L'ensemble de données est construit selon les entrées de caractères de Baidu Encyclopedia. Filtrez le corpus qui ne contient pas d'entités et d'attributs.

Les entités et les attributs sont obtenus à partir de la reconnaissance des entités de nom.

Les étiquettes sont obtenues auprès de l'encyclopédie Baidu Infobox, et la plupart d'entre eux sont étiquetés manuellement, donc certains ne sont pas très bons.
Par exemple:

黄维#1904年#1#黄维（1904年-1989年），字悟我，出生于江西贵溪一农户家庭。        
陈昂#山东省滕州市#1#邀请担任诗词嘉宾。1992年1月26日，陈昂出生于山东省滕州市一个普通的知识分子家庭，其祖父、父亲都
陈伟庆#肇庆市鼎湖区#0#长。任免信息2016年10月21日下午，肇庆市鼎湖区八届人大一次会议胜利闭幕。陈伟庆当选区人民政府副区长。

Commencer

Run strip.py peut obtenir des données rayées
Exécuter data_process.py peut traiter les données pour obtenir une entrée de fichier Numpy
Le fichier parameters est les paramètres dont le modèle exécute a besoin

Exécuter les tests

Par exemple avec un ensemble de données sur le lieu de naissance:

réglage fin

run run_classifier.py pour obtenir des sorties de probabilité prévues

python run_classifier.py 
        --task_name=my 
        --do_train=true 
        --do_predict=true 
        --data_dir=a 
        --vocab_file=/home/tiny/zhaomeng/bertmodel/vocab.txt 
        --bert_config_file=/home/tiny/zhaomeng/bertmodel/bert_config.json 
        --init_checkpoint=/home/tiny/zhaomeng/bertmodel/bert_model.ckpt 
        --max_seq_length=80 
        --train_batch_size=32 
        --learning_rate=2e-5 
        --num_train_epochs=1.0 
        --output_dir=./output

Ensuite, exécutez proba2metrics.py pour obtenir un résultat final avec une mauvaise classification

Extraction des fonctionnalités

Exécutez extract_features.py pour obtenir la représentation vectorielle des données de train et de test au format de fichier JSON

python extract_features.py 
        --input_file=../data/birth_place_train.txt 
        --output_file=../data/birth_place_train.jsonl 
        --vocab_file=/home/tiny/zhaomeng/bertmodel/vocab.txt 
        --bert_config_file=/home/tiny/zhaomeng/bertmodel/bert_config.json 
        --init_checkpoint=/home/tiny/zhaomeng/bertmodel/bert_model.ckpt 
        --layers=-1 
        --max_seq_length=80 
        --batch_size=16

Ensuite, exécutez json2vector.py pour transférer le fichier JSON vers la représentation vectorielle
Enfin, exécutez run_classifier.py pour utiliser les méthodes d'apprentissage automatique pour faire la classification, MLP est généralement le meilleur

Résultats

Les résultats prévus et le corpus mal classé sont enregistrés dans le résultat du résultat.

Par exemple, avec un ensemble de données sur le lieu de naissance en utilisant la méthode de réglage fin, le résultat est:

            precision    recall  f1-score   support

     0      0.963     0.967     0.965       573
     1      0.951     0.946     0.948       389

Auteurs

zhao meg

Licence

Ce projet est concédé sous licence MIT

Remerciements

etc.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-18
taille 3.32MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout