BERT AttributeExtraction Download - BERT AttributeExtraction Quellcode herunterladen

BERT AttributeExtraction

Anderer Quellcode

1.0.0

Herunterladen

Bert-Attribute-Extraktion

Knowledge -Graph -Attributextraktion basierend auf Bert

Verwenden von Bert für die Attributextraktion in Knowledgegraph mit zwei Methoden: Feinabstimmung und Merkmalextraktion.

Knowledge Graph Baidu Encyclopedia Charaktereintragsattraktionsextraktion, Experimente wurden unter Verwendung der Feinabstimmungs- und Merkmal-Extraktionsmethode basierend auf Bert durchgeführt.

Voraussetzungen

 Tensorflow >=1.10
scikit-learn

Vorausgebildete Modelle

BERT-Base, Chinese : Chinesisch vereinfacht und traditionell, 12-Schicht, 768 versteckte, 12-Heads, 110 m Parameter

Installation

Keiner

Datensatz

Der Datensatz wird gemäß den Zeicheneinträgen von Baidu Encyclopedia konstruiert. Filtern Sie Korpus heraus, das keine Entitäten und Attribute enthält.

Entitäten und Attribute werden aus der Erkennung von Namen Entität erhalten.

Etiketten werden aus der Baidu Encyclopedia Infobox erhalten, und die meisten von ihnen sind manuell gekennzeichnet, sodass einige nicht sehr gut sind.
Zum Beispiel:

黄维#1904年#1#黄维（1904年-1989年），字悟我，出生于江西贵溪一农户家庭。        
陈昂#山东省滕州市#1#邀请担任诗词嘉宾。1992年1月26日，陈昂出生于山东省滕州市一个普通的知识分子家庭，其祖父、父亲都
陈伟庆#肇庆市鼎湖区#0#长。任免信息2016年10月21日下午，肇庆市鼎湖区八届人大一次会议胜利闭幕。陈伟庆当选区人民政府副区长。

Erste Schritte

run strip.py kann gestreifte Daten abrufen
Führen Sie data_process.py aus
parameters sind die Parameter, die das Modell benötigen

Die Tests ausführen

Zum Beispiel mit dem Geburtsort -Datensatz:

Feinabstimmung

run run_classifier.py , um vorhergesagte Wahrscheinlichkeitsausgänge zu erhalten

python run_classifier.py 
        --task_name=my 
        --do_train=true 
        --do_predict=true 
        --data_dir=a 
        --vocab_file=/home/tiny/zhaomeng/bertmodel/vocab.txt 
        --bert_config_file=/home/tiny/zhaomeng/bertmodel/bert_config.json 
        --init_checkpoint=/home/tiny/zhaomeng/bertmodel/bert_model.ckpt 
        --max_seq_length=80 
        --train_batch_size=32 
        --learning_rate=2e-5 
        --num_train_epochs=1.0 
        --output_dir=./output

Führen Sie dann proba2metrics.py aus, um das Endergebnis mit falscher Klassifizierung zu erhalten

Feature-Extraction

Führen Sie extract_features.py aus, um die Vektordarstellung von Zug- und Testdaten im JSON -Dateiformat zu erhalten

python extract_features.py 
        --input_file=../data/birth_place_train.txt 
        --output_file=../data/birth_place_train.jsonl 
        --vocab_file=/home/tiny/zhaomeng/bertmodel/vocab.txt 
        --bert_config_file=/home/tiny/zhaomeng/bertmodel/bert_config.json 
        --init_checkpoint=/home/tiny/zhaomeng/bertmodel/bert_model.ckpt 
        --layers=-1 
        --max_seq_length=80 
        --batch_size=16

Führen Sie dann json2vector.py aus, um die JSON -Datei in die Vektordarstellung zu übertragen
Schließlich run run_classifier.py , um maschinelle Lernmethoden zur Klassifizierung zu verwenden. MLP wird normalerweise am besten

Ergebnisse

Die vorhergesagten Ergebnisse und falsch klassifizierten Korpus werden in Ergebnis DIR gespeichert.

Zum Beispiel mit dem Geburtsort-Datensatz mit der Feinabstimmungsmethode ist das Ergebnis:

            precision    recall  f1-score   support

     0      0.963     0.967     0.965       573
     1      0.951     0.946     0.948       389

Autoren

Zhao Meg

Lizenz

Dieses Projekt ist unter der MIT -Lizenz lizenziert

Anerkennung

usw

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-18
Größe 3.32MB
Kommt von Github

Ähnliche Anwendungen

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

BERT AttributeExtraction

Bert-Attribute-Extraktion

Knowledge -Graph -Attributextraktion basierend auf Bert

Voraussetzungen

Vorausgebildete Modelle

Installation

Datensatz

Erste Schritte

Die Tests ausführen

Ergebnisse

Autoren

Lizenz

Anerkennung

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

GitHub the via/releases

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express