kg baseline pytorch
1.0.0
2019百度的關係抽取比賽,Pytorch版蘇神的baseline,聯合關係抽取。
與蘇神的模型相同,只不過開發框架由Keras+Tensorflow變成了Pytorch,給使用Pytorch的小伙伴分享。
蘇神Keras版鏈接:https://github.com/bojone/kg-2019-baseline
代碼中復用了許多蘇神的代碼,因此首先對蘇神表示感謝!
以下為蘇神模型介紹原文:
用BiLSTM做联合标注,先预测subject,然后根据suject同时预测object和predicate,标注结构是“半指针-半标注”结构,以前也曾介绍过( https://kexue.fm/archives/5409 )
标注结构是自己设计的,我看了很多关系抽取的论文,没有发现类似的做法。所以,如果你基于此模型做出后的修改,最终获奖了或者发表paper什么的,烦请注明一下(其实也不是太奢望)
@misc{
jianlin2019bdkg,
title={Hybrid Structure of Pointer and Ragging for Relation Extraction: A Baseline},
author={Jianlin Su},
year={2019},
publisher={GitHub},
howpublished={url{https://github.com/bojone/kg-2019-baseline}},
}
CSDN上基於本代碼的算法簡介:https://blog.csdn.net/qq_35268841/article/details/107063066
python trans.py轉換數據, python main.py跑模型並觀察結果。
代碼需要GPU運行!若需要CPU運行則去掉代碼中所有的.cuda()並將一些cuda上的數據類型改為普通數據類型即可。
數據只提供了共30條示例數據。數據由比賽官方提供,如有需要請聯繫比賽主辦方。
5個epoch到達0.73,最高能到0.75。
Python 3.5+
Pytorch 1.0.1
tqdm