Proyek ini didasarkan pada Pytorch dan TorchText, dan bertujuan untuk memberikan kerangka pembelajaran mendalam dasar untuk tugas-tugas terkait pemrosesan bahasa alami.
Untuk instruksi dan tutorial terperinci, silakan merujuk ke dokumentasi proyek: LightNLP-CookBook
pip install lightNLPDisarankan untuk menggunakan sumber domestik untuk dipasang, seperti menggunakan perintah berikut:
pip install -i https://pypi.douban.com/simple/ lightNLPKarena beberapa perpustakaan seperti Pytorch dan TorchText tidak ada dalam sumber PYPI atau hanya memiliki versi yang lebih lama, kita perlu menginstal beberapa perpustakaan secara terpisah.
Silakan gunakan versi terbaru Pytorch!
Untuk instalasi tertentu, silakan merujuk ke situs web resmi Pytorch untuk memilih versi yang cocok untuk Anda sesuai dengan platform, metode instalasi, versi Python, dan versi CUDA.
Gunakan perintah berikut untuk menginstal versi terbaru dari TorchText:
pip install https://github.com/pytorch/text/archive/master.zipBio
Contoh data pelatihan adalah sebagai berikut:
清 B_Time
明 I_Time
是 O
人 B_Person
们 I_Person
祭 O
扫 O
先 B_Person
人 I_Person
, O
怀 O
念 O
追 O
思 O
的 O
日 B_Time
子 I_Time
。 O
正 O
如 O
宋 B_Time
代 I_Time
诗 B_Person
人 I_Person
from lightnlp.sl import NER
# 创建NER对象
ner_model = NER()
train_path = '/home/lightsmile/NLP/corpus/ner/train.sample.txt'
dev_path = '/home/lightsmile/NLP/corpus/ner/test.sample.txt'
vec_path = '/home/lightsmile/NLP/embedding/char/token_vec_300.bin'
# 只需指定训练数据路径和TensorBoard日志文件路径,预训练字向量可选,开发集路径可选,模型保存路径可选(模型保存路径默认为`xx_saves`,其中xx为模型简称,如ner)。
ner_model.train(train_path, vectors_path=vec_path, dev_path=dev_path, save_path='./ner_saves', log_dir='E:/Test/tensorboard/')
# 加载模型,默认当前目录下的`ner_saves`目录
ner_model.load('./ner_saves')
# 对train_path下的测试集进行读取测试
ner_model.test(train_path)
from pprint import pprint
pprint(ner_model.predict('另一个很酷的事情是,通过框架我们可以停止并在稍后恢复训练。'))
Hasil prediksi:
[{'end': 15, 'entity': '我们', 'start': 14, 'type': 'Person'}]
Jalankan perintah berikut dari baris perintah, di mana E:TesttensorBoard dimodifikasi menjadi jalur penyimpanan log selama pelatihan model, dan spesifikasi port adalah opsional:
tensorboard --logdir=E: T est t ensorBoard --port=2019Anda dapat melihat efek yang sama:

ner_model . deploy ( host = "localhost" , port = 2020 , debug = False ) Semua parameter adalah opsional. Parameter host default ke localhost . port akan secara otomatis diterapkan untuk port idle ke sistem oleh program, dan mode debug tidak akan diaktifkan secara default.
Anda dapat menggunakan tukang pos atau menulis program untuk mengujinya, seperti yang ditunjukkan pada gambar di bawah ini: 

scalar kehilangan dan skor dan graph dari masing -masing model (saat ini ada beberapa bug dalam fungsi Add_Graph Ringkasan penulisan di Pytorch, sehingga tidak dapat ditambahkan untuk saat ini.). name sendiri. Jika proyek ini bermanfaat bagi Anda, tolong beri saya hadiah ~