ดาวน์โหลด lightNLP - ดาวน์โหลดซอร์สโค้ด lightNLP

Lightnlp กรอบการประมวลผลภาษาธรรมชาติขั้นพื้นฐานมาก

การแนะนำ

โครงการนี้ขึ้นอยู่กับ Pytorch และ Torchtext และมีจุดมุ่งหมายเพื่อให้กรอบการเรียนรู้เชิงลึกพื้นฐานสำหรับงานที่เกี่ยวข้องกับการประมวลผลภาษาธรรมชาติ

สำหรับคำแนะนำและแบบฝึกหัดโดยละเอียดโปรดดูเอกสารประกอบโครงการ: LightNLP-Cookbook

คำแถลง

ในแง่ของการวางตำแหน่งโครงการนี้เป็นเพียงการรวบรวมและความพยายามและวัตถุประสงค์ของมันไม่ได้ใช้เป็นระดับองค์กรและระดับการผลิต กลุ่มเป้าหมายส่วนใหญ่เป็นนักพัฒนาคอมพิวเตอร์และผู้เริ่มต้นที่มีความสนใจในการปฏิบัติงานต่าง ๆ ของการประมวลผลภาษาธรรมชาติและที่สำคัญกว่านั้นคือพวกเขาคือ ความบันเทิงในตนเอง
หากผู้ใช้หรือนักพัฒนาที่มีความต้องการสถานการณ์จริงสามารถอ้างถึงบริการเชิงพาณิชย์ NLP ของจีนในอุตสาหกรรมเพื่อค้นหาบริการเชิงพาณิชย์แน่นอนฉันยินดีที่จะให้บริการที่ได้รับค่าจ้าง
สำหรับผู้ที่มีความเข้าใจบางอย่างเกี่ยวกับการประมวลผลภาษาและภาษาธรรมชาติหากคุณต้องการดำเนินการพัฒนาอย่างรวดเร็วและปรับแต่งแอปพลิเคชัน NLP ได้อย่างอิสระคุณสามารถพิจารณา FastNLP ที่เปิดโดยห้องปฏิบัติการ NLP ของ FUDAN University ซึ่งมีฟังก์ชั่นกรอบงานที่หลากหลายและใช้งานง่าย
โครงการนี้ไม่ได้ให้ข้อมูลการฝึกอบรมและแบบจำลองที่ผ่านการฝึกอบรมสำหรับแต่ละงานเช่นเฟรมเวิร์กอื่น ๆ เพื่อให้สามารถดาวน์โหลดและใช้งานได้โดยตรง
แบบจำลองหลายรุ่นของโครงการนี้ขึ้นอยู่กับการใช้งานดั้งเดิมบน GitHub จากนั้นประมวลผลบนพื้นฐานของกระบวนการ ที่นี่ฉันต้องการแสดงความขอบคุณอย่างจริงใจต่อผู้เขียนที่เกี่ยวข้อง!
พารามิเตอร์ต่าง ๆ ของแต่ละโมเดลงานไม่ได้รับการปรับแต่งอย่างประณีต แต่เฉพาะในระดับที่พวกเขาสามารถทำงานได้
โครงการนี้สามารถทำได้ภายใต้สองสภาพแวดล้อมการพัฒนาต่อไปนี้ ฉันไม่รับผิดชอบต่อปัญหาใด ๆ ที่เกิดขึ้นจากสภาพแวดล้อมอื่น ๆ
- Windows 10, Python 3.6, Pytorch 1.3
- Manjaro, Python 3.7, Pytorch 1.3

ติดตั้ง

pip install lightNLP

ขอแนะนำให้ใช้แหล่งข้อมูลในประเทศเพื่อติดตั้งเช่นการใช้คำสั่งต่อไปนี้:

pip install -i https://pypi.douban.com/simple/ lightNLP

การพึ่งพาการติดตั้ง

เนื่องจากไลบรารีบางแห่งเช่น Pytorch และ Torchtext ไม่ได้อยู่ในแหล่ง PYPI หรือมีรุ่นเก่าเท่านั้นเราจึงต้องติดตั้งไลบรารีบางอย่างแยกกัน

ติดตั้ง pytorch

โปรดใช้ Pytorch เวอร์ชันล่าสุด!

สำหรับการติดตั้งเฉพาะโปรดดูที่เว็บไซต์ทางการของ Pytorch เพื่อเลือกเวอร์ชันที่เหมาะสมกับคุณตามแพลตฟอร์มวิธีการติดตั้งเวอร์ชัน Python และรุ่น CUDA

ติดตั้ง Torchtext

ใช้คำสั่งต่อไปนี้เพื่อติดตั้ง Torchtext เวอร์ชันล่าสุด:

pip install https://github.com/pytorch/text/archive/master.zip

ตัวอย่าง

ชื่อการจดจำเอนทิตี (NER)

1. ข้อมูลการฝึกอบรม

ชีวภาพ

ตัวอย่างข้อมูลการฝึกอบรมมีดังนี้:

清 B_Time
明 I_Time
是 O
人 B_Person
们 I_Person
祭 O
扫 O
先 B_Person
人 I_Person
， O
怀 O
念 O
追 O
思 O
的 O
日 B_Time
子 I_Time
。 O

正 O
如 O
宋 B_Time
代 I_Time
诗 B_Person
人 I_Person

2. ใช้ตัวอย่าง

1. การฝึกอบรม

 from lightnlp.sl import NER

# 创建NER对象
ner_model = NER()

train_path = '/home/lightsmile/NLP/corpus/ner/train.sample.txt'
dev_path = '/home/lightsmile/NLP/corpus/ner/test.sample.txt'
vec_path = '/home/lightsmile/NLP/embedding/char/token_vec_300.bin'

# 只需指定训练数据路径和TensorBoard日志文件路径，预训练字向量可选，开发集路径可选，模型保存路径可选（模型保存路径默认为`xx_saves`，其中xx为模型简称，如ner）。
ner_model.train(train_path, vectors_path=vec_path, dev_path=dev_path, save_path='./ner_saves', log_dir='E:/Test/tensorboard/')

2. ทดสอบ

 # 加载模型，默认当前目录下的`ner_saves`目录
ner_model.load('./ner_saves')
# 对train_path下的测试集进行读取测试
ner_model.test(train_path)

3. การทำนาย

 from pprint import pprint

pprint(ner_model.predict('另一个很酷的事情是，通过框架我们可以停止并在稍后恢复训练。'))

ผลการทำนาย:

 [{'end': 15, 'entity': '我们', 'start': 14, 'type': 'Person'}]

4. ตรวจสอบเอฟเฟกต์การฝึกอบรม

ดำเนินการคำสั่งต่อไปนี้จากบรรทัดคำสั่งโดยที่ E:TesttensorBoard ได้รับการแก้ไขให้เป็นเส้นทางการจัดเก็บบันทึกในระหว่างการฝึกอบรมแบบจำลองและข้อกำหนดของพอร์ตเป็นทางเลือก:

tensorboard --logdir=E: T est t ensorBoard --port=2019

คุณสามารถเห็นผลที่คล้ายกัน:

บอร์ดบอร์ด

5. ปรับใช้บริการ

 ner_model . deploy ( host = "localhost" , port = 2020 , debug = False )

พารามิเตอร์ทั้งหมดเป็นทางเลือก พารามิเตอร์ host เป็นค่าเริ่มต้นเป็น localhost port จะถูกนำไปใช้โดยอัตโนมัติสำหรับพอร์ตที่ไม่ได้ใช้งานกับระบบโดยโปรแกรมและโหมด debug จะไม่ถูกเปิดใช้งานโดยค่าเริ่มต้น

คุณสามารถใช้บุรุษไปรษณีย์หรือเขียนโปรแกรมเพื่อทดสอบดังที่แสดงในรูปด้านล่าง: Jupyter-Notebook

สิ่งที่ต้องทำ

ธุรกิจ

เพิ่มคำอธิบายโครงการสั้น ๆ
ให้ข้อมูลการฝึกอบรมการสาธิตสำหรับแต่ละงาน

โครงการ

สร้างโครงสร้างโครงการใหม่รวมสถานที่ที่ซ้ำซ้อนเดียวกันและทำให้โครงสร้างโครงการชัดเจน
เพิ่มฟังก์ชั่นการสร้างภาพเทนซอร์บอร์ดส่วนใหญ่รวมถึง scalar ของการสูญเสียและคะแนนและ graph ของแต่ละรุ่น (ปัจจุบันมีข้อบกพร่องบางอย่างในฟังก์ชั่น add_graph ของ SummaryWriter ใน Pytorch ดังนั้นจึงไม่สามารถเพิ่มได้ในขณะนี้)
เพิ่มฟังก์ชั่นการปรับใช้โมเดลที่ใช้ขวดง่าย (ปัจจุบันใช้สำหรับการทดสอบเอฟเฟกต์การฝึกอบรมแบบจำลองเท่านั้น)
ตอนนี้เส้นทางและชื่อที่บันทึกโดยโมเดลจะเหมือนกันโดยค่าเริ่มต้นและจะขัดแย้งกัน ถัดไปแต่ละรุ่นมี name ของตัวเอง
เพิ่มฟังก์ชั่นการฝึกอบรมเบรกพอยต์
เพิ่มก่อนกำหนด

การทำงาน

รางวัล

หากโครงการนี้เป็นประโยชน์กับคุณโปรดให้รางวัลแก่ฉัน ~

ขยาย

lightNLP

Lightnlp กรอบการประมวลผลภาษาธรรมชาติขั้นพื้นฐานมาก

การแนะนำ

คำแถลง

ติดตั้ง

การพึ่งพาการติดตั้ง

ติดตั้ง pytorch

ติดตั้ง Torchtext

ตัวอย่าง

ชื่อการจดจำเอนทิตี (NER)

1. ข้อมูลการฝึกอบรม

2. ใช้ตัวอย่าง

1. การฝึกอบรม

2. ทดสอบ

3. การทำนาย

4. ตรวจสอบเอฟเฟกต์การฝึกอบรม

5. ปรับใช้บริการ

สิ่งที่ต้องทำ

ธุรกิจ

โครงการ

การทำงาน

รางวัล

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express