lightNLP -Download - lightNLP -Quellcode herunterladen

lightNLP

Anderer Quellcode

1.0.0

Herunterladen

LightNLP, ein sehr grundlegender Rahmen für natürliche Sprachverarbeitung

Einführung

Dieses Projekt basiert auf Pytorch und Torchtext und zielt darauf ab, einen grundlegenden Deep-Learn-Rahmen für Aufgaben zu natürlichen Sprachverarbeitungen zu bieten.

Ausführliche Anweisungen und Tutorials finden Sie in der Projektdokumentation: LightNLP-C-TOOKBOOK

Stellungnahme

In Bezug auf die Positionierung ist dieses Projekt nur eine Sammlung und ein Versuch, und sein Zweck wird nicht als Unternehmensebene und Produktionsebene verwendet. Die Zielgruppe ist hauptsächlich Computerentwickler und Anfänger, die an der Praxis verschiedener Aufgaben der Verarbeitung natürlicher Sprache interessiert sind, und was noch wichtiger ist, dass sie Selbstverständlichkeit sind.
Wenn Benutzer oder Entwickler, die reale Szenarioanforderungen haben, auf die chinesische NLP -NLP -Werbedienste in der Branche verweisen können, um kommerzielle Dienstleistungen zu suchen, bin ich natürlich bereit, bezahlte Dienstleistungen anzubieten.
Für diejenigen, die ein gewisses Verständnis für Pytorch und natürliche Sprachverarbeitung haben, können Sie, wenn Sie eine schnelle Entwicklung verfolgen und frei von NLP -Anwendungen anpassen möchten, FastnLP -Open -Sourcen von NLP Laboratory der Fudan University, das umfangreiche Rahmenfunktionen verfügt und einfach und einfach zu bedienen hat.
Dieses Projekt enthält keine einige Trainingsdaten und geschulte Modelle für jede Aufgabe wie einige andere Frameworks, damit sie direkt heruntergeladen und verwendet werden können.
Viele der Modelle dieses Projekts basieren auf der ursprünglichen Implementierung auf GitHub und dann auf der Grundlage des Prozesses verarbeitet. Hier möchte ich den relevanten Autoren meine aufrichtige Dankbarkeit aussprechen!
Die verschiedenen Parameter jedes Aufgabenmodells sind nicht fein abgestimmt, sondern nur in dem Maße, in dem sie ausgeführt werden können.
Dieses Projekt kann nur in den folgenden zwei Entwicklungsumgebungen erreicht werden. Ich bin nicht verantwortlich für Probleme, die sich aus anderen Umgebungen ergeben.
- Windows 10, Python 3.6, Pytorch 1.3
- Manjaro, Python 3.7, Pytorch 1.3

Installieren

pip install lightNLP

Es wird empfohlen, inländische Quellen zur Installation zu verwenden, z. B. den folgenden Befehl:

pip install -i https://pypi.douban.com/simple/ lightNLP

Installationsabhängigkeiten

Da einige Bibliotheken wie Pytorch und Torchtext nicht in der PYPI -Quelle sind oder nur ältere Versionen haben, müssen wir einige Bibliotheken separat installieren.

Pytorch installieren

Bitte verwenden Sie die neueste Version von Pytorch!

Für eine bestimmte Installation finden Sie auf der offiziellen Website von Pytorch, um die Version auszuwählen, die Ihnen entsprechend der Plattform, der Installationsmethode, der Python -Version und der CUDA -Version entspricht.

Installieren Sie den Torchtext

Verwenden Sie den folgenden Befehl, um die neueste Version von Torchtext zu installieren:

pip install https://github.com/pytorch/text/archive/master.zip

Beispiel

Genannte Entitätserkennung (NER)

1. Trainingsdaten

Bio

Die Beispiele für Trainingsdaten sind wie folgt:

清 B_Time
明 I_Time
是 O
人 B_Person
们 I_Person
祭 O
扫 O
先 B_Person
人 I_Person
， O
怀 O
念 O
追 O
思 O
的 O
日 B_Time
子 I_Time
。 O

正 O
如 O
宋 B_Time
代 I_Time
诗 B_Person
人 I_Person

2. Verwenden Sie Beispiele

1. Training

 from lightnlp.sl import NER

# 创建NER对象
ner_model = NER()

train_path = '/home/lightsmile/NLP/corpus/ner/train.sample.txt'
dev_path = '/home/lightsmile/NLP/corpus/ner/test.sample.txt'
vec_path = '/home/lightsmile/NLP/embedding/char/token_vec_300.bin'

# 只需指定训练数据路径和TensorBoard日志文件路径，预训练字向量可选，开发集路径可选，模型保存路径可选（模型保存路径默认为`xx_saves`，其中xx为模型简称，如ner）。
ner_model.train(train_path, vectors_path=vec_path, dev_path=dev_path, save_path='./ner_saves', log_dir='E:/Test/tensorboard/')

2. Test

 # 加载模型，默认当前目录下的`ner_saves`目录
ner_model.load('./ner_saves')
# 对train_path下的测试集进行读取测试
ner_model.test(train_path)

3. Vorhersage

 from pprint import pprint

pprint(ner_model.predict('另一个很酷的事情是，通过框架我们可以停止并在稍后恢复训练。'))

Vorhersageergebnisse:

 [{'end': 15, 'entity': '我们', 'start': 14, 'type': 'Person'}]

4. Überprüfen Sie den Trainingseffekt

Führen Sie den folgenden Befehl aus der Befehlszeile aus, wobei E:TesttensorBoard während des Modelltrainings als Protokollspeicherpfad geändert wird, und die Portspezifikation ist optional:

tensorboard --logdir=E: T est t ensorBoard --port=2019

Sie können ähnliche Effekte sehen:

Tensorboard

5. Bereitstellen des Dienstes

 ner_model . deploy ( host = "localhost" , port = 2020 , debug = False )

Alle Parameter sind optional. host ist standardmäßig für localhost . port -Port wird vom Programm automatisch für einen Leerlaufanschluss zum System angewendet, und debug -Modus wird standardmäßig nicht aktiviert.

Sie können Postboten verwenden oder ein Programm schreiben, um es zu testen, wie in der folgenden Abbildung gezeigt: Briefträger Jupyter-Notebook

Todo

Geschäft

Fügen Sie eine kurze Projektbeschreibung hinzu
Geben Sie für jede Aufgabe Demo -Schulungsdaten an

Projekt

Rekonstruieren Sie die Projektstruktur, verschmelzen die gleichen redundanten Stellen und halten Sie die Projektstruktur klar
Tensorboard -Visualisierungsfunktionen hinzugefügt, die hauptsächlich scalar von Verlust und Punktzahl und graph jedes Modells enthalten (derzeit gibt es einige Fehler in der Add_Graph -Funktion des Zusammenfassungswriters in Pytorch, sodass es vorerst nicht hinzugefügt werden kann.)
Die einfache Flask-basierte Modellbereitstellungsfunktion hinzugefügt (derzeit nur für das Testen von Modelltrainingseffekten verwendet)
Jetzt sind der vom Modell gespeicherte Pfad und Name standardmäßig gleich und werden in Konflikt geraten. Als nächstes hat jedes Modell seinen eigenen name .
Die Umschulungsfunktion des Haltepunkts hinzugefügt.
Fügen Sie frühzeitig hinzu.

Funktion

Belohnen

Wenn dieses Projekt für Sie hilfreich ist, geben Sie mir bitte eine Belohnung ~

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-19
Größe 538.3KB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

lightNLP

LightNLP, ein sehr grundlegender Rahmen für natürliche Sprachverarbeitung

Einführung

Stellungnahme

Installieren

Installationsabhängigkeiten

Pytorch installieren

Installieren Sie den Torchtext

Beispiel

Genannte Entitätserkennung (NER)

1. Trainingsdaten

2. Verwenden Sie Beispiele

1. Training

2. Test

3. Vorhersage

4. Überprüfen Sie den Trainingseffekt

5. Bereitstellen des Dienstes

Todo

Geschäft

Projekt

Funktion

Belohnen

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express