deep_qa Download - deep_qa Quellcode herunterladen

deep_qa

Anderer Quellcode

1.0.0

Herunterladen

VERALTET

Deepqa ist auf Keras gebaut. Wir haben beschlossen, dass Pytorch eine bessere Plattform für die NLP -Forschung ist. Wir haben DeepQA in eine Pytorch-Bibliothek namens Allennlp neu geschrieben. Es wird keine Entwicklung von DeepQA mehr geben. Aber wir freuen uns über Allennlp ziemlich aufgeregt - wenn Sie Deep Learning für die Verarbeitung natürlicher Sprache machen, sollten Sie es überprüfen!

Deepqa

DeepQA ist eine Bibliothek für hochrangige NLP-Aufgaben mit Deep Learning, das sich insbesondere auf verschiedene Arten der Beantwortung von Fragen konzentriert. DeepQA basiert auf Keras und Tensorflow und kann als Schnittstelle zu diesen Systemen betrachtet werden, die NLP erleichtert.

Insbesondere bietet diese Bibliothek die folgenden Vorteile gegenüber einfachen Keras / Tensorflow:

Es ist einfach, NLP in Deepqa direkt zu bekommen.
- In Keras gibt es viele Probleme in Bezug auf Padding-Sequenzen und Maskierung, die im Haupt-Kerascode nicht gut behandelt werden, und wir haben gut getestetes Code, der das Richtige tut, z. B. Aufmerksamkeiten über gepolsterte Sequenzen, alle Trainingsinstanzen in dieselbe Länge (möglicherweise dynamisch durch Stapel, mit verschiedenen Sendungen über die Berechnungen auf Padding-to-Kkens-Verteilungen oder Verteilungen zu minimieren.
- DeepQA bietet eine schöne, konsistente API über den Bau von NLP -Modellen. Diese API hat Funktionen in Bezug auf Verarbeitung von Dateninstanzen, Einbetten von Wörtern und/oder Zeichen, leicht verschiedene Arten von Satzcodierern und so weiter. Es erleichtert die Baumodelle für hochrangige NLP-Aufgaben.
DeepQA bietet eine saubere Schnittstelle zum Training, Validieren und Debuggen von Keras -Modellen. Es ist einfach, mit Varianten einer Modellfamilie zu experimentieren, indem einige Parameter in einer JSON -Datei geändert werden. Beispielsweise werden die Einzelheiten darüber, wie Wörter dargestellt werden, entweder mit festen Handschuhvektoren, fein abgestimmten Word2Vec-Vektoren oder einer Verkettung von Personen mit CNN auf Zeichenebene, die alle durch Parameter in einer JSON-Datei angegeben sind, nicht in Ihrem tatsächlichen Code. Dies macht es trivial, die Details Ihres Modells basierend auf den Daten zu wechseln, mit denen Sie arbeiten.
DeepQA enthält eine Reihe hochmoderner Modelle, die sich insbesondere auf Fragenbeantwortungssysteme konzentrieren (obwohl wir uns auch in Modellen für andere Aufgaben beschäftigt haben). Der tatsächliche Modellcode für diese Systeme beträgt normalerweise 50 Zeilen oder weniger.

Laufen Deepqa

Einrichtung einer Entwicklungsumgebung

DeepQA wird mit Python gebaut. Die einfachste Möglichkeit, eine kompatible Umgebung einzurichten, besteht darin, Conda zu verwenden. Dadurch wird eine virtuelle Umgebung mit der genauen Version von Python eingerichtet, die für die Entwicklung verwendet wird, zusammen mit allen Abhängigkeiten, die für die Ausführung von DeepQA erforderlich sind.

Download und installieren Sie Conda.
Erstellen Sie eine Conda -Umgebung mit Python 3.
```
 conda create -n deep_qa python=3.5
```
Aktivieren Sie nun die Conda -Umgebung.
```
 source activate deep_qa
```
Installieren Sie die erforderlichen Abhängigkeiten.
```
 ./scripts/install_requirements.sh
```
Stellen Sie die PYTHONHASHSEED für wiederholbare Experimente ein.
```
 export PYTHONHASHSEED=2157
```

Sie sollten jetzt in der Lage sein, Ihre Installation mit pytest -v zu testen. Glückwunsch! Sie haben jetzt eine Entwicklungsumgebung für Deep_QA, die TensorFlow mit CPU -Unterstützung verwendet. (Weitere Informationen zur Installation tensorflow-gpu finden Sie unter Anforderungen.

Verwenden von DeepQA als ausführbare Datei

Um ein Modell mit einem Klon des DeepQA -Repositorys zu trainieren oder zu bewerten, besteht der empfohlene Einstiegspunkt darin, das Skript run_model.py zu verwenden. Das erste Argument für dieses Skript ist eine Parameterdatei, die weiter unten beschrieben wird. Das zweite Argument bestimmt das Verhalten, entweder ein Modell oder die Bewertung eines geschulten Modells gegen einen Testdatensatz. Aktuelle gültige Optionen für das zweite Argument sind train und test (das Auslassen des Arguments entspricht dem Zug train ).

Parameterdateien geben die Modellklasse an, die Sie verwenden, Modellhyperparameter, Schulungsdetails, Datendateien, Datengeneratordetails und viele andere Dinge. Sie können Beispielparameterdateien im Beispielverzeichnis sehen. Sie können eine Vorstellung davon erhalten, welche Parameter verfügbar sind, indem Sie die Dokumentation durchsuchen.

Tatsächlich erfordert ein Modell Eingabedateien, die Sie bereitstellen müssen. Wir haben eine Begleitbibliothek, DeepQA -Experimente, die ursprünglich zum Erstellen von Eingabedateien und zum Ausführen von Experimenten entwickelt wurde und zur Generierung der erforderlichen Datendateien für die meisten Aufgaben, für die wir Modelle haben, generiert werden können. Wir bewegen uns dazu, den Datenverarbeitungscode direkt in DeepQA zu bringen, so dass DeepQA -Experimente nicht erforderlich sind, aber im Moment ist das Erhalten von Trainingsdatendateien im richtigen Format mit DeepQA -Experimenten am einfachsten.

Verwenden von DeepQA als Bibliothek

Wenn Sie DeepQA als Bibliothek in Ihrem eigenen Code verwenden, ist es immer noch einfach, Ihr Modell auszuführen. Anstatt das Skript run_model.py zu verwenden, um das Training/die Bewertung durchzuführen, können Sie es selbst wie folgt tun:

 from deep_qa import run_model, evaluate_model, load_model, score_dataset

# Train a model given a json specification
run_model("/path/to/json/parameter/file")


# Load a model given a json specification
loaded_model = load_model("/path/to/json/parameter/file")
# Do some more exciting things with your model here!


# Get predictions from a pre-trained model on some test data specified in the json parameters.
predictions = score_dataset("/path/to/json/parameter/file")
# Compute your own metrics, or do beam search, or whatever you want with the predictions here.


# Compute Keras' metrics on a test dataset, using a pre-trained model.
evaluate_model("/path/to/json/parameter/file", ["/path/to/data/file"])

Die restlichen Nutzungsrichtlinien, Beispiele usw. sind die gleichen wie bei der Arbeit in einem Klon des Repositorys.

Implementieren Sie Ihre eigenen Modelle

Um ein neues Modell in DeepQA zu implementieren, müssen Sie TextTrainer unterklassen. Es gibt Dokumentationen darüber, was dafür notwendig ist. Siehe insbesondere den Abschnitt "Abstract Methods". Ein einfaches Beispiel eines voll funktionsfähigen Modells finden Sie im einfachen Sequenz -Tagger, der etwa 20 Zeilen des tatsächlichen Implementierungscode enthält.

Um Modelle zu trainieren, zu laden und zu bewerten, die Sie selbst geschrieben haben, geben Sie einfach ein zusätzliches Argument an die oben genannten Funktionen weiter und entfernen Sie den Parameter model_class aus Ihrer JSON -Spezifikation. Zum Beispiel:

 from deep_qa import run_model
from .local_project import MyGreatModel

# Train a model given a json specification (without a "model_class" attribute).
run_model("/path/to/json/parameter/file", model_class=MyGreatModel)

Wenn Sie eine neue Aufgabe oder eine neue Variante einer Aufgabe mit einer anderen Eingabe-/Ausgangsspezifikation ausführen, müssen Sie wahrscheinlich auch einen Instance implementieren. Die Instance behandelt das Lesen von Daten aus einer Datei und konvertiert sie in Numpy -Arrays, die für das Training und die Bewertung verwendet werden können. Dies muss nur einmal für jede Eingangs-/Ausgangsspezifikation geschehen.

Implementierte Modelle

DeepQA verfügt über Implementierungen hochmoderner Methoden für eine Vielzahl von Aufgaben. Hier sind einige von ihnen:

Leseverständnis

Der aufmerksame Leser von Lehrmaschinen bis zum Lesen und Verfassen von Hermann und anderen
Leser der Gated Achtung von Gated Achtungslesern für das Textverständnis,
Bidirektionaler Aufmerksamkeitfluss aus bidirektionaler Aufmerksamkeitsfluss für das Maschinenverständnis,

Mit sich bringen

Aufmerksamkeitsstörungen, von einem dezentierbaren Aufmerksamkeitsmodell für die Inferenz für natürliche Sprache,

Datensätze

Dieser Code ermöglicht ein einfaches Experimentieren mit den folgenden Datensätzen:

AI2 Grundschulwissenschaftsfragen (keine Diagramme)
Der Facebook -Kinderbuch -Test -Datensatz
Der Facebook Babi -Datensatz
Der Newsqa -Datensatz
Die Stanford -Frage zur Beantwortung des Datensatzes (Kader)
Das WHO tat welchen Datensatz

Beachten Sie jedoch, dass der Datenverarbeitungscode für die meisten dieser derzeit in DeepQA -Experimenten lebt.

Beitragen

Wenn Sie diesen Code verwenden und der Meinung sind, dass etwas verbessert werden könnte, sind die Anfragen von Zugang sehr willkommen. Das Öffnen eines Problems ist auch in Ordnung, aber wir können viel schneller reagieren, um Anfragen zu ziehen.

Mitwirkende

Matt Gardner
Mark Neumann
Nelson Liu.
Pradeep Dassigi (der erste Autor dieser Codebasis)

Lizenz

Dieser Code wird unter den Bestimmungen der Apache 2 -Lizenz veröffentlicht.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-15
Größe 448.16KB
Kommt von Github

Ähnliche Anwendungen

Aizhi·QA IoT-unterstützende Software

2024-08-15
Vor-Ort-Smart-Management-QA-App

2023-08-07
Tiefes Feld

2023-07-07
Deep Hunter-Spiel

2023-07-03
Deep Di

2022-08-30
Tiefe Rune

2022-07-25

deep_qa

VERALTET

Deepqa

Laufen Deepqa

Einrichtung einer Entwicklungsumgebung

Verwenden von DeepQA als ausführbare Datei

Verwenden von DeepQA als Bibliothek

Implementieren Sie Ihre eigenen Modelle

Implementierte Modelle

Leseverständnis

Mit sich bringen

Datensätze

Beitragen

Mitwirkende

Lizenz

Aizhi·QA IoT-unterstützende Software

Vor-Ort-Smart-Management-QA-App

Tiefes Feld

Deep Hunter-Spiel

Deep Di

Tiefe Rune

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express