deep_qaダウンロードdeep_qaソースコードのダウンロード

deep_qa

その他のソースコード

1.0.0

ダウンロード

非推奨

DeepqaはKerasの上に建てられています。 PytorchはNLP研究のより良いプラットフォームであると判断しました。 deepqaをAllennlpと呼ばれるPytorchライブラリに書き直しました。 Deepqaの開発はこれ以上ありません。しかし、私たちはAllennlpについて非常に興奮しています - あなたが自然言語加工のために深い学習をしているなら、あなたはそれをチェックするべきです！

deepqa

DeepQAは、特にさまざまな種類の質問応答に焦点を当てた、深い学習を備えた高レベルのNLPタスクを実行するためのライブラリです。 DeepqaはKerasとTensorflowの上に構築されており、NLPを容易にするこれらのシステムのインターフェースと考えることができます。

具体的には、このライブラリは、プレーンケラス /テンソルフローよりも次の利点を提供します。

DeepqaでNLPを正しく取得するのは簡単です。
- Kerasでは、メインのKerasコードではうまく処理されていないパディングシーケンスとマスキングに関する多くの問題があります。たとえば、パッド入りシーケンスに対するコンピューティングの注意を払って、すべてのトレーニングインスタンスを同じ長さ（おそらくバッチで動的に、電車に渡って散布するか、または単語を配布する）または単語のパディングを最小限に抑えます。
- DeepQAは、NLPモデルの構築に関する優れた一貫したAPIを提供します。このAPIには、データインスタンスの処理、単語や文字の埋め込み、さまざまな種類の文エンコーダーを簡単に取得するなど、機能があります。高レベルのNLPタスクの構築モデルを簡単にします。
DeepQAは、Kerasモデルのトレーニング、検証、およびデバッグにクリーンなインターフェイスを提供します。 JSONファイルのパラメーターを変更するだけで、モデルファミリのバリエーションを簡単に実験することができます。たとえば、固定グローブベクトル、微調整されたWord2Vecベクトル、または文字レベルのCNNを持つものの連結のいずれかを使用した単語の表現方法の詳細は、すべて実際のコードではなく、JSONファイルのパラメーターによって指定されます。これにより、作業中のデータに基づいてモデルの詳細を切り替えることが些細なことになります。
DeepQAには、特に質問回答システムに焦点を当てた多くの最先端モデルが含まれています（ただし、他のタスクのモデルも手を出しています）。これらのシステムの実際のモデルコードは、通常50行以下です。

deepqaを実行します

開発環境のセットアップ

DeepQAはPython 3を使用して構築されています。互換性のある環境をセットアップする最も簡単な方法は、Condaを使用することです。これにより、DeepQAを実行するために必要なすべての依存関係とともに、開発に使用されるPythonの正確なバージョンを使用して仮想環境を設定します。

Condaをダウンロードしてインストールします。
Python 3を使用してConda環境を作成します。
```
 conda create -n deep_qa python=3.5
```
コンドラ環境をアクティブにします。
```
 source activate deep_qa
```
必要な依存関係をインストールします。
```
 ./scripts/install_requirements.sh
```
繰り返し可能な実験のためにPYTHONHASHSEED設定します。
```
 export PYTHONHASHSEED=2157
```

これで、 pytest -vでインストールをテストできるようになりました。おめでとう！これで、CPUサポートを使用してTensorflowを使用するDeep_QAの開発環境ができました。（GPUサポートについては、 tensorflow-gpuのインストール方法については、要件を参照してください）。

deepqaを実行可能ファイルとして使用します

DeepQAリポジトリのクローンを使用してモデルをトレーニングまたは評価するには、推奨されるエントリポイントはrun_model.pyスクリプトを使用することです。そのスクリプトの最初の引数は、以下で詳しく説明するパラメーターファイルです。 2番目の引数は、モデルをトレーニングするか、テストデータセットに対して訓練されたモデルを評価する動作を決定します。 2番目の引数の現在の有効なオプションは、 trainとtestです（引数を省略することは、 trainを通過するのと同じです）。

パラメーターファイル使用しているモデルクラス、モデルハイパーパラメーター、トレーニングの詳細、データファイル、データジェネレーターの詳細などを指定します。例ディレクトリにパラメーターファイルの例を見ることができます。ドキュメントを調べることで、どのパラメーターが利用できるかについての概念を取得できます。

実際にモデルをトレーニングするには、入力ファイルが必要になるため、提供する必要があります。コンパニオンライブラリ、DeepQA実験があります。これは、元々入力ファイルを生成して実験を実行するように設計されており、モデルのほとんどのタスクに必要なデータファイルを生成するために使用できます。データ処理コードをDeepQAに直接配置することを目指しているため、DeepQA実験は必要ありませんが、今のところ、DeepQA実験では適切な形式のトレーニングデータファイルを最も簡単に実行できます。

deepqaをライブラリとして使用します

DeepQAを独自のコードでライブラリとして使用している場合、モデルを実行するのはまだ簡単です。 run_model.pyスクリプトを使用してトレーニング/評価を行う代わりに、次のように自分で実行できます。

 from deep_qa import run_model, evaluate_model, load_model, score_dataset

# Train a model given a json specification
run_model("/path/to/json/parameter/file")


# Load a model given a json specification
loaded_model = load_model("/path/to/json/parameter/file")
# Do some more exciting things with your model here!


# Get predictions from a pre-trained model on some test data specified in the json parameters.
predictions = score_dataset("/path/to/json/parameter/file")
# Compute your own metrics, or do beam search, or whatever you want with the predictions here.


# Compute Keras' metrics on a test dataset, using a pre-trained model.
evaluate_model("/path/to/json/parameter/file", ["/path/to/data/file"])

残りの使用ガイドライン、例などは、リポジトリのクローンで作業する場合と同じです。

独自のモデルを実装します

DeepQAに新しいモデルを実装するには、 TextTrainerサブクラス化する必要があります。これに必要なものに関するドキュメントがあります。特に、抽象的なメソッドセクションを参照してください。完全に機能するモデルの簡単な例については、実際の実装コードの約20行があるシンプルなシーケンスタガーを参照してください。

自分で書いたモデルをトレーニング、ロード、評価するために、上記の関数に追加の引数を渡し、JSON仕様からmodel_classパラメーターを削除するだけです。例えば：

 from deep_qa import run_model
from .local_project import MyGreatModel

# Train a model given a json specification (without a "model_class" attribute).
run_model("/path/to/json/parameter/file", model_class=MyGreatModel)

新しいタスク、または異なる入出力/出力仕様を備えたタスクの新しいバリアントを行っている場合は、おそらくInstanceタイプを実装する必要があります。このInstance 、ファイルからデータの読み取りを処理し、トレーニングと評価に使用できるnumpy配列に変換します。これは、各入力/出力仕様に対して1回だけ発生する必要があります。

実装されたモデル

DeepQAには、さまざまなタスクの最先端の方法の実装があります。ここにそれらのいくつかがあります：

読解

ティーチングマシンから読み、理解するまで、ヘルマンやその他の丁寧な読者
テキスト理解のためにゲートテンテートリーダーのゲート注意リーダー、
機械理解のための双方向の注意の流れからの双方向の注意の流れ、

含む

自然言語推論のための分解可能な注意モデルからの分解可能な注意、

データセット

このコードにより、次のデータセットで簡単に実験できます。

AI2小学校の科学の質問（図なし）
Facebook Children's Book Test Dataset
Facebook Babiデータセット
NewsQAデータセット
スタンフォードの質問データセットの回答（分隊）
誰が何をしたか

ただし、このほとんどのデータ処理コードは現在、DeepQA実験に存在していることに注意してください。

貢献

このコードを使用して、何かが改善される可能性があると思う場合、プルリクエストは大歓迎です。問題を開くことも問題ありませんが、リクエストをプルするためにはるかに迅速に対応できます。

貢献者

マット・ガードナー
マーク・ノイマン
ネルソン・リュー。
Pradeep dasigi（このコードベースの最初の著者）

ライセンス

このコードは、Apache 2ライセンスの条件の下でリリースされます。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-15
サイズ 448.16KB
から Github

deep_qa

非推奨

deepqa

deepqaを実行します

開発環境のセットアップ

deepqaを実行可能ファイルとして使用します

deepqaをライブラリとして使用します

独自のモデルを実装します

実装されたモデル

読解

含む

データセット

貢献

貢献者

ライセンス

Aizhi・QA IoT支援ソフトウェア

現場スマート管理QAアプリ

ディープフィールド

ディープハンターゲーム

ディープディ

ディープルーン

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express