sequence labeling BiLSTM CRFダウンロード - sequence labeling BiLSTM CRFソースコードダウンロード

sequence labeling BiLSTM CRF

その他のソースコード

1.0.0

ダウンロード

シーケンシャルラベル付けタスクのbilstm+CRF

シーケンスラベルのタスク用のbilstm+CRFモデルのTensorflow実装。

プロジェクト機能

Tensorflow APIに基づいています。
高度にスケーラブル。すべてが構成可能です。
明確な構造でモジュール化されています。
初心者にとってはとてもフレンドリーです。
DIYが簡単です。

タスクとモデル

Sequential labeling 、NLPのシーケンス予測タスクをモデル化する典型的な方法論の1つです。一般的なシーケンシャルラベリングタスクには、

スピーチ（POS）タグ付け、
チャンキング、
名前付きエンティティ認識（NER） 、
句読点の修復、
文の境界検出、
スコープ検出、
中国語の単語セグメンテーション（CWG） 、
セマンティックロールラベル（SRL） 、
話し言葉の理解、
イベント抽出、
などなど...

例として指定されたエンティティ認識（NER）タスクを取得します。

Stanford University located at California .
B-ORG    I-ORG      O       O  B-LOC      O

ここでは、 Stanford UniversityとCalifornia 2つのエンティティが抽出されます。具体的には、テキスト内の各tokenには、対応するlabelがタグ付けされています。 Eg、{ token ： Stanford 、 label ： B-Org }。シーケンス標識モデルは、トークンシーケンスが与えられた場合、ラベルシーケンスを予測することを目的としています。

Lample et al。、2016によって提案されたBiLSTM+CRFは、これまでのところ、連続標識タスクの最も古典的で安定した神経モデルです。

プロジェクト

関数サポート

すべての設定の構成
- 実行モード：[ train / test / interactive_predict / api_service ]
- データセット（入力/出力）：
- ラベル付けスキーム：
  - [ BIO / BIESO ]
  - [ PER | LOC | ORG ]
  - ...
- モデル構成：
  - エンコーダー：BGU/Bi-LSTM、レイヤー、bi/uni-方向
  - デコーダー：CRF/SOFTMAX、
  - 埋め込みレベル：char/word、
  - 自己注意の有無にかかわらず
  - ハイパーパラメーター、
  - ...
- トレーニング設定：
  - 測定メトリックを購読する：[精度、リコール、F1、精度]
  - Optimazers：GD/ADAGRAD/ADADELTA/RMSPROP/ADAM
- テスト設定、
- APIサービス設定、
すべてを記録します
簡単なデモンストレーションのためのWebアプリのデモ
オブジェクト指向：bilstm_crf、データセット、コンフィガー、utils
明確な構造でモジュール化され、DIYにとって簡単です。

ハンドブックの詳細をご覧ください。

要件

Python> = 3.5
Tensorflow> = 1.8
numpy
パンダ
django == 1.11.8
ジーバ
...

設定

オプションA：

直接使用するためにリポジトリをダウンロードしてください。

 git clone https://github.com/scofield7419/sequence-labeling-BiLSTM-CRF.git
pip install -r requirements.txt

オプションB： TODO

bilstm-crfパッケージをモジュールとしてインストールします。

 pip install BiLSTM-CRF

使用法：

 from BiLSTM-CRF.engines.BiLSTM_CRFs import BiLSTM_CRFs as BC
from BiLSTM-CRF.engines.DataManager import DataManager
from BiLSTM-CRF.engines.Configer import Configer
from BiLSTM-CRF.engines.utils import get_logger

...

config_file = r'/home/projects/system.config'
configs = Configer(config_file)

logger = get_logger(configs.log_dir)
configs.show_data_summary(logger) # optional

dataManager = DataManager(configs, logger)
model = BC(configs, logger, dataManager)
        
###### mode == 'train':
model.train()

###### mode == 'test':
model.test()

###### mode == 'single predicting':
sentence_tokens, entities, entities_type, entities_index = model.predict_single(sentence)
if configs.label_level == 1:
    print("nExtracted entities:n %snn" % ("n".join(entities)))
elif configs.label_level == 2:
    print("nExtracted entities:n %snn" % ("n".join([a + "t(%s)" % b for a, b in zip(entities, entities_type)])))


###### mode == 'api service webapp':
cmd_new = r'cd demo_webapp; python manage.py runserver %s:%s' % (configs.ip, configs.port)
res = os.system(cmd_new)

open `ip:port` in your browser.

モジュール構造


├── main.py
├── system.config
├── HandBook.md
├── README.md
│
├── checkpoints
│   ├── BILSTM-CRFs-datasets1
│   │   ├── checkpoint
│   │   └── ...
│   └── ...
├── data
│   ├── example_datasets1
│   │   ├── logs
│   │   ├── vocabs
│   │   ├── test.csv
│   │   ├── train.csv
│   │   └── dev.csv
│   └── ...
├── demo_webapp
│   ├── demo_webapp
│   ├── interface
│   └── manage.py
├── engines
│   ├── BiLSTM_CRFs.py
│   ├── Configer.py
│   ├── DataManager.py
│   └── utils.py
└── tools
    ├── calcu_measure_testout.py
    └── statis.py

折りたたみ
- enginesでは、コア機能を提供します。
- data-subfoldフォールドでは、データセットが配置されます。
- checkpoints-subfold式では、モデルチェックポイントが保存されます。
- demo_webapp foldでは、Webでシステムを実証し、APIを提供できます。
- toolsで折りたたみ、いくつかのオフラインのユーティルを提供します。
ファイル
- main.pyは、システムのエントリPythonファイルです。
- system.configは、すべてのシステム設定の構成ファイルです。
- HandBook.mdいくつかの使用手順を提供します。
- BiLSTM_CRFs.pyがメインモデルです。
- Configer.py system.configを解析します。
- DataManager.py 、データセットとスケジューリングを管理します。
- utils.pyフライツールを提供します。

クイックスタート

以下の手順：

ステップ1。system.config `system.config`構成ファイルを作成します。

データセット（入力/出力）を構成します。
ラベリングスキームを構成します。
モデルアーキテクチャを構成します。
デモをデモするときにWebApp設定を構成します。

System.Config

ステップ2。トレーニングの開始（必要かつ強制的）

実行モードを構成します。
トレーニング設定を構成します。
main.pyを実行します。

トレーニング

ステップ3。テストを開始する（オプション）

実行モードを構成します。
テスト設定を構成します。
main.pyを実行します。

ステップ4。インタラクティブな予測を開始する（オプション）

実行モードを構成します。
main.pyを実行します。
インタラクティブな入力文。

インタラクティブな予測

ステップ5。APIサービスとWebアプリの開始（オプション）

実行モードを構成します。
API_Service設定を構成します。
main.pyを実行します。
ブラウザでインタラクティブな予測を行います。

Web App1

Web App2

データセット

入力

全体的な使用には、Trainset、Testset、Devsetを含むデータセットが必要です。ただし、モデルをオフラインで使用するだけで、トレインセットのみが必要です。トレーニング後、保存されたモデルチェックポイントファイルに推論を行うことができます。あなたがテストしたいなら、あなたはすべきです

trainset 、 testset 、 devset 、共通形式は次のとおりです。

単語レベル：

 (Token)         (Label)

for             O
the             O
lattice         B_TAS
QCD             I_TAS
computation     I_TAS
of              I_TAS
nucleon–nucleon I_TAS
low-energy      I_TAS
interactions    E_TAS
.               O

It              O
consists        O
in              O
simulating      B_PRO
...

charレベル：

 (Token) (Label)

马 B-LOC
来 I-LOC
西 I-LOC
亚 I-LOC
副 O
总 O
理 O
。 O

他 O
兼 O
任 O
财 B-ORG
政 I-ORG
部 I-ORG
长 O
...

ご了承ください：

testset 、 Token行でのみ存在します。
トークンの各文は、空白行でセグメント化されています。
詳細なフォーメーションについては、例のデータセットに移動します。

出力（テストフェーズ中）

テスト中、モデルはtest.csvに基づいて予測されるエンティティを出力します。出力ファイルには、 test.out 、 test.entity.out （オプション）の2つが含まれます。

test.out
入力test.csvと同じ形成。
test.entity.out

 Sentence
entity1 (Type)
entity2 (Type)
entity3 (Type)
...

test.entity.out

DIY

このプロジェクトを独自の特定のシーケンスラベル付けタスクに適応させたい場合は、次のヒントが必要になる場合があります。

レポソースをダウンロードします。
ラベル付けスキーム（最も重要）
- label_scheme：bio/bieso
- label_level：接尾辞で/なし
- プレフィックスと接尾辞を接続するためのハイフン： B_PER', i_loc'
- 接尾辞= [nr、ns、nt]
- labeling_level：word/char
モデル： BiLSTM_CRFs.pyで、モデルアーキテクチャを必要なものに変更します。
データセット：正しいフォーメーションでデータセットに適応します。
トレーニング
- すべてのディレクトリを指定します。
- トレーニングハイパーパラメーター。

その他

より多くのユーザーの詳細については、ハンドブックを参照してください

何か間違ったことを発行することを歓迎しています。

更新...

2019-Jun-04、VEXバージョン、v1.0、サポート構成、スケーラブル。
2018-Nov-05、サポートチャーとワードレベルの埋め込み。
2017-DEC-06、initバージョン、v0.1。

ライセンス

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-17
サイズ 73.89MB
から Github

sequence labeling BiLSTM CRF

シーケンシャルラベル付けタスクのbilstm+CRF

プロジェクト機能

タスクとモデル

プロジェクト

関数サポート

要件

設定

オプションA：

オプションB： TODO

モジュール構造

クイックスタート

ステップ1。system.config `system.config`構成ファイルを作成します。

ステップ2。トレーニングの開始（必要かつ強制的）

ステップ3。テストを開始する（オプション）

ステップ4。インタラクティブな予測を開始する（オプション）

ステップ5。APIサービスとWebアプリの開始（オプション）

データセット

入力

出力（テストフェーズ中）

DIY

その他

更新...

ライセンス

NCBI gene sequence Downloader

シーケンス v1.0

GitHub sgrebnov/cordova plugin background download

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

sequence labeling BiLSTM CRF

シーケンシャルラベル付けタスクのbilstm+CRF

プロジェクト機能

タスクとモデル

プロジェクト

関数サポート

要件

設定

オプションA：

オプションB： TODO

モジュール構造

クイックスタート

ステップ1。system.config system.config構成ファイルを作成します。

ステップ2。トレーニングの開始（必要かつ強制的）

ステップ3。テストを開始する（オプション）

ステップ4。インタラクティブな予測を開始する（オプション）

ステップ5。APIサービスとWebアプリの開始（オプション）

データセット

入力

出力（テストフェーズ中）

DIY

その他

更新...

ライセンス

ステップ1。system.config `system.config`構成ファイルを作成します。