PyTorch NLPダウンロードPyTorch NLPソースコードのダウンロード

PyTorch NLP

その他のソースコード

Python 3.5 Support, Sampler Pipelining,

ダウンロード

？今アーカイブ？

Pytorchツールチェーンが成熟していると、このようなリポジトリをアーカイブする時が来ました。このツールキットのすべての部分に対してより開発されたオプションを見つけることができます：

フェイスデータセット（データセット）を抱き締める
フェイストークナー（エンコーダー）を抱き締める
顔の指標を抱き締める（メトリック）
Pytorch Datapipes（ダウンロード＆サンプラー）
抱きしめる顔の埋め込み（単語ベクトル）
pytorch nn（nn）
Pytorch TorchText（オールインワン）

ハッピー開発！

誰かがこのリポジトリを除外して開発を続けたい場合は、私に連絡してください。「Petrochukm [at] gmail.com」で私に連絡できます。

Pytorch Natural Language Processing（NLP）の基本ユーティリティ

pytorch-nlp、または略してtorchnlp 、pytorch nlpの基本ユーティリティのライブラリです。 torchnlp Pytorchを拡張して、基本的なテキストデータ処理機能を提供します。

Chloe Yeoのロゴ、Wellsaid Labsによるコーポレートスポンサーシップ

インストール？

Python 3.6+およびPytorch 1.0+があることを確認してください。その後、PIPを使用してpytorch-nlpをインストールできます。

 pip install pytorch - nlp

または以下を介して最新のコードをインストールするには

 pip install git + https : // github . com / PetrochukM / PyTorch - NLP . git

ドキュメント

Pytorch-NLPの完全なドキュメントは、ReadTheDocs Webサイトから入手できます。

始めましょう

NLPデータパイプライン内で、これらの基本的な手順を実装する必要があります。

1。データをロードしますか？

たとえば、IMDBデータセットをロードします。

 from torchnlp . datasets import imdb_dataset

# Load the imdb training dataset
train = imdb_dataset ( train = True )
train [ 0 ]  # RETURNS: {'text': 'For a movie that gets..', 'sentiment': 'pos'}

たとえば、カスタムデータセットをロードします。

 from pathlib import Path

from torchnlp . download import download_file_maybe_extract

directory_path = Path ( 'data/' )
train_file_path = Path ( 'trees/train.txt' )

download_file_maybe_extract (
    url = 'http://nlp.stanford.edu/sentiment/trainDevTestTrees_PTB.zip' ,
    directory = directory_path ,
    check_files = [ train_file_path ])

open ( directory_path / train_file_path )

あなたのためにキャッシュを処理することを心配しないでください！

2。テキストからテンソル

テキストをテンソルとしてトークン化してエンコードします。

たとえば、 WhitespaceEncoderは、Whitespace文字に遭遇するたびにテキストをトークンに分割します。

 from torchnlp . encoders . text import WhitespaceEncoder

loaded_data = [ "now this ain't funny" , "so don't you dare laugh" ]
encoder = WhitespaceEncoder ( loaded_data )
encoded_data = [ encoder . encode ( example ) for example in loaded_data ]

3。バッチへのテンソル

ロードされたデータとエンコードされたデータを手にすると、データセットをバッチする必要があります。

 import torch
from torchnlp . samplers import BucketBatchSampler
from torchnlp . utils import collate_tensors
from torchnlp . encoders . text import stack_and_pad_tensors

encoded_data = [ torch . randn ( 2 ), torch . randn ( 3 ), torch . randn ( 4 ), torch . randn ( 5 )]

train_sampler = torch . utils . data . sampler . SequentialSampler ( encoded_data )
train_batch_sampler = BucketBatchSampler (
    train_sampler , batch_size = 2 , drop_last = False , sort_key = lambda i : encoded_data [ i ]. shape [ 0 ])

batches = [[ encoded_data [ i ] for i in batch ] for batch in train_batch_sampler ]
batches = [ collate_tensors ( batch , stack_tensors = stack_and_pad_tensors ) for batch in batches ]

Pytorch-NLPは、Pytorchの既存のtorch.utils.data.sampler 、 torch.stack 、およびdefault_collateの上に構築され、さまざまな長さのシーケンシャル入力をサポートします。

4。トレーニングと推論

バッチを手にすると、Pytorchを使用して勾配降下を使用してモデルを開発およびトレーニングできます。たとえば、スタンフォードの自然言語推論（SNLI）コーパスに関するトレーニングについては、この例コードをご覧ください。

最後になりましたが、重要なことです

Pytorch-NLPには、あなたをサポートするためにさらにいくつかのNLPフォーカスユーティリティパッケージがあります！？

決定論的機能

パイプラインをセットアップすると、一部の機能が決定論的に実行されるようにすることができます。ランダムなコードをfork_rngで包みます。

 import random
import numpy
import torch

from torchnlp . random import fork_rng

with fork_rng ( seed = 123 ):  # Ensure determinism
    print ( 'Random:' , random . randint ( 1 , 2 ** 31 ))
    print ( 'Numpy:' , numpy . random . randint ( 1 , 2 ** 31 ))
    print ( 'Torch:' , int ( torch . randint ( 1 , 2 ** 31 , ( 1 ,))))

これは常に印刷されます：

 Random: 224899943
Numpy: 843828735
Torch: 843828736

事前に訓練された単語ベクトル

語彙を計算したので、事前に訓練された単語ベクトルを使用して、埋め込みを設定することをお勧めします。

 import torch
from torchnlp . encoders . text import WhitespaceEncoder
from torchnlp . word_to_vector import GloVe

encoder = WhitespaceEncoder ([ "now this ain't funny" , "so don't you dare laugh" ])

vocab_set = set ( encoder . vocab )
pretrained_embedding = GloVe ( name = '6B' , dim = 100 , is_include = lambda w : w in vocab_set )
embedding_weights = torch . Tensor ( encoder . vocab_size , pretrained_embedding . dim )
for i , token in enumerate ( encoder . vocab ):
    embedding_weights [ i ] = pretrained_embedding [ token ]

ニューラルネットワークレイヤー

たとえば、ニューラルネットワークパッケージから、最先端のLockedDropout適用します。

 import torch
from torchnlp . nn import LockedDropout

input_ = torch . randn ( 6 , 3 , 10 )
dropout = LockedDropout ( 0.5 )

# Apply a LockedDropout to `input_`
dropout ( input_ ) # RETURNS: torch.FloatTensor (6x3x10)

メトリック

BLEUスコアなどの一般的なNLPメトリックを計算します。

 from torchnlp . metrics import get_moses_multi_bleu

hypotheses = [ "The brown fox jumps over the dog 笑" ]
references = [ "The quick brown fox jumps over the lazy dog 笑" ]

# Compute BLEU score with the official BLEU perl script
get_moses_multi_bleu ( hypotheses , references , lowercase = True )  # RETURNS: 47.9

ヘルプ❓

より長い例を見ると、 examples/であなたが役立つかもしれません。

もっと助けが必要ですか？ Gitterチャットを介してあなたの質問に喜んでお答えします

貢献

Pytorch-NLPをリリースしました。これは、PytorchでNLPの基本的なツールキットが不足していることを発見したためです。他の組織がプロジェクトの恩恵を受けることができることを願っています。コミュニティからの貢献に感謝しています。

寄稿ガイド

貢献ガイドを読んで、開発プロセス、バグフィックスと改善を提案する方法、Pytorch-NLPへの変更を構築およびテストする方法について学びます。

著者

Michael Petrochuk - 開発者
Chloe Yeo - ロゴデザイン

引用

Pytorch-NLPがアカデミック出版物に役立つと思う場合は、次のBibtexを使用して引用してください。

 @misc{pytorch-nlp,
  author = {Petrochuk, Michael},
  title = {PyTorch-NLP: Rapid Prototyping with PyTorch Natural Language Processing (NLP) Tools},
  year = {2018},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/PetrochukM/PyTorch-NLP}},
}

拡大する

追加情報

バージョン Python 3.5 Support, Sampler Pipelining,
タイプその他のソースコード
更新時間 2025-04-18
サイズ 980.17KB
から Github

PyTorch NLP

？今アーカイブ？

Pytorch Natural Language Processing（NLP）の基本ユーティリティ

インストール？

ドキュメント

始めましょう

1。データをロードしますか？

2。テキストからテンソル

3。バッチへのテンソル

4。トレーニングと推論

最後になりましたが、重要なことです

決定論的機能

事前に訓練された単語ベクトル

ニューラルネットワークレイヤー

メトリック

ヘルプ❓

貢献

寄稿ガイド

関連作業

TorchText

allennlp

著者

引用

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

pytorch image models

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express