tf transformersダウンロード-TF tf transformersソースコードのダウンロード

tf transformers

AI ソースコード

1.0.0

ダウンロード

Tensorflowトランス

ウェブサイト：https：//legacyai.github.io/tf-transformers

TFトランスフォーマー：Tensorflow 2.0のより速く、より簡単な最先端の変圧器

自動回帰の生成が90倍高速であると想像してください。 TF-Transformers（Tensorflow Transformers）は、トランスベースのアーキテクチャ専用に設計されたTensorflow 2の全力を活用するように設計されています。

これらのモデルは、次のように適用できます。

テキスト、テキスト分類、情報抽出、質問応答、要約、翻訳、テキスト生成などのタスクの100を超える言語。
イメージ、画像分類、オブジェクトの検出、セグメンテーションなどのタスク用。
音声認識やオーディオ分類などのタスク用。（近日公開）

ユニークな機能

より速いオートレグレッシブデコード
tfliteサポート
Trecordsを作成するのは簡単です。
Auto-Batching TF.Data.DatasetまたはTF.Ragged Tensor
すべてが辞書です（入力と出力）
因果関係、ユーザー定義、プレフィックスなどの複数のマスクモード。
Tensorflow-Textトークネイザーのサポート
WANDBを備えたGPU、TPU、マルチGPUトレーナー、複数のコールバック、オートテンソルボードをサポート

GPT2テキスト生成のベンチマーク

gpt2テキスト生成max_length=64 、 num_beams=3 。

 tf_transformers : 31 minutes
huggingface_tf  : 83 minutes
huggingface_pt  : 36 minutes
huggingface_jax : 35 minutes

83 minutes 31 minutesまでは、かなりの高速化です。 92 %スピードアップ。平均して、 TFトランスフォーワーは、 Tensorflowの実装をハグするよりも80〜90％のスピードアップであり、ほとんどの場合、 Pytorchと同等または高速です。

より多くのベンチマークがベンチマークにあります

インストール

ピップ付き

このリポジトリは、Python 3.7+およびTensorflow 2.7でテストされています。

推奨前提条件

pip install sentencepiece
pip install tensorflow-text > = 2.7.3
pip install tqdm

マシンに従って、 tensorflow >= 2.7.0 [CPU or GPU]をインストールします。仮想環境にTFトランスフォーマーをインストールする必要があります。 Python仮想環境に不慣れな場合は、ユーザーガイドをご覧ください。

まず、使用するPythonのバージョンを使用して仮想環境を作成してアクティブにします。

次に、Tensorflowの少なくとも1つをインストールする必要があります。プラットフォームの特定のインストールコマンドに関するTensorflowインストールページ、インストールページを参照してください。 [tensorflow-text]（https://www.tensorflow.org/text）をインストールすることを強くお勧めします。

これらのバックエンドのいずれかがインストールされている場合、TFトランスフォーラーは次のようにPIPを使用してインストールできます。

pip install tf-transformers

ソースから

git clone https://github.com/legacyai/tf-transformers.git
pip install poetry
cd tf-transformers
poetry install

クイックツアー

TF-Transformers APIは非常にシンプルで最小限です。

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_checkpoint ( "/tmp/gpt2_model/" ) # Save Model

テキストジェネレーションの場合、add：obj： use_auto_regressive=True追加することが非常に重要です。これはすべてのモデルに必要です。

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' , use_auto_regressive = True )

保存とロードモデルをシリアル化する

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_transformers_serialized ( "/tmp/gpt2_serialized/" )

# To load a serialized models for inference in prodcution:

> >> import tensorflow as tf
> >> loaded = tf . saved_model . load ( "/tmp/gpt2_serialized/" )
> >> model  = loaded . signatures [ 'serving_default' ]

モデル入力と出力

TFトランスフォーマーでは、主にKerasのFunctional APIに従いました。 tf-transformersのすべてのモデルは接続されており、常に次の機能があります。

モデル入力

tf.keras.Modelまたはtf_transformers.core.LegacyModelの場合、使用： print(model.input) 。

tf.keras.Layerまたはtf_transformers.core.LegacyLayerの場合、使用： print(model.model_inputs) 。

モデル出力

tf.keras.Modelまたはtf_transformers.core.LegacyModelの場合、使用： print(model.output) 。

tf.keras.Layerまたはtf_transformers.core.LegacyLayerの場合、使用： print(model.model_outputs) 。

チュートリアル

トレーニング前、微調整、クラスフィケーション、QA、NERをカバーするチュートリアルについて説明しました。

TFTを使用してTrecordsを読み書きします
アルバートを使用したテキスト分類
TPUのダイナミックMLM（TF-Textを使用したフライ前処理）
画像分類vitマルチGPUミラー
roberta + zeroshot sts-bにquoaraを使用して、列車をゼロから埋め込む文
クリップを使用したプロンプトエンジニアリング
世代としての質問 - GPT2を使用した分隊V1
T5を使用して、コードへのコード翻訳（Codexglue -javaからc＃）

モデルの使用

GPT2を使用したテキスト生成
T5を使用したテキスト生成
文の変圧器

Tfliteチュートリアル

アルバート・トフライト
Bert Tflite
ロベルタ・トフライト

なぜTFトランスフォーマーを使用する必要があるのですか？

10行未満のコードで、生産に最先端のモデルを使用します。
- 高性能モデル、すべての公式のTensorflowベースのモデルよりも優れています
- すべてのダウンストリームタスクの非常にシンプルなクラス
- すべてのタスクの完全なtfliteサポート。
明確なチュートリアルを使用して、学生やコミュニティにアバリブルな業界ベースの経験をする
驚くべきtf.keras.Model.fitでGPU 、マルチGPU 、 TPUでモデルをトレーニングします
- 最先端のモデルを少数のコードで訓練します。
- すべてのモデルは完全にシリアル化可能です。
コードの変更を最小限に抑えても、モデルやパイプラインをカスタマイズします。

研究

この研究セクションには、** MLM、T5、クリップなどの範囲のさまざまなモデルを事前にトレーニングするコードがあります。これらのすべてのスクリプトは、Tensorflow-Ioパイプラインの全力を活用し、TPU V2およびTPU V3でテストするように設計されています。それらにはバグが予想されますが、それは練習者が私たちがすでに行ったことを開始または変更する目的として機能します。

貢献

接着剤のジョイントアルバート（史上最小で最高の変圧器ベースのモデル）。

Albert Baseモデルの力を絞るための実験はほとんどありませんでした（概念は任意のモデルに適用できます。TF変換器では、箱から出しています。）

このアイデアは、モデルの各レイヤーで指定されたタスクの損失を最小限に抑え、各レイヤーで予測を確認することです。実験によると、最高の小さなモデル（ Albertのおかげ）を取得することができ、レイヤー4以降、接着剤ベンチマークのすべての小さなモデルを打ちました。レイヤー6では、接着剤スコアが81.0を獲得しました。これは、 Distillbertの4ポイント先で、Glueスコアは77 、 MobileBert Glueスコアは78です。

Albertモデルには1400万のパラメーターがあり、レイヤー6を使用することにより、コンピューティングを50％スピードアップすることができました。

この概念は、すべてのモデルとタスクに適用できます。

コード +続きを読む

ロングブロックシーケンストランス

入力シーケンスをブロックの注意に分割し、FFNレイヤーを使用してマージすることにより、単一のV100 GPUマシンで最大4096トークンまでのシーケンス処理を実行できることが示されました。このモデルは60 millionパラメーターであるにもかかわらず、 PubMed SummarisationでPegasus Base (128 million)よりも優れています。

コード +続きを読む

サポートされているモデルアーキテクチャ

TFトランスフォーマーは現在、次のアーキテクチャを提供しています。

アルバート（Google ResearchおよびThe Toyota Technological Institute of Chicagoから）は、Zhenzhong Lan、Mingda Chen、Sebastian Goodman、Kevin Gimpel、Piyush Sharma、Radu SorkutによるPaper Albert：Lite Bertの言語表現の学習のためのライトバートをリリースしました。
Bert （Googleから）Paper Bert：Jacob Devlin、Ming-Wei Chang、Kenton Lee、Kristina Toutanovaによる言語理解のための深い双方向変圧器の事前訓練。
Sascha Rothe、Shashi Narayan、Aliaksei Severynによるシーケンス生成タスクの事前訓練を受けたチェックポイントを活用して、シーケンス生成のBert （Googleから）がリリースされました。
Electra （Google Research/Stanford Universityから）は、Paper Electra：Kevin Clark、Minh-Thang Luong、Quoc V. Le、Christopher D. Manningによる発電機ではなく、識別者としての訓練前のテキストエンコーダをリリースしました。
Paper LanguageモデルでリリースされたGPT-2 （Openaiから）は、Alec Radford*、Jeffrey Wu*、Rewon Child、David Luan、Dario Amodei **、Ilya Sutskever **による監視されていないマルチタスク学習者です。
MT5 （Google AIから）Paper MT5：Linting Xue、Noah Constant、Adam Roberts、Mihir Kale、Rami Al-Rfou、Aditya Siddhant、Aditya Barua、Colin Raffelによる大規模な多言語のテキストからテキストからテキストへの変圧器。
Roberta （Facebookから）は、Yinhan Liu、Myle Ott、Naman Goyal、Jingfei Du、Mandar Joshi、Danqi Chen、Omer Levy、Mike Lewis、Luke Zettlemoyer、Veselin Stoyanovによる、Yinhan Liu、Myle Ott、Naman Goyal、Jingfei Du、Mandar Joshi、Luke Zettlemoyer、Veselin Stoyanovによる堅牢な最適化されたBert Pretrainingアプローチを紙でリリースしました。
T5 （Google AIから）は、Colin Raffel、Noam Shazeer、Adam Roberts、Katherine Lee、Sharan Narang、Michael Matena、Yanqi Zhou and Yanqi Zhou and Wei LiとPeter J. Liuによる統一されたテキストからテキスト変圧器による転送学習の限界を調査してリリースされました。
Vision Transfransfransfransfransformer （Google AIから）紙でリリースされた画像は16x16語の価値があります：Alexey Dosovitskiy、Lucas Beyer、Lucas Beyer、Alexander Kolesnikov、Dirk Weissenborn、Xiaohua Zhai、Thomas Untherthiner、Mostafa Dehghani、Matthias Minderer、Gealterer、Matthias Minderer、omas unthinerヤコブ・ウスコレイト、ニール・フールズビー。 10 Clip （Openaiから）は、Alec Radford、Jong Wook Kim、Chris Hallacy、Aditya Ramesh、Gabriel Goh、Gabriel Goh、Girish Sastry、Amanda Askell、Pamela Mishkin、Jack Clark、Grethen Krueger、Ilya Sutskever。

引用

これで、TF-Transformersライブラリの引用ができるページがあります。

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-09-08
サイズ 16.16MB
から Github

tf transformers

Tensorflowトランス

ウェブサイト：https：//legacyai.github.io/tf-transformers

TFトランスフォーマー：Tensorflow 2.0のより速く、より簡単な最先端の変圧器

ユニークな機能

GPT2テキスト生成のベンチマーク

インストール

ピップ付き

推奨前提条件

ソースから

クイックツアー

モデル入力と出力

モデル入力

モデル出力

チュートリアル

モデルの使用

Tfliteチュートリアル

なぜTFトランスフォーマーを使用する必要があるのですか？

研究

貢献

接着剤のジョイントアルバート（史上最小で最高の変圧器ベースのモデル）。

ロングブロックシーケンストランス

サポートされているモデルアーキテクチャ

引用

TF ファイアフレンジー Android 版

Apple ios 署名 MDM 署名 TF 署名 Apple エンタープライズ署名ソースコード

Apple iOS署名 MDM署名 TF署名署名、Appleエンタープライズ署名ソースコード

トランスフォーマー: ウォー・フォー・サイバトロン

トランスフォーマー：デ

トランスフォーマーライズオブザダークスパーク

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express

tf transformers

Tensorflowトランス

ウェブサイト：https：//legacyai.github.io/tf-transformers

TFトランスフォーマー：Tensorflow 2.0のより速く、より簡単な最先端の変圧器

ユニークな機能

GPT2テキスト生成のベンチマーク

インストール

ピップ付き

推奨前提条件

ソースから

クイックツアー

モデル入力と出力

モデル入力

モデル出力

チュートリアル

モデルの使用

Tfliteチュートリアル

なぜTFトランスフォーマーを使用する必要があるのですか？

研究

貢献

接着剤のジョイントアルバート（史上最小で最高の変圧器ベースのモデル） 。

ロングブロックシーケンストランス

サポートされているモデルアーキテクチャ

引用

接着剤のジョイントアルバート（史上最小で最高の変圧器ベースのモデル）。