curated transformers
v2.0.1:

最先端の変圧器、レンガによるレンガ
キュレーションされた変圧器は、Pytorchのトランスライブラリです。再利用可能なコンポーネントのセットから構成される最先端のモデルを提供します。キュレーションされた変圧器の傑出した機能は次のとおりです。
bitsandbytesライブラリを介した4/8ビットの推論をサポートし、各モデルはPytorch metaデバイスを使用して、不必要な割り当てと初期化を回避できます。キュレーションされた変圧器は爆発によって生産テストされており、Spacy 3.7のデフォルトの変圧器の実装として使用されます。
サポートされているエンコーダーのみモデル:
サポートされているデコーダーのみのモデル:
ジェネレーターラッパー:
あらゆる種類のモデルは、Huggingfaceハブからロードできます。
キュレーションされた変圧器のスペイシー統合はspacy-curated-transformersパッケージによって提供されます。
pip install curated-transformersPytorchのデフォルトのLinuxビルドは、CUDA 11.7サポートで構築されています。次の場合には、CUDAビルドを明示的にインストールする必要があります。
どちらの場合も、Pytorchを次のようにインストールできます。
pip install torch --index-url https://download.pytorch.org/whl/cu118>>> import torch
>>> from curated_transformers.generation import AutoGenerator, GreedyGeneratorConfig
>>> generator = AutoGenerator.from_hf_hub( name = " tiiuae/falcon-7b-instruct " , device = torch.device( " cuda " ))
>>> generator([ " What is Python in one sentence? " , " What is Rust in one sentence? " ], GreedyGeneratorConfig())
['Python is a high-level programming language that is easy to learn and widely used for web development, data analysis, and automation.',
'Rust is a programming language that is designed to be a safe, concurrent, and efficient replacement for C++.']ドキュメントでは、より多くの使用例を見つけることができます。また、 examplesディレクトリにキュレーションされた変圧器を使用するプログラムのサンプルを見つけることもできます。
キュレーションされた変圧器の使用方法については、こちらをご覧ください。
curated-transformers bitsandbytesライブラリを活用することにより、モデルの動的な8ビットおよび4ビットの量子化をサポートします。
量子化バリアントを使用して、必要な依存関係を自動的にインストールします。
pip install curated-transformers[quantization]