curated transformers
v2.0.1:

最先进的变压器,砖块
策划的变压器是Pytorch的变压器库。它提供了由一组可重复使用的组件组成的最新模型。策展变压器的出色特征是:
bitsandbytes库支持4/8位推断,并且每个模型都可以使用Pytorch meta设备来避免不必要的分配和初始化。策划的变压器已通过爆炸进行了测试,并将用作Spacy 3.7中的默认变压器实现。
支持的仅编码模型:
仅支持解码器的模型:
发电机包装器:
所有类型的型号都可以从HuggingFace Hub加载。
策划变压器的Spacy集成由spacy-curated-transformers软件包提供。
pip install curated-transformersPytorch的默认Linux构建是由CUDA 11.7支持构建的。您应该在以下情况下明确安装CUDA构建:
在这两种情况下,您都可以使用以下方式安装pytorch
pip install torch --index-url https://download.pytorch.org/whl/cu118>>> import torch
>>> from curated_transformers.generation import AutoGenerator, GreedyGeneratorConfig
>>> generator = AutoGenerator.from_hf_hub( name = " tiiuae/falcon-7b-instruct " , device = torch.device( " cuda " ))
>>> generator([ " What is Python in one sentence? " , " What is Rust in one sentence? " ], GreedyGeneratorConfig())
['Python is a high-level programming language that is easy to learn and widely used for web development, data analysis, and automation.',
'Rust is a programming language that is designed to be a safe, concurrent, and efficient replacement for C++.']您可以在文档中找到更多用法示例。您还可以在examples目录中找到使用策划的变压器的示例程序。
您可以在此处阅读有关如何使用策划变压器的更多信息:
curated-transformers通过利用bitsandbytes库来支持模型的动态8位和4位量化。
使用量化变体自动安装必要的依赖项:
pip install curated-transformers[quantization]