令人敬畏的追捧面
这是一些与拥抱面孔库集成的精彩开源项目和应用程序的列表。
如何贡献
?官方图书馆
用❤️制成的第一方酷东西?拥抱脸。
- 变形金刚 - JAX,Pytorch和Tensorflow的最先进的自然语言处理。
- 数据集 - 具有快速,易于使用和高效的数据操纵工具的ML模型的最大的现成NLP数据集枢纽。
- Tokenizers - 为研究和生产优化的快速最先进的引物。
- 敲击 - 当您的培训仅使用另外两行代码结束时,通知通知。
- 加速 - 一种使用多GPU,TPU,混合精液训练和使用Pytorch型号的简单方法。
- AUTONLP-火车最先进的自然语言处理模型,并自动在可扩展的环境中部署它们。
- NN_PRUNING-修剪固定或培训时修剪模型。
- huggingface_hub-客户端库将在huggingface.co Hub上下载和发布模型和其他文件。
- Tune-用于比较基于变压器模型的基准。
??教程
了解如何逐步使用拥抱面部工具包。
- 官方课程(来自拥抱面孔) - 提供的官方课程系列?拥抱脸。
- Transformers-Tutorials(由@nielsrogge) - 用于在现实世界数据集上应用多个模型的教程。
? NLP工具包
NLP工具包建立在变压器上。瑞士军!
- Allennlp(来自AI2) - 开源NLP研究库。
- Graph4NLP-启用NLP的图形神经网络。
- 闪电变压器 - 具有Pytorch Lightning接口的变压器。
- 适配器变形金刚 - 扩展到变形金刚库,将适配器集成到最先进的语言模型中。
- OBSEI-低代码AI工作流动自动化工具,并在工作流管线中执行各种NLP任务。
- Trapper(来自obss) - 最新的NLP通过模块化设计和一致的API中的变压器模型。
- Flair-最先进的NLP的非常简单的框架。
?文本表示
将句子转换为向量。
- 句子变形金刚(来自UKPlab) - 广泛使用的编码器计算句子,段落和图像的密集矢量表示。
- 白宁伯特(来自Microsoft) - 美白的一种简单无监督的句子嵌入方法。
- Simcse(来自普林斯顿) - 与对比度学习的最先进的句子。
- 密集词(来自普林斯顿) - 大规模学习短语的密集表示。
推理引擎
高度优化的推理引擎实施了兼容变形金刚的API。
- Turbotransformer(来自Tencent) - 具有快速C ++ API的变压器的推理引擎。
- FASTRASTRANSFORMER(来自NVIDIA) - 脚本和配方在NVIDIA GPU上运行高度优化的基于变压器的编码器和解码器组件。
- LightSeq(来自Bytedance) - 在CUDA中实施的序列处理和发电的高性能推理库。
- FastSeq(来自Microsoft) - 用于文本生成,摘要,翻译任务等的流行序列模型(例如,BART,PROPHETNET)的有效实现。
?模型可伸缩性
跨多个GPU的平行化模型。
- ParallFormers(来自Tunib) - 用于模型并行部署的库。
- 奥斯陆(来自Tunib) - 一个支持各种功能以帮助您培训大型模型的库。
- DeepSpeed(来自Microsoft) - DeepSpeed -Zero-缩放任何模型大小,零至没有更改模型。与HF培训师集成。
- FairScale(来自Facebook) - 也实现零协议。与HF培训师集成。
- Colossalai(来自HPCaitech) - 用于大规模平行训练的统一深度学习系统(1d,2d,2.5d,3d,3D和序列并行性和零协议)。
?模型压缩/加速度
压缩或加速模型以提高推理速度。
- Torchdistill-基于Pytorch的模块化,配置驱动的知识蒸馏框架。
- TextBrewer(来自HFL) - 压缩语言模型的最新蒸馏方法。
- 这些贝尔特(来自微软) - 通过逐步替换原始伯特的组件来压缩伯特。
️对抗攻击
进行对抗攻击以测试模型鲁棒性。
- TextAttack(来自UVA) - 用于对抗性攻击,数据增强和模型培训的Python框架。
- Textflint(来自Fudan) - NLP的统一多语言鲁棒性评估工具包。
- OpenAttack(来自THU) - 开源文本对抗攻击工具包。
?样式转移
转移文字样式!现在您知道为什么它被称为变压器?
- StyleFormer-神经语言样式转移框架,以在样式之间顺畅地传输文本。
- CONDERT-自我监督句子表示转移的对比框架。
?情感分析
分析人类的情绪和情感。
?语法误差校正
你做了错字!让我纠正它。
- GRAMFORMER-用于检测,突出和纠正自然语言文本的语法错误的框架。
?翻译
在不同语言之间翻译。
- DL-Translate-基于HF变形金刚的基于深度学习的翻译库。
- EasyNMT(来自UKPlab) - 基于HF变形金刚的易于使用,最先进的翻译库和Docker图像。
知识和实体
学习知识,采矿实体,连接世界。
- 纯净(来自普林斯顿) - 从文本中提取实体和关系。
?演讲
由HF库提供支持的语音处理。需要演讲!
- S3PRL-自我监督的语音预训练和表示工具包。
- 语音脑 - 基于Pytorch的语音工具包。
?多模式
了解不同方式的世界。
- Vilt(来自Kakao) - 无卷积或地区监督的视觉和语言变压器。
?强化学习
将RL魔术与NLP相结合!
- TRL-使用近端策略优化(PPO)的微调变压器与人类偏好保持一致。
❓问题回答
寻找答案?救援的变压器!
- Haystack(来自DeepSet) - 在野外开发和部署提问系统的端到端框架。
?推荐系统
我认为这很适合您!
- Transformers4Rec(来自NVIDIA) - 由变形金刚提供的灵活,有效的库,用于顺序和基于会话的建议。
⚖资源
评估由HF数据集提供支持的模型输出和数据质量!
- 陪审团(来自OBS) - 易于使用的工具,用于评估NLP模型输出,适用于NLG(自然语言生成),提供各种自动化的文本到文本指标。
- Spotlight-用一行代码交互式探索您的HF数据集。使用模型结果(例如嵌入,预测)来了解关键数据段和模型故障模式。
?神经搜索
搜索,但具有神经网络的力量!
- Jina Integration -Jina集成的脸部加速API。
- 编织集成(Text2Vec)(QA) - 拥抱面向变压器的编织集成。
- 科尔伯特(来自斯坦福大学) - 一个快速准确的检索模型,可以对数十毫秒的大型文本集合进行基于BERT的可扩展搜索。
☁云
云使您的生活变得轻松!
- 亚马逊萨吉式制造商 - 比以往任何时候都更容易训练亚马逊萨吉式制造商的拥抱面孔变压器模型。
硬件
基础设施使魔术能够发生。
- 高通 - 合作在Snapdragon中启用变压器。
- 英特尔 - 与Intel合作配置选项。