令人敬畏的追捧面
這是一些與擁抱面孔庫集成的精彩開源項目和應用程序的列表。
如何貢獻
?官方圖書館
用❤️製成的第一方酷東西?擁抱臉。
- 變形金剛 - JAX,Pytorch和Tensorflow的最先進的自然語言處理。
- 數據集 - 具有快速,易於使用和高效的數據操縱工具的ML模型的最大的現成NLP數據集樞紐。
- Tokenizers - 為研究和生產優化的快速最先進的引物。
- 敲擊 - 當您的培訓僅使用另外兩行代碼結束時,通知通知。
- 加速 - 一種使用多GPU,TPU,混合精液訓練和使用Pytorch型號的簡單方法。
- AUTONLP-火車最先進的自然語言處理模型,並自動在可擴展的環境中部署它們。
- NN_PRUNING-修剪固定或培訓時修剪模型。
- huggingface_hub-客戶端庫將在huggingface.co Hub上下載和發布模型和其他文件。
- Tune-用於比較基於變壓器模型的基準。
? ?教程
了解如何逐步使用擁抱面部工具包。
- 官方課程(來自擁抱面孔) - 提供的官方課程系列?擁抱臉。
- Transformers-Tutorials(由@nielsrogge) - 用於在現實世界數據集上應用多個模型的教程。
? NLP工具包
NLP工具包建立在變壓器上。瑞士軍!
- Allennlp(來自AI2) - 開源NLP研究庫。
- Graph4NLP-啟用NLP的圖形神經網絡。
- 閃電變壓器 - 具有Pytorch Lightning接口的變壓器。
- 適配器變形金剛 - 擴展到變形金剛庫,將適配器集成到最先進的語言模型中。
- OBSEI-低代碼AI工作流動自動化工具,並在工作流管線中執行各種NLP任務。
- Trapper(來自obss) - 最新的NLP通過模塊化設計和一致的API中的變壓器模型。
- Flair-最先進的NLP的非常簡單的框架。
?文本表示
將句子轉換為向量。
- 句子變形金剛(來自UKPlab) - 廣泛使用的編碼器計算句子,段落和圖像的密集矢量表示。
- 白寧伯特(來自Microsoft) - 美白的一種簡單無監督的句子嵌入方法。
- Simcse(來自普林斯頓) - 與對比度學習的最先進的句子。
- 密集詞(來自普林斯頓) - 大規模學習短語的密集表示。
推理引擎
高度優化的推理引擎實施了兼容變形金剛的API。
- Turbotransformer(來自Tencent) - 具有快速C ++ API的變壓器的推理引擎。
- FASTRASTRANSFORMER(來自NVIDIA) - 腳本和配方在NVIDIA GPU上運行高度優化的基於變壓器的編碼器和解碼器組件。
- LightSeq(來自Bytedance) - 在CUDA中實施的序列處理和發電的高性能推理庫。
- FastSeq(來自Microsoft) - 用於文本生成,摘要,翻譯任務等的流行序列模型(例如,BART,PROPHETNET)的有效實現。
?模型可伸縮性
跨多個GPU的平行化模型。
- ParallFormers(來自Tunib) - 用於模型並行部署的庫。
- 奧斯陸(來自Tunib) - 一個支持各種功能以幫助您培訓大型模型的庫。
- DeepSpeed(來自Microsoft) - DeepSpeed -Zero-縮放任何模型大小,零至沒有更改模型。與HF培訓師集成。
- FairScale(來自Facebook) - 也實現零協議。與HF培訓師集成。
- Colossalai(來自HPCaitech) - 用於大規模平行訓練的統一深度學習系統(1d,2d,2.5d,3d,3D和序列並行性和零協議)。
? 模型壓縮/加速度
壓縮或加速模型以提高推理速度。
- Torchdistill-基於Pytorch的模塊化,配置驅動的知識蒸餾框架。
- TextBrewer(來自HFL) - 壓縮語言模型的最新蒸餾方法。
- 這些貝爾特(來自微軟) - 通過逐步替換原始伯特的組件來壓縮伯特。
️對抗攻擊
進行對抗攻擊以測試模型魯棒性。
- TextAttack(來自UVA) - 用於對抗性攻擊,數據增強和模型培訓的Python框架。
- Textflint(來自Fudan) - NLP的統一多語言魯棒性評估工具包。
- OpenAttack(來自THU) - 開源文本對抗攻擊工具包。
?樣式轉移
轉移文字樣式!現在您知道為什麼它被稱為變壓器?
- StyleFormer-神經語言樣式轉移框架,以在樣式之間順暢地傳輸文本。
- CONDERT-自我監督句子表示轉移的對比框架。
?情感分析
分析人類的情緒和情感。
?語法誤差校正
你做了錯字!讓我糾正它。
- GRAMFORMER-用於檢測,突出和糾正自然語言文本的語法錯誤的框架。
?翻譯
在不同語言之間翻譯。
- DL-Translate-基於HF變形金剛的基於深度學習的翻譯庫。
- EasyNMT(來自UKPlab) - 基於HF變形金剛的易於使用,最先進的翻譯庫和Docker圖像。
知識和實體
學習知識,採礦實體,連接世界。
- 純淨(來自普林斯頓) - 從文本中提取實體和關係。
?演講
由HF庫提供支持的語音處理。需要演講!
- S3PRL-自我監督的語音預訓練和表示工具包。
- 語音腦 - 基於Pytorch的語音工具包。
?多模式
了解不同方式的世界。
- Vilt(來自Kakao) - 無卷積或地區監督的視覺和語言變壓器。
?強化學習
將RL魔術與NLP相結合!
- TRL-使用近端策略優化(PPO)的微調變壓器與人類偏好保持一致。
❓問題回答
尋找答案?救援的變壓器!
- Haystack(來自DeepSet) - 在野外開發和部署提問系統的端到端框架。
?推薦系統
我認為這很適合您!
- Transformers4Rec(來自NVIDIA) - 由變形金剛提供的靈活,有效的庫,用於順序和基於會話的建議。
⚖資源
評估由HF數據集提供支持的模型輸出和數據質量!
- 陪審團(來自OBS) - 易於使用的工具,用於評估NLP模型輸出,適用於NLG(自然語言生成),提供各種自動化的文本到文本指標。
- Spotlight-用一行代碼交互式探索您的HF數據集。使用模型結果(例如嵌入,預測)來了解關鍵數據段和模型故障模式。
?神經搜索
搜索,但具有神經網絡的力量!
- Jina Integration -Jina集成的臉部加速API。
- 編織集成(Text2Vec)(QA) - 擁抱面向變壓器的編織集成。
- 科爾伯特(來自斯坦福大學) - 一個快速準確的檢索模型,可以對數十毫秒的大型文本集合進行基於BERT的可擴展搜索。
☁雲
雲使您的生活變得輕鬆!
- 亞馬遜薩吉式製造商 - 比以往任何時候都更容易訓練亞馬遜薩吉式製造商的擁抱面孔變壓器模型。
硬體
基礎設施使魔術能夠發生。
- 高通 - 合作在Snapdragon中啟用變壓器。
- 英特爾 - 與Intel合作配置選項。