中文版本

TNN:由Tencent Youtu Lab開源的高性能,輕巧的神經網絡推理框架。它還具有許多出色的優勢,例如跨平台,高性能,模型壓縮和代碼裁縫。 TNN框架進一步增強了基於原始RapidNet和NCNN框架的移動設備的支持和性能優化。同時,它指的是該行業主流開源框架的高性能和良好的可擴展性特徵,並擴展了對X86和NV GPU的支持。在手機上,Mobile QQ,Weishi和Pitu等許多應用程序都使用了TNN。作為騰訊雲AI的基本加速框架,TNN為實施許多企業提供了加速支持。歡迎每個人參加協作建設,以促進TNN推理框架的進一步改進。
| 面部檢測(Blazeface) | 面對對齊 (來自Tencent Youtu Lab) | 頭髮細分 (摘自Tencent Guangying Lab) |
|---|---|---|
型號鏈接:Tflite TNN | 型號鏈接:TNN | 型號鏈接:TNN |
| 姿勢估計 (摘自騰訊廣告) | 姿勢估計 (Blazepose) | 中國OCR |
|---|---|---|
型號鏈接:TNN | 型號鏈接:Tflite TNN | 型號鏈接:ONNX TNN |
| 對象檢測(yolov5s) | 對象檢測(MobilenetV2-SSD) | 閱讀理解 |
|---|---|---|
型號鏈接:ONNX TNN | ![]() 型號鏈接:TensorFlow TNN | 型號鏈接:ONNX TNN |
中國OCR演示是中國ock_lite項目的TNN實施。它是輕巧的,支持傾斜,旋轉和垂直文本識別。
下表顯示了每個演示的支持。您可以單擊✅並找到每個演示的入口代碼。
| 演示 | 手臂 | OPENCL | 金屬 | 華為NPU | 蘋果NPU | x86 | 庫達 |
|---|---|---|---|---|---|---|---|
| 面部檢測(Blazeface) | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 對象檢測(yolov5s) | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 面對對齊 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 頭髮細分 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 姿勢估計 (摘自騰訊廣告) | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 姿勢估計(Blazepose) | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 中國OCR | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| 閱讀理解 | ✅ | ✅ |
使用TNN非常簡單。如果您有訓練有素的模型,則可以通過三個步驟將模型部署在目標平台上。
將訓練的模型轉換為TNN模型。我們提供大量工具來幫助您完成此步驟,無論您是使用TensorFlow,Pytorch還是Caffe,都可以輕鬆完成轉換。可以在此處找到詳細的動手教程如何創建TNN模型。
完成模型轉換後,第二步是編譯目標平台的TNN引擎。您可以根據硬件支持在不同的加速解決方案中進行選擇,例如ARM/OPENCL/METAR/NPU/X86/CUDA。對於這些平台,TNN提供了方便的一鍵式腳本來編譯。有關詳細的步驟,請參閱如何編譯TNN。
最後一步是使用編譯的TNN引擎進行推理。您可以在應用程序內對TNN進行程序調用。我們提供豐富而詳細的演示,以幫助您完成。
目前,TNN已在各種主要業務中啟動,其以下特徵得到了廣泛讚揚。
計算優化
低精度計算加速度
內存優化
TNN上主流模型的性能:基準數據
TNN體系結構圖:

TNN通過ONNX支持Tensorflow,Pytorch,Mxnet,Caffe和其他培訓框架,利用ONNX開源協會的持續改進。目前,TNN支持100多個ONNX運營商,由大多數主流CNN,NLP操作員組成。
TNN在主流操作系統(Android,iOS,Embedded Linux,Windows,Linux)上運行,並且與ARM CPU,X86 GPU,NPU硬件平台兼容。
TNN是通過模塊化設計構建的,該設計構建了諸如模型分析,圖形構造,圖形優化,低級硬件適應和高性能內核等組件的分離。它使用“工廠模式”進行註冊和構建設備,以最大程度地減少支持更多硬件和加速解決方案的成本。
移動動態庫的大小僅約400kb,並且提供了輕巧和方便的基本圖像轉換操作。 TNN使用跨平台的統一模型和接口,可以通過僅配置一個參數來輕鬆切換。
TNN引用了以下項目:
歡迎每個人參加,以建立行業中最佳推理框架。
技術討論QQ組:704900079答案:TNN
掃描QR碼加入TNN討論組:
