onnxruntime serverダウンロードonnxruntime serverソースコードのダウンロード

onnxruntime server

その他のソースコード

v1.20.0

ダウンロード

ONNXランタイムサーバー

ONNX：オープンニューラルネットワーク交換
ONNXランタイムサーバーは、ONNX推論にTCPおよびHTTP/HTTPS REST APIを提供するサーバーです。
ONNX Runtime Serverは、シンプルで高性能ML推論と優れた開発者エクスペリエンスを提供することを目指しています。
- さまざまな環境でONNXファイルとしてトレーニングされているMLモデルをエクスポートした場合、追加のコードまたはメタデータを記述せずに推論APIを提供できます。 ONNXファイルをディレクトリ構造に配置するだけです。
- 各ONNXセッションでは、CPUまたはCUDAを使用することを選択できます。
- ONNXモデルの入力/出力を分析して、協力者にタイプ/形状情報を提供します。
- 組み込みのSwagger APIドキュメントにより、コラボレーターはAPIを介してMLモデルを簡単にテストできます。（APIの例）
- すぐに実行できるDocker画像。ビルドは必要ありません。

onnxランタイムサーバーを構築します
- 要件
  - onnxランタイムをインストールします
  - 依存関係をインストールします
- コンパイルしてインストールします
パッケージマネージャーを介してインストールします
サーバーを実行します
Docker
API
使い方

onnxランタイムサーバーを構築します

要件

onnxランタイム
ブースト
cmake、pkg-config
cuda（オプション、nvidia gpuサポートのため）
openSSL（オプション、httpsの場合）

onnxランタイムをインストールします

Linux

download-onnxruntime-linux.shスクリプトを使用してください
- このスクリプトは、最新バージョンのバイナリをダウンロードし、 /usr/local/onnxruntimeにインストールします。
- また、 /usr/local/onnxruntime/libを/etc/ld.so.conf.d/onnxruntime.confに追加し、 ldconfigを実行します。
または、ONNXランタイムリリースからバイナリを手動でダウンロードします。

Mac OS

brew install onnxruntime

依存関係をインストールします

ubuntu/debian

sudo apt install cmake pkg-config libboost-all-dev libssl-dev

（オプション）CUDAサポート（CUDA 12.x、Cudnn 9.x）

以下の指示に従って、CUDA ToolkitとCudnnをインストールしてください。
- CUDAツールキットインストールガイド
- ubuntuのcudaダウンロード

sudo apt install cuda-toolkit-12 libcudnn9-dev-cuda-12
# optional, for Nvidia GPU support with Docker 
sudo apt install nvidia-container-toolkit

Mac OS

brew install cmake boost openssl

コンパイルしてインストールします

cmake -B build -S . -DCMAKE_BUILD_TYPE=Release
cmake --build build --parallel
sudo cmake --install build --prefix /usr/local/onnxruntime-server

パッケージマネージャーを介してインストールします

OS	方法	指示
Arch Linux	aur	`yay -S onnxruntime-server`

サーバーを実行します

モデルが配置されているパスオプション（ --model-dir ）を入力する必要があります。
- onnxモデルファイルは、次のパスに配置する必要があります： ${model_dir}/${model_name}/${model_version}/model.onnxまたは${model_dir}/${model_name}/${model_version}.onnx

`--model-dir`のファイル	セッション要求本体を作成します	セッションAPI URLパスを取得/実行します（作成後）
`model_name/model_version/model.onnx`または`model_name/model_version.onnx`	`{"model":"model_name", "version":"model_version"}`	`/api/sessions/model_name/model_version`
`sample/v1/model.onnx`または`sample/v1.onnx`	`{"model":"sample", "version":"v1"}`	`/api/sessions/sample/v1`
`sample/v2/model.onnx`または`sample/v2.onnx`	`{"model":"sample", "version":"v2"}`	`/api/sessions/sample/v2`
`other/20200101/model.onnx`または`other/20200101.onnx`	`{"model":"other", "version":"20200101"}`	`/api/sessions/other/20200101`

次のバックエンドのいずれかを有効にする必要があります：TCP、HTTP、またはHTTPS。
- TCPを使用する場合は、 --tcp-portオプションを指定する必要があります。
- HTTPを使用する場合は、 --http-portオプションを指定する必要があります。
- HTTPSを使用する場合は、 --https-port 、 --https-cert 、および--https-keyオプションを指定する必要があります。
- Swaggerを使用する場合は、 --swagger-url-pathオプションを指定する必要があります。
-h 、 --helpオプションを使用して、オプションの完全なリストを表示します。
すべてのオプションは、環境変数として設定できます。これは、Dockerのようなコンテナで操作する場合に役立ちます。
- 通常、コマンドラインオプションは環境変数よりも優先されますが、 ONNX_SERVER_CONFIG_PRIORITY=env環境変数が存在する場合、環境変数は優先度が高くなります。 Docker画像内では、環境変数の優先度が高くなります。

オプション

オプション	環境	説明
`--workers`	`ONNX_SERVER_WORKERS`	ワーカースレッドプールサイズ。デフォルト： `4`
`--request-payload-limit`	`ONNX_SERVER_REQUEST_PAYLOAD_LIMIT`	http/httpsは、ペイロードサイズの制限を要求します。デフォルト：1024 * 1024 * 10（10MB） `
`--model-dir`	`ONNX_SERVER_MODEL_DIR`	モデルディレクトリパス ONNXモデルファイルは、次のパスに配置する必要があります。 `${model_dir}/${model_name}/${model_version}/model.onnx`または `${model_dir}/${model_name}/${model_version}.onnx` デフォルト： `models`
`--prepare-model`	`ONNX_SERVER_PREPARE_MODEL`	サーバーの起動時にいくつかのモデルセッションを事前に作成します。 `model_name:model_version`または`model_name:model_version(session_options, ...)`のスペース分離リストとしての形式。利用可能なsession_optionsはです -cuda = device_id `[ or true or false]` 例） `model1:v1 model2:v9` `model1:v1(cuda=true) model2:v9(cuda=1)`

バックエンドオプション

オプション	環境	説明
`--tcp-port`	`ONNX_SERVER_TCP_PORT`	TCPバックエンドと使用するポート番号を有効にします。
`--http-port`	`ONNX_SERVER_HTTP_PORT`	HTTPバックエンドと使用するポート番号を有効にします。
`--https-port`	`ONNX_SERVER_HTTPS_PORT`	HTTPSバックエンドと使用するポート番号を有効にします。
`--https-cert`	`ONNX_SERVER_HTTPS_CERT`	HTTPSのSSL認定ファイルパス
`--https-key`	`ONNX_SERVER_HTTPS_KEY`	HTTPSのSSL秘密キーファイルパス
`--swagger-url-path`	`ONNX_SERVER_SWAGGER_URL_PATH`	http/httpsバックエンドのSwagger APIドキュメントを有効にします。この値は「/api/」と「/health」で始まることはできません指定されていない場合は、Swaggerドキュメントが提供されていません。 eg） /swaggerまたは /api-docs

ログオプション

オプション	環境	説明
`--log-level`	`ONNX_SERVER_LOG_LEVEL`	ログレベル（デバッグ、情報、警告、エラー、致命的）
`--log-file`	`ONNX_SERVER_LOG_FILE`	ログファイルパス。指定されていない場合、ログはstdoutに印刷されます。
`--access-log-file`	`ONNX_SERVER_ACCESS_LOG_FILE`	ログファイルパスにアクセスします。指定されていない場合、ログはstdoutに印刷されます。

Docker

Docker Hub：Kibaes/onnxruntime-server
- 1.20.1-linux-cuda12 AMD64（CUDA 12.X、CUDNN 9.x）
- 1.20.1-linux-cpu AMD64、ARM64

DOCKER_IMAGE=kibae/onnxruntime-server:1.20.1-linux-cuda12 # or kibae/onnxruntime-server:1.20.1-linux-cpu	

docker pull ${DOCKER_IMAGE}

# simple http backend
docker run --name onnxruntime_server_container -d --rm --gpus all 
  -p 80:80 
  -v " /your_model_dir:/app/models " 
  -v " /your_log_dir:/app/logs " 
  -e " ONNX_SERVER_SWAGGER_URL_PATH=/api-docs " 
  ${DOCKER_IMAGE}

Docker画像の使用に関する詳細については、こちらをご覧ください。
- https://hub.docker.com/r/kibaes/onnxruntime-server
docker-compose.ymlの例はリポジトリで入手できます。

API

HTTP/HTTPS REST API
- APIドキュメント（Swagger）が組み込まれています。サーバーにSwaggerを提供する場合は、起動時に--swagger-url-path=/swagger/ optionを追加します。これは--http-portまたは--https-portオプションで使用する必要があります。
```
./onnxruntime_server --model-dir=YOUR_MODEL_DIR --http-port=8080 --swagger-url-path=/api-docs/
```
  - 上記のようにサーバーを実行した後、 http://localhost:8080/api-docs/で利用可能なSwagger UIにアクセスできます。
- スワッガーサンプル
TCP API

使い方

いくつかのことが、使用の流れの大まかなアイデアを得るのに役立つために省略されています。

簡単な使用例

サーバー起動時にONNXセッションを作成する例

 %% {init：{
    'Sequence'：{'Notealign'： 'left'、 'mirroractors'：true}
}} %%
Sequendediagram
    管理者としての俳優A
    ボックスRGB（0、0、0、0.1）「onnxランタイムサーバー」
        ディスクとしての参加者SD
        参加者SP ASプロセス
    終わり
    クライアントとしての俳優C
    Aの右：3つのモデルを提供します。
    A- >> SD：モデルファイルをディスクにコピーします。
    a- >> sp：サーバーを開始-prepare -modelオプション
    sp
    Aの右：onnxruntime_server <br />  -  http-port = 8080 <br />  -  model-path = /var /models <br />  -  prepare-model = "model_a：v1（cuda = 0）model_a：v2（cuda = 0）"
    SP- >> SD：ロードモデル
    SD、SPに注意：<br />"/var/models/model_a/v1/model.onnx "のロードモデル
    SD- >> SP：モデルバイナリ
    sp
    sp- >> sp：<br /> onnxruntime <br />セッションを作成します
    sp
    sp
    RECT RGB（100、100、100、0.3）
        SD、Cに注意してください：セッションを実行します
        C- >> SP：セッションリクエストを実行します
        sp
        sp、c：post /api /sessions /model_a /v1 <br /> {<br /> "x"：[1]、[2]、[3]]、<br /> "y"：[[2]、[3]、[4]、<br /> "z"：[[3]、[4]、[5] <br />>}}
        sp
        sp- >> sp：実行<br /> onnxruntime <br /> session
        sp
        SP- >> C：セッション応答を実行します
        sp
        sp、c：{<br /> "output"：[<br /> [0.6492120623588562]、<br /> [0.7610487341880798]、<br />
    終わり

クライアントがONNXセッションを作成および実行する例

 %% {init：{
    'Sequence'：{'Notealign'： 'left'、 'mirroractors'：true}
}} %%
Sequendediagram
    管理者としての俳優A
    ボックスRGB（0、0、0、0.1）「onnxランタイムサーバー」
        ディスクとしての参加者SD
        参加者SP ASプロセス
    終わり
    クライアントとしての俳優C
    Aの右：3つのモデルを提供します。
    A- >> SD：モデルファイルをディスクにコピーします。
    A- >> SP：サーバーを開始します
    A右A：onnxruntime_server <br />  -  http-port = 8080 <br />  -  model-path = /var /models
    RECT RGB（100、100、100、0.3）
        SD、Cに注意してください：セッションを作成します
        C- >> SP：セッション要求を作成します
        sp
        sp、c：post /api /sessions <br /> {"model"： "model_a"、 "version"： "v1"}
        SP- >> SD：ロードモデル
        SD、SPに注意：<br />"/var/models/model_a/v1/model.onnx "のロードモデル
        SD- >> SP：モデルバイナリ
        sp
        sp- >> sp：<br /> onnxruntime <br />セッションを作成します
        sp
        SP- >> C：セッション応答を作成します
        sp
        sp、c：{<br /> "model"： "model_a"、<br /> "バージョン"： "v1"、<br /> "created_at"：1694228106、<br /> "execution_count"：0、<br /> "last_executed_at"：0、<br /> "float32 [-1,1]"、<br /> "y"： "float32 [-1,1]"、<br /> "z"： "float32 [-1,1]" <br />}、<br /> "出力"：{<br /> "output"： "float32 [-1,1]" <br />}
        Cの右に注意：？入力と出力のタイプと形状<BR />を知ることができます。
    終わり
    RECT RGB（100、100、100、0.3）
        SD、Cに注意してください：セッションを実行します
        C- >> SP：セッションリクエストを実行します
        sp
        sp、c：post /api /sessions /model_a /v1 <br /> {<br /> "x"：[1]、[2]、[3]]、<br /> "y"：[[2]、[3]、[4]、<br /> "z"：[[3]、[4]、[5] <br />>}}
        sp
        sp- >> sp：実行<br /> onnxruntime <br /> session
        sp
        SP- >> C：セッション応答を実行します
        sp
        sp、c：{<br /> "output"：[<br /> [0.6492120623588562]、<br /> [0.7610487341880798]、<br />
    終わり

拡大する

追加情報

バージョン v1.20.0
タイプその他のソースコード
更新時間 2025-04-28
サイズ 724.12KB
から Github

onnxruntime server

ONNXランタイムサーバー

onnxランタイムサーバーを構築します

要件

onnxランタイムをインストールします

Linux

Mac OS

依存関係をインストールします

ubuntu/debian

（オプション）CUDAサポート（CUDA 12.x、Cudnn 9.x）

Mac OS

コンパイルしてインストールします

パッケージマネージャーを介してインストールします

サーバーを実行します

オプション

バックエンドオプション

ログオプション

Docker

API

使い方

簡単な使用例

サーバー起動時にONNXセッションを作成する例

クライアントがONNXセッションを作成および実行する例

onnxruntime

SQLサーバー

FileZillaサーバー

FileZillaサーバー

WinFtpサーバー

FileZillaサーバー

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express