SHARK Studioダウンロード-Shark SHARK Studioソースコードのダウンロード

SHARK Studio

パイソン

nod.ai SHARK 20240531.1300

ダウンロード

サメ

高性能機械学習分布

現在、タービンを利用するためにサメを再構築しています。それが完了するまで、作業サメのために、 SHARK-1.0ブランチの.exeリリースまたはチェックアウトを使用してください

前提条件 - ドライバー

Windowsハードウェアドライバーをインストールします

[AMD RDNAユーザー]ここで最新のドライバー（23.2.1が最も古いサポートされている）をダウンロードします。
[MacOSユーザー]ここから1.3.216 Vulkan SDKをダウンロードしてインストールします。 SDKの新しいバージョンは機能しません。
[nvidiaユーザー]ここから最新のcuda / vulkanドライバーをダウンロードしてインストールする

Linuxドライバー

MESA / RADVドライバーはFP16で動作しません。最新のAMGPU-Proドライバー（非Pro OSSドライバーも機能しない）または最新のNvidia Linuxドライバーを使用してください。

他のユーザーは、ここから最新のベンダードライバーとVulkan SDKがあることvulkaninfo確認してください。

Windows 10/11ユーザーのサメの安定した拡散のクイックスタート

（前提条件）[https://github.com/nod-ai/shark-studio#install-your-hardware-drivers]からドライバーをインストールします

安定したリリースまたは最新のShark 1.0 Pre-Releaseをダウンロードします。

.exeをダブルクリックするか、コマンドライン（推奨）から実行すると、ブラウザにUIが必要です。

カスタムモデルがある場合は、.exeがあるmodels/ディレクトリにそれらを配置します。

楽しむ。

その他のインストールメモ

*新しいexeバージョンをダウンロードするたびに、新しいフォルダーにexeをダウンロードすることをお勧めします。以前のインストールと同じフォルダーにダウンロードする場合は、 `rm *.vmfb`で古い` *.vmfb`ファイルを削除する必要があります。また、 ` - clear_all`フラグを1回使用して、古いファイルをすべてクリーニングすることもできます。 *最近、ドライバーまたはこのバイナリ（exeファイル）を更新した場合は、「-clear_all」でローカルアーティファクトをすべてクリアすることをお勧めします。

ランニング

コマンドプロンプトまたはPowerShell端子を開き、フォルダー（ cd ）を.exeフォルダーに変更します。次に、コマンドプロンプトからexeを実行します。そうすれば、エラーが発生した場合、それをカットアンドペーストして助けを求めることができます。（それが常にエラーなしであなたのために動作する場合、あなたは単にexeをダブルクリックすることができます）
モデルがダウンロードされてコンパイルされると、最初の実行には数分かかる場合があります。あなたの忍耐は大歓迎です。ダウンロードは約5GBになる可能性があります。
Webサーバーポートを開く許可を与えるように依頼するWindows Defenderメッセージが表示される可能性があります。それを受け入れます。
ブラウザを開いて、安定した拡散Webサーバーにアクセスします。デフォルトでは、ポートは8080であるため、http：// localhost：8080/にアクセスできます。
常にブラウザで実行したい場合は、exeを実行するときに--ui=webコマンド引数を使用します。

停止

EXEを実行しているコマンドプロンプトを選択します。 Ctrl-Cを押して、少し待っているか、端末を閉じます。

高度なインストール（開発者のみ）

開発者向けの高度なインストール（Windows、Linux、およびMacO）

Windows 10/11ユーザー

まだ持っていない場合は、ここからWindows用のGitをインストールしてください。

コードをチェックしてください

git clone https://github.com/nod-ai/SHARK.git
cd SHARK

正しいブランチに切り替えます（重要！）

現在、サメはmainブランチのタービンのために再建されています。今のところ、再構築の取り組みに取り組んでいる場合を除き、 mainを使用することを強く落胆させ、そこにコードが画像生成のための作業アプリケーションを作成することを期待すべきではないので、今のところはSHARK-1.0ブランチに切り替えて安定したコードを使用する必要があります。

git checkout SHARK-1.0

次のセットアップ手順では、このブランチにいると想定しています。

Python VirtualEnvironmentと依存関係をセットアップします

Windows 10/11ユーザー

ここから最新のPython 3.11.xバージョンをインストールします

インストールスクリプトがPowerShellで実行されるようにします

 set-executionpolicy remotesigned

venvをセットアップして必要なパッケージ（Torch-mlir、nodlabs/shark、...）をインストールする

. / setup_venv.ps1 # You can re-run this script to get the latest version

Linux / MacOSユーザー

./setup_venv.sh
source shark1.venv/bin/activate

デバイスで安定した拡散を実行します-WebUI

Windows 10/11ユーザー

(shark1.venv) PS C:gshark > cd .appsstable_diffusionweb
(shark1.venv) PS C:gsharkappsstable_diffusionweb > python .index.py

Linux / MacOSユーザー

(shark1.venv) > cd apps/stable_diffusion/web
(shark1.venv) > python index.py

http：// localhost：8080/？__theme = darkに安定した拡散にアクセスします

デバイスで安定した拡散を実行 - コマンドライン

Windows 10/11ユーザー

(shark1.venv) PS C:gshark > python .appsstable_diffusionscriptsmain.py -- app = " txt2img " -- precision = " fp16 " -- prompt = " tajmahal, snow, sunflowers, oil on canvas " -- device = " vulkan "

Linux / MacOSユーザー

python3.11 apps/stable_diffusion/scripts/main.py --app=txt2img --precision=fp16 --device=vulkan --prompt= " tajmahal, oil on canvas, sunflowers, 4k, uhd "

vulkan cpuに置き換えて、CPUで実行するか、 cudaを使用してCUDAデバイスで実行できます。複数のVulkanデバイスがある場合は--device=vulkan://1 etcでそれらに対処できます

AMD 7900xtxの出力は次のようになります。

Average step time: 47.19188690185547ms/it
Clip Inference time (ms) = 109.531
VAE Inference time (ms): 78.590

Total image generation time: 2.5788655281066895sec

生成されたサンプルは次のとおりです。

Tajmahal、雪、ヒマワリ、canvas_0の油

トランペットを演奏するカニの写真

ハードウェアで実行するのに問題がある場合は、Shark Discordサーバーで私たちを見つけてください。

バイナリインストール

新しいPIP仮想環境をセットアップします

このステップは、Python用の新しいVirtualenvをセットアップします

python --version # Check you have 3.11 on Linux, macOS or Windows Powershell
python -m venv shark_venv
source shark_venv/bin/activate   # Use shark_venv/Scripts/activate on Windows

# If you are using conda create and activate a new conda env

# Some older pip installs may not be able to handle the recent PyTorch deps
python -m pip install --upgrade pip

macosメタルユーザーhttps://sdk.lunarg.com/sdk/download/latest/mac/vulkan-sdk.dmgをインストールし、「システムワイドインストール」を有効にしてください

サメをインストールします

このステップピップは、Linux Python 3.8、3.10、3.11、およびMacOS / Windows Python 3.11にサメと関連するパッケージをインストールします

pip install nodai-shark -f https://nod-ai.github.io/SHARK/package-index/ -f https://llvm.github.io/torch-mlir/package-index/ -f  https://nod-ai.github.io/SRT/pip-release-links.html --extra-index-url https://download.pytorch.org/whl/nightly/cpu

サメのタンクモデルテストを実行します。

pytest tank/test_models.py

Pytest SuiteとCLIのより詳細なウォークスルーについては、tank/readme.mdを参照してください。

resnet50サンプルをダウンロードして実行します

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/resnet50_script.py
# Install deps for test script
pip install --pre torch torchvision torchaudio tqdm pillow gsutil --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./resnet50_script.py --device= " cpu "  # use cuda or vulkan or metal

Bert（Minilm）サンプルをダウンロードして実行します

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/minilm_jit.py
# Install deps for test script
pip install transformers torch --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./minilm_jit.py --device= " cpu "  # use cuda or vulkan or metal

開発、テスト、ベンチマーク

Python3.11を使用してTFインポートツールを使用する場合は、次のような環境変数を使用できますUSE_IREE=1上流IREEを使用する

 # PYTHON=python3.11 VENV_DIR=0617_venv IMPORTER=1 ./setup_venv.sh

テストフレームワークを介して数百のサメタンクモデルを実行する

python -m  shark.examples.shark_inference.resnet50_script --device= " cpu " # Use gpu | vulkan
# Or a pytest
pytest tank/test_models.py -k " MiniLM "

地元で構築されたIREE / TORCH-MLIRをサメで使用する方法

トーチMLIR開発者またはIREE開発者であり、ローカルの変更をテストしたい場合はpip uninstall torch-mlirをアンインストールし、Python pip uninstall iree-compiler iree-runtime Pythonのバインディングでローカルに構築し、こことTorch-Mlirのためにここに言及したようにPythonPathを設定できます。

地元で構築されたトーチ-Mlirをサメで使用する方法：

1.) Run ` ./setup_venv.sh in SHARK ` and activate ` shark.venv ` virtual env.
2.) Run ` pip uninstall torch-mlir ` .
3.) Go to your local Torch-MLIR directory.
4.) Activate mlir_venv virtual envirnoment.
5.) Run ` pip uninstall -r requirements.txt ` .
6.) Run ` pip install -r requirements.txt ` .
7.) Build Torch-MLIR.
8.) Activate shark.venv virtual environment from the Torch-MLIR directory.
8.) Run ` export PYTHONPATH= ` pwd ` /build/tools/torch-mlir/python_packages/torch_mlir: ` pwd ` /examples ` in the Torch-MLIR directory.
9.) Go to the SHARK directory.

これで、サメはローカルに構築されたトーチ-MLIRリポジトリを使用します。

ベンチマークディスパッチ

個々のディスパッチのベンチマークを作成するには、 --dispatch_benchmarks=All --dispatch_benchmarks_dir=<output_dir> pytestコマンドライン引数に追加できます。特定のディスパッチのみをコンパイルする場合は、 "All"ではなくスペース分離文字列で指定できます。例--dispatch_benchmarks="0 1 2 10"

たとえば、CUDAでミニルム用のディスパッチベンチマークを生成して実行するには：

 pytest -k "MiniLM and torch and static and cuda" --benchmark_dispatches=All -s --dispatch_benchmarks_dir=./my_dispatch_benchmarks

指定されたコマンドは、ディスパッチとそのレイテンシーを一覧表示および注文するordered_dispatches.txtを、 <dispatch_benchmarks_dir>/<model_name>/に設定します。

代わりにこれをPythonスクリプトに組み込む場合は、 SharkInferenceを初期化するときにdispatch_benchmarksとdispatch_benchmarks_dirコマンドを渡すことができ、コンパイル時にベンチマークが生成されます。例えば：

 shark_module = SharkInference(
        mlir_model,
        device=args.device,
        mlir_dialect="tm_tensor",
        dispatch_benchmarks="all",
        dispatch_benchmarks_dir="results"
    )

出力には以下が含まれます。

注文されたリスト注文済みdispatches.txtランタイムでのすべてのディスパッチのtxt
指定されたディレクトリ内には、各ディスパッチにディレクトリがあります（すべてのディスパッチにMLIRファイルがありますが、指定されたディスパッチのバイナリとベンチマークデータのみがあります）
ディスパッチベンチマークを含む.mlirファイル
ディスパッチベンチマークを含むコンパイルされた.VMFBファイル
HAL実行可能ファイルのみを含む.mlirファイル
HAL実行可能ファイルのコンパイルされた.VMFBファイル
ベンチマーク出力を含む.txtファイル

サメのタンクからモデルテストとベンチマークを実行する方法についての詳細については、Tank/Readme.mdを参照してください。

APIリファレンス

サメの推論API


from shark.shark_importer import SharkImporter

# SharkImporter imports mlir file from the torch, tensorflow or tf-lite module.

mlir_importer = SharkImporter(
    torch_module,
    (input),
    frontend="torch",  #tf, #tf-lite
)
torch_mlir, func_name = mlir_importer.import_mlir(tracing_required=True)

# SharkInference accepts mlir in linalg, mhlo, and tosa dialect.

from shark.shark_inference import SharkInference
shark_module = SharkInference(torch_mlir, device="cpu", mlir_dialect="linalg")
shark_module.compile()
result = shark_module.forward((input))

ランニングMHLO IRを示す例。

 from shark.shark_inference import SharkInference
import numpy as np

mhlo_ir = r"""builtin.module  {
      func.func @forward(%arg0: tensor<1x4xf32>, %arg1: tensor<4x1xf32>) -> tensor<4x4xf32> {
        %0 = chlo.broadcast_add %arg0, %arg1 : (tensor<1x4xf32>, tensor<4x1xf32>) -> tensor<4x4xf32>
        %1 = "mhlo.abs"(%0) : (tensor<4x4xf32>) -> tensor<4x4xf32>
        return %1 : tensor<4x4xf32>
      }
}"""

arg0 = np.ones((1, 4)).astype(np.float32)
arg1 = np.ones((4, 1)).astype(np.float32)
shark_module = SharkInference(mhlo_ir, device="cpu", mlir_dialect="mhlo")
shark_module.compile()
result = shark_module.forward((arg0, arg1))

REST APIを使用した例

ブレンダーで使用するためにサメをセットアップします
Koboldcppで使用するためにサメをセットアップします

サポートおよび検証されたモデル

Sharkは、MLモデルの最新のイノベーションをサポートするために維持されています。

TF Huggingfaceモデル	Shark-CPU	サメ型	サメ - メタル
バート
Distilbert
GPT2
咲く
安定した拡散
ビジョントランス
Resnet50

サメでサポートされているモデルの完全なリストについては、Tank/readme.mdを参照してください。

通信チャネル

Shark Discord Server：Sharkチームや他のユーザーとのリアルタイムディスカッション
GitHubの問題：機能要求、バグなど

ライセンス

Nod.ai Sharkは、LLVMの例外を除き、Apache 2.0ライセンスの条件に基づいてライセンスされています。詳細については、ライセンスを参照してください。

拡大する

追加情報

バージョン nod.ai SHARK 20240531.1300
タイプパイソン
更新時間 2025-07-12
サイズ 967.24KB
から Github

SHARK Studio

サメ

Windowsハードウェアドライバーをインストールします

Linuxドライバー

Windows 10/11ユーザーのサメの安定した拡散のクイックスタート

ランニング

停止

開発者向けの高度なインストール（Windows、Linux、およびMacO）

Windows 10/11ユーザー

コードをチェックしてください

正しいブランチに切り替えます（重要！）

Python VirtualEnvironmentと依存関係をセットアップします

Windows 10/11ユーザー

インストールスクリプトがPowerShellで実行されるようにします

venvをセットアップして必要なパッケージ（Torch-mlir、nodlabs/shark、...）をインストールする

Linux / MacOSユーザー

デバイスで安定した拡散を実行します-WebUI

Windows 10/11ユーザー

Linux / MacOSユーザー

http：// localhost：8080/？__theme = darkに安定した拡散にアクセスします

デバイスで安定した拡散を実行 - コマンドライン

Windows 10/11ユーザー

Linux / MacOSユーザー

新しいPIP仮想環境をセットアップします

サメをインストールします

サメのタンクモデルテストを実行します。

resnet50サンプルをダウンロードして実行します

Bert（Minilm）サンプルをダウンロードして実行します

テストフレームワークを介して数百のサメタンクモデルを実行する

地元で構築されたIREE / TORCH-MLIRをサメで使用する方法

ベンチマークディスパッチ

サメの推論API

ランニングMHLO IRを示す例。

REST APIを使用した例

サポートおよび検証されたモデル

通信チャネル

関連プロジェクト

ライセンス