SHARK Studio Download - SHARK Studio Source Code Download

SHARK Studio

Python

nod.ai SHARK 20240531.1300

Herunterladen

HAI

Hochleistungsverteilung für maschinelles Lernen

Derzeit bauen wir Hai wieder auf, um die Turbine zu nutzen. Bis zu diesem Zeitpunkt sind Sie sicher, dass Sie eine .exe-Veröffentlichung oder einen Checkout der SHARK-1.0 Niederlassung für einen Arbeitshai verwenden

Voraussetzungen - Fahrer

Installieren Sie Ihre Windows -Hardware -Treiber

[AMD RDNA -Benutzer] Laden Sie hier den neuesten Treiber herunter (23.2.1 ist der älteste unterstützte).
[MacOS -Benutzer] Laden Sie hier die 1.3.216 Vulkan SDK herunter und installieren Sie sie. Neuere Versionen des SDK werden nicht funktionieren.
[Nvidia -Benutzer] Laden Sie hier die neuesten CUDA / Vulkan -Treiber herunter und installieren Sie sie

Linux -Treiber

MESA / RADV -Treiber funktionieren nicht mit FP16. Bitte verwenden Sie die neuesten AMGPU-Pro-Treiber (nicht professionelle Treiber nicht funktionieren) oder die neuesten NVIDIA-Linux-Treiber.

Andere Benutzer bitte stellen Sie vulkaninfo

Schneller Start für die stabile Diffusion von Haien für Windows 10/11 Benutzer

Installieren Sie den Treiber von (Voraussetzungen) [https://github.com/nod-ai/shark-studio#install-your-hardware-grivers] oben]

Laden Sie die stabile Veröffentlichung oder den neuesten Shark 1.0 Pre-Release herunter.

Doppelklicken Sie auf die .exe oder führen Sie aus der Befehlszeile aus (empfohlen), und Sie sollten die Benutzeroberfläche im Browser haben.

Wenn Sie benutzerdefinierte Modelle haben, stellen Sie sie in ein models/ Verzeichnis, in dem sich der .exe befindet.

Genießen.

Weitere Installationsnotizen

* Wir empfehlen Ihnen, EXE in einem neuen Ordner herunterzuladen, wenn Sie eine neue EXE -Version herunterladen. Wenn Sie es als vorherige Installation in denselben Ordner herunterladen, müssen Sie die alten " *.vmfb` -Dateien mit" rm *.vmfb "löschen. Sie können auch das Flag `-Clear_all` einmal verwenden, um alle alten Dateien zu reinigen. * Wenn Sie kürzlich den Treiber oder diese binäre (EXE-Datei) aktualisiert haben, empfehlen wir Ihnen, alle lokalen Artefakte mit `--clear_all` zu löschen

Läuft

Öffnen Sie eine Eingabeaufforderung oder einen PowerShell -Terminal, ändern Sie den Ordner ( cd ) in den .exe -Ordner. Führen Sie dann die Exe aus der Eingabeaufforderung aus. Wenn ein Fehler auftritt, können Sie ihn schneiden und einteilen, um um Hilfe zu bitten. (Wenn es ohne Fehler immer für Sie funktioniert, doppelklicken Sie einfach auf die Exe)
Der erste Lauf kann einige Minuten dauern, wenn die Modelle heruntergeladen und zusammengestellt werden. Ihre Geduld wird geschätzt. Der Download könnte ungefähr 5 GB betragen.
Sie werden wahrscheinlich eine Windows Defender -Nachricht sehen, in der Sie aufgefordert werden, einen Webserver -Port zu öffnen. Akzeptiere es.
Öffnen Sie einen Browser, um auf den stabilen Diffusion -Webserver zuzugreifen. Standardmäßig ist der Port 8080, sodass Sie zu http: // localhost: 8080/gehen.
Wenn Sie es vorziehen, immer im Browser auszuführen, verwenden Sie das Argument --ui=web -Befehls -Argument, wenn Sie das EXE ausführen.

Stoppen

Wählen Sie die Eingabeaufforderung aus, in der die Exe ausgeführt wird. Drücken Sie Strg-C und warten Sie einen Moment oder schließen Sie das Terminal.

Erweiterte Installation (nur für Entwickler)

Erweiterte Installation (Windows, Linux und MacOS) für Entwickler

Windows 10/11 Benutzer

Installieren Sie Git für Windows von hier aus, wenn Sie es noch nicht haben.

Schauen Sie sich den Code an

git clone https://github.com/nod-ai/SHARK.git
cd SHARK

Wechseln Sie in den richtigen Zweig (wichtig!)

Derzeit wird Shark in der main für Turbine umgebaut. Im Moment sind Sie von der Verwendung main nachdrücklich entmutigt, es sei denn, Sie arbeiten an den Wiederaufbauanstrengungen und sollten nicht erwarten, dass der Code dort eine Arbeitsanwendung für die Bilderzeugung erstellt. Sie müssen also vorerst in den SHARK-1.0 Zweig umstellen und den stabilen Code verwenden.

git checkout SHARK-1.0

In den folgenden Einrichtungsanweisungen geht hervor, dass Sie sich in diesem Zweig befinden.

Richten Sie Ihre Python -Virtual -Umgebung und Ihre Abhängigkeiten ein

Windows 10/11 Benutzer

Installieren Sie die neueste Python 3.11.x -Version von hier

Lassen Sie das Installieren des Skripts in PowerShell ausführen

 set-executionpolicy remotesigned

Setup Venv einrichten und die erforderlichen Pakete installieren (Torch-Mlir, Nodlabs/Hai, ...)

. / setup_venv.ps1 # You can re-run this script to get the latest version

Linux / MacOS -Benutzer

./setup_venv.sh
source shark1.venv/bin/activate

Führen Sie eine stabile Diffusion auf Ihrem Gerät aus - Webui

Windows 10/11 Benutzer

(shark1.venv) PS C:gshark > cd .appsstable_diffusionweb
(shark1.venv) PS C:gsharkappsstable_diffusionweb > python .index.py

Linux / MacOS -Benutzer

(shark1.venv) > cd apps/stable_diffusion/web
(shark1.venv) > python index.py

Zugang stabile Diffusion auf http: // localhost: 8080/? __TheMe = dunkel

Führen Sie eine stabile Diffusion auf Ihrem Gerät aus - Befehlszeile

Windows 10/11 Benutzer

(shark1.venv) PS C:gshark > python .appsstable_diffusionscriptsmain.py -- app = " txt2img " -- precision = " fp16 " -- prompt = " tajmahal, snow, sunflowers, oil on canvas " -- device = " vulkan "

Linux / MacOS -Benutzer

python3.11 apps/stable_diffusion/scripts/main.py --app=txt2img --precision=fp16 --device=vulkan --prompt= " tajmahal, oil on canvas, sunflowers, 4k, uhd "

Sie können vulkan durch cpu ersetzen, um auf Ihrer CPU oder durch cuda zu laufen, um auf CUDA -Geräten zu laufen. Wenn Sie mehrere Vulkan -Geräte haben, können Sie sie mit --device=vulkan://1 usw. ansprechen

Die Ausgabe eines AMD 7900XTX würde ungefähr aussehen wie:

Average step time: 47.19188690185547ms/it
Clip Inference time (ms) = 109.531
VAE Inference time (ms): 78.590

Total image generation time: 2.5788655281066895sec

Hier sind einige Proben erzeugt:

Tajmahal, Schnee, Sonnenblumen, Öl auf Canvas_0

Ein Foto einer Krabbe, die eine Trompete spielt

Finden Sie uns auf dem Shark Discord Server, wenn Sie Probleme haben, es auf Ihrer Hardware auszuführen.

Binäre Installation

Richten Sie eine neue virtuelle PIP -Umgebung ein

In diesem Schritt wird ein neues Virtualenv für Python eingerichtet

python --version # Check you have 3.11 on Linux, macOS or Windows Powershell
python -m venv shark_venv
source shark_venv/bin/activate   # Use shark_venv/Scripts/activate on Windows

# If you are using conda create and activate a new conda env

# Some older pip installs may not be able to handle the recent PyTorch deps
python -m pip install --upgrade pip

MacOS-Metallbenutzer bitte installieren

Hai installieren

Dieser Schritt -PIP installiert Hai und zugehörige Pakete unter Linux Python 3.8, 3.10 und 3.11 sowie MacOS / Windows Python 3.11

pip install nodai-shark -f https://nod-ai.github.io/SHARK/package-index/ -f https://llvm.github.io/torch-mlir/package-index/ -f  https://nod-ai.github.io/SRT/pip-release-links.html --extra-index-url https://download.pytorch.org/whl/nightly/cpu

Führen Sie Shark Tank -Modelltests durch.

pytest tank/test_models.py

In Tank/Readme.md finden Sie eine detailliertere Exemplar unserer PyTest Suite und CLI.

Laden Sie das rESNET50 -Beispiel herunter und führen Sie sie aus

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/resnet50_script.py
# Install deps for test script
pip install --pre torch torchvision torchaudio tqdm pillow gsutil --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./resnet50_script.py --device= " cpu "  # use cuda or vulkan or metal

Download und Ausführen von Bert (Minilm) Probe

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/minilm_jit.py
# Install deps for test script
pip install transformers torch --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./minilm_jit.py --device= " cpu "  # use cuda or vulkan or metal

Entwicklung, Test und Benchmarks

Wenn Sie Python3.11 und mit TF -Import -Tools verwenden USE_IREE=1

 # PYTHON=python3.11 VENV_DIR=0617_venv IMPORTER=1 ./setup_venv.sh

Führen Sie eines der Hunderte von Haifischtankmodellen über den Test -Framework durch

python -m  shark.examples.shark_inference.resnet50_script --device= " cpu " # Use gpu | vulkan
# Or a pytest
pytest tank/test_models.py -k " MiniLM "

So verwenden Sie Ihr lokal gebautes Iree / Torch-Mlir mit Hai

Wenn Sie ein Torch-Mlir-Entwickler oder ein IREE-Entwickler sind und lokale Änderungen testen möchten, können Sie die bereitgestellten Pakete mit pip uninstall torch-mlir und / oder pip uninstall iree-compiler iree-runtime Deinstallation Deinstallieren und mit Python-Bindungen aufbauen und Ihren Pythonpath wie für Iree und hier für Torch-Mlir einstellen.

So verwenden Sie Ihr lokal gebautes Torch-Mlir mit Hai:

1.) Run ` ./setup_venv.sh in SHARK ` and activate ` shark.venv ` virtual env.
2.) Run ` pip uninstall torch-mlir ` .
3.) Go to your local Torch-MLIR directory.
4.) Activate mlir_venv virtual envirnoment.
5.) Run ` pip uninstall -r requirements.txt ` .
6.) Run ` pip install -r requirements.txt ` .
7.) Build Torch-MLIR.
8.) Activate shark.venv virtual environment from the Torch-MLIR directory.
8.) Run ` export PYTHONPATH= ` pwd ` /build/tools/torch-mlir/python_packages/torch_mlir: ` pwd ` /examples ` in the Torch-MLIR directory.
9.) Go to the SHARK directory.

Jetzt wird der Hai Ihr lokales Fackel-Mlir-Repo verwenden.

Benchmarking -Versand

Um Benchmarks einzelner Versand zu erzeugen, können Sie Ihrem PyTest -Befehlszeilenargument addieren --dispatch_benchmarks=All --dispatch_benchmarks_dir=<output_dir> . Wenn Sie nur bestimmte Versender kompilieren möchten, können Sie sie mit einer von Speicherplatz getrennten Zeichenfolge anstelle von "All" angeben. EG --dispatch_benchmarks="0 1 2 10"

Zum Beispiel zum Generieren und Ausführen von Versandbenchmarks für Minilm auf CUDA:

 pytest -k "MiniLM and torch and static and cuda" --benchmark_dispatches=All -s --dispatch_benchmarks_dir=./my_dispatch_benchmarks

Der angegebene Befehl füllt <dispatch_benchmarks_dir>/<model_name>/ mit einer ordered_dispatches.txt , in der die Versand und deren Latenzen sowie Ordner für jeden Dispatch, der .Mlir, .vmfb und die Ergebnisse des Benchmarks für diesen Dispatch enthalten, auflistet und bestellt.

Wenn Sie dies stattdessen in ein Python -Skript einbeziehen möchten, können Sie bei der Initialisierung von SharkInference die Befehle dispatch_benchmarks und dispatch_benchmarks_dir übergeben, und die Benchmarks werden beim Zusammenstellen erzeugt. Z.B:

 shark_module = SharkInference(
        mlir_model,
        device=args.device,
        mlir_dialect="tm_tensor",
        dispatch_benchmarks="all",
        dispatch_benchmarks_dir="results"
    )

Die Ausgabe umfasst:

Eine bestellte Liste bestellte Dispatches.txt aller Versande mit ihrer Laufzeit
In dem angegebenen Verzeichnis gibt es ein Verzeichnis für jeden Versand (es werden MLIR -Dateien für alle Versand vorliegen, jedoch nur Binärdateien und Benchmark -Daten für die angegebenen Versande).
Eine .mlir -Datei mit dem Versandbenchmark enthält
Eine kompilierte .VMFB -Datei mit dem Versandbenchmark enthält
Eine .mlir -Datei mit nur der ausführbaren HAL -Datei
Eine zusammengestellte .VMFB -Datei der ausführbaren HAL -Datei
Eine .txt -Datei mit der Benchmark -Ausgabe enthält

Weitere Anweisungen zum Ausführen von Modelltests und Benchmarks aus dem Haifischtank finden Sie unter Tank/Readme.md.

API -Referenz

Hai -Inferenz -API


from shark.shark_importer import SharkImporter

# SharkImporter imports mlir file from the torch, tensorflow or tf-lite module.

mlir_importer = SharkImporter(
    torch_module,
    (input),
    frontend="torch",  #tf, #tf-lite
)
torch_mlir, func_name = mlir_importer.import_mlir(tracing_required=True)

# SharkInference accepts mlir in linalg, mhlo, and tosa dialect.

from shark.shark_inference import SharkInference
shark_module = SharkInference(torch_mlir, device="cpu", mlir_dialect="linalg")
shark_module.compile()
result = shark_module.forward((input))

Beispiel, das laufende MHLO IR zeigt.

 from shark.shark_inference import SharkInference
import numpy as np

mhlo_ir = r"""builtin.module  {
      func.func @forward(%arg0: tensor<1x4xf32>, %arg1: tensor<4x1xf32>) -> tensor<4x4xf32> {
        %0 = chlo.broadcast_add %arg0, %arg1 : (tensor<1x4xf32>, tensor<4x1xf32>) -> tensor<4x4xf32>
        %1 = "mhlo.abs"(%0) : (tensor<4x4xf32>) -> tensor<4x4xf32>
        return %1 : tensor<4x4xf32>
      }
}"""

arg0 = np.ones((1, 4)).astype(np.float32)
arg1 = np.ones((4, 1)).astype(np.float32)
shark_module = SharkInference(mhlo_ir, device="cpu", mlir_dialect="mhlo")
shark_module.compile()
result = shark_module.forward((arg0, arg1))

Beispiele mit der Rest -API

Setzen Sie Hai zur Verwendung mit Mixer ein
Einrichten von Hai zur Verwendung mit Koboldcpp

Unterstützte und validierte Modelle

Shark wird unterhalten, um die neuesten Innovationen in ML -Modellen zu unterstützen:

TF -Umarmungsface -Modelle	Shark-CPU	Haifisch-Cuda	Haifischmetall
Bert
Distilbert
Gpt2
BLÜHEN
Stabile Diffusion
Vision Transformator
Resnet50

Eine vollständige Liste der in Shark unterstützten Modelle finden Sie unter Tank/Readme.md.

Kommunikationskanäle

Shark Discord Server: Echtzeitgespräche mit dem Shark -Team und anderen Benutzern
GitHub -Probleme: Feature -Anfragen, Fehler usw.

Lizenz

Nod.ai Shark ist unter den Bestimmungen der Apache 2.0 -Lizenz mit LLVM -Ausnahmen lizenziert. Weitere Informationen finden Sie unter Lizenz.

Expandieren

Zusätzliche Informationen

Version nod.ai SHARK 20240531.1300
Typ Python
Aktualisierungszeit 2025-07-12
Größe 967.24KB
Kommt von Github

Ähnliche Anwendungen

PwR Studio

2024-11-14
langgraph studio

2024-11-09
DiffSynth Studio

2024-11-08
gb studio

2024-11-06
Alpha-Hai

2022-07-30
Kartenhai

2022-07-26

SHARK Studio

HAI

Installieren Sie Ihre Windows -Hardware -Treiber

Linux -Treiber

Schneller Start für die stabile Diffusion von Haien für Windows 10/11 Benutzer

Läuft

Stoppen

Erweiterte Installation (Windows, Linux und MacOS) für Entwickler

Windows 10/11 Benutzer

Schauen Sie sich den Code an

Wechseln Sie in den richtigen Zweig (wichtig!)

Richten Sie Ihre Python -Virtual -Umgebung und Ihre Abhängigkeiten ein

Windows 10/11 Benutzer

Lassen Sie das Installieren des Skripts in PowerShell ausführen

Setup Venv einrichten und die erforderlichen Pakete installieren (Torch-Mlir, Nodlabs/Hai, ...)

Linux / MacOS -Benutzer

Führen Sie eine stabile Diffusion auf Ihrem Gerät aus - Webui

Windows 10/11 Benutzer

Linux / MacOS -Benutzer

Zugang stabile Diffusion auf http: // localhost: 8080/? __TheMe = dunkel

Führen Sie eine stabile Diffusion auf Ihrem Gerät aus - Befehlszeile

Windows 10/11 Benutzer

Linux / MacOS -Benutzer

Richten Sie eine neue virtuelle PIP -Umgebung ein

Hai installieren

Führen Sie Shark Tank -Modelltests durch.

Laden Sie das rESNET50 -Beispiel herunter und führen Sie sie aus

Download und Ausführen von Bert (Minilm) Probe

Führen Sie eines der Hunderte von Haifischtankmodellen über den Test -Framework durch

So verwenden Sie Ihr lokal gebautes Iree / Torch-Mlir mit Hai

Benchmarking -Versand

Hai -Inferenz -API

Beispiel, das laufende MHLO IR zeigt.

Beispiele mit der Rest -API

Unterstützte und validierte Modelle

Kommunikationskanäle

Verwandte Projekte

Lizenz