Téléchargement SHARK Studio - Code source de SHARK Studio Télécharger

SHARK Studio

Python

nod.ai SHARK 20240531.1300

Télécharger

REQUIN

Distribution d'apprentissage automatique haute performance

Nous reconstruisons actuellement le requin pour profiter de la turbine. Jusqu'à ce que cela soit complet, assurez-vous d'utiliser une version .exe ou une caisse de la branche SHARK-1.0 , pour un requin de travail

Prérequis - Conducteurs

Installez vos pilotes de matériel Windows

[AMD ADNm utilisateurs] Téléchargez le dernier pilote (23.2.1 est le plus ancien pris en charge) ici.
[Utilisateurs de MacOS] Téléchargez et installez le SDK Vulkan 1.3.216 à partir d'ici. Les versions plus récentes du SDK ne fonctionneront pas.
[Utilisateurs de Nvidia] Téléchargez et installez les derniers pilotes CUDA / Vulkan à partir d'ici

Pilotes Linux

Les pilotes MESA / RADV ne fonctionneront pas avec FP16. Veuillez utiliser les derniers pilotes AMGPU-PRO (les pilotes non pro-OS ne fonctionneront pas non plus) ou les derniers pilotes NVIDIA Linux.

D'autres utilisateurs, veuillez vous assurer d'avoir vos derniers pilotes de fournisseurs et votre SDK Vulkan à partir d'ici et si vous utilisez Vulkan, vérifiez que vulkaninfo fonctionne dans une fenêtre de terminal

Démarrage rapide pour la diffusion stable des requins pour les utilisateurs de Windows 10/11

Installez le pilote à partir de (prérequis) [https://github.com/nod-ai/shark-studio#install-your-hardware-drivers] ci-dessus

Téléchargez la version stable ou le plus récent Shark 1.0 Pre-Release.

Double-cliquez sur .exe ou exécutez à partir de la ligne de commande (recommandée), et vous devriez avoir l'interface utilisateur dans le navigateur.

Si vous avez des modèles personnalisés, placez-les dans un models/ répertoire où se trouve le .exe.

Apprécier.

Plus de notes d'installation

* Nous vous recommandons de télécharger EXE dans un nouveau dossier, chaque fois que vous téléchargez une nouvelle version EXE. Si vous le téléchargez dans le même dossier qu'une installation précédente, vous devez supprimer les anciens fichiers `* .vmfb` avec` rm * .vmfb`. Vous pouvez également utiliser une seule fois `--Clear_ALL` pour nettoyer tous les anciens fichiers. * Si vous avez récemment mis à jour le pilote ou ce binaire (fichier EXE), nous vous recommandons d'effacer tous les artefacts locaux avec `--Clear_ALL`

En cours d'exécution

Ouvrez une invite de commande ou un terminal PowerShell, modifier le dossier ( cd ) dans le dossier .exe. Ensuite, exécutez l'EXE à partir de l'invite de commande. De cette façon, si une erreur se produit, vous pourrez le couper et le coup pour demander de l'aide. (Si cela fonctionne toujours pour vous sans erreur, vous pouvez simplement double-cliquez sur l'EXE)
La première course peut prendre quelques minutes lorsque les modèles sont téléchargés et compilés. Votre patience est appréciée. Le téléchargement pourrait être d'environ 5 Go.
Vous verrez probablement un message Windows Defender vous demandant de donner la permission d'ouvrir un port de serveur Web. L'acceptez.
Ouvrez un navigateur pour accéder au serveur Web de diffusion stable. Par défaut, le port est 8080, vous pouvez donc aller sur http: // localhost: 8080 /.
Si vous préférez toujours exécuter dans le navigateur, utilisez l'argument de la commande --ui=web lors de l'exécution de l'EXE.

Arrêt

Sélectionnez l'invite de commande qui exécute l'EXE. Appuyez sur Ctrl-C et attendez un instant ou fermez le terminal.

Installation avancée (uniquement pour les développeurs)

Installation avancée (Windows, Linux et MacOS) pour les développeurs

Utilisateurs de Windows 10/11

Installez Git pour Windows à partir d'ici si vous ne l'avez pas déjà.

Découvrez le code

git clone https://github.com/nod-ai/SHARK.git
cd SHARK

Passez à la branche correcte (importante!)

Actuellement, Shark est reconstruit pour la turbine sur la branche main . Pour l'instant, vous êtes fortement découragé d'utiliser main à moins que vous ne travailliez sur l'effort de reconstruction, et ne devez pas vous attendre à ce que le code produise une application de travail pour la génération d'images, donc pour l'instant vous aurez besoin de passer à la branche SHARK-1.0 et d'utiliser le code stable.

git checkout SHARK-1.0

Les instructions de configuration suivantes supposent que vous êtes sur cette branche.

Configurez votre VirtualEnvironment et vos dépendances Python

Utilisateurs de Windows 10/11

Installez la dernière version Python 3.11.x à partir d'ici

Permettez au script d'installation de s'exécuter dans PowerShell

 set-executionpolicy remotesigned

Configurez Venv et installez les packages nécessaires (torch-mlir, nodlabs / requin, ...)

. / setup_venv.ps1 # You can re-run this script to get the latest version

Utilisateurs de Linux / MacOS

./setup_venv.sh
source shark1.venv/bin/activate

Exécutez une diffusion stable sur votre appareil - webui

Utilisateurs de Windows 10/11

(shark1.venv) PS C:gshark > cd .appsstable_diffusionweb
(shark1.venv) PS C:gsharkappsstable_diffusionweb > python .index.py

Utilisateurs de Linux / MacOS

(shark1.venv) > cd apps/stable_diffusion/web
(shark1.venv) > python index.py

Accédez à une diffusion stable sur http: // localhost: 8080 /? __Theme = sombre

Exécutez une diffusion stable sur votre appareil - ligne de commande

Utilisateurs de Windows 10/11

(shark1.venv) PS C:gshark > python .appsstable_diffusionscriptsmain.py -- app = " txt2img " -- precision = " fp16 " -- prompt = " tajmahal, snow, sunflowers, oil on canvas " -- device = " vulkan "

Utilisateurs de Linux / MacOS

python3.11 apps/stable_diffusion/scripts/main.py --app=txt2img --precision=fp16 --device=vulkan --prompt= " tajmahal, oil on canvas, sunflowers, 4k, uhd "

Vous pouvez remplacer vulkan par cpu pour fonctionner sur votre CPU ou par cuda pour fonctionner sur des appareils CUDA. Si vous avez plusieurs appareils Vulkan, vous pouvez les résoudre avec --device=vulkan://1 etc

La sortie sur un AMD 7900xtx ressemblerait à quelque chose comme:

Average step time: 47.19188690185547ms/it
Clip Inference time (ms) = 109.531
VAE Inference time (ms): 78.590

Total image generation time: 2.5788655281066895sec

Voici quelques échantillons générés:

Tajmahal, neige, tournesols, huile sur toile_0

Une photo d'un crabe jouant une trompette

Trouvez-nous sur Shark Discord Server si vous avez du mal à l'exécuter sur votre matériel.

Installation binaire

Configurer un nouvel environnement virtuel PIP

Cette étape met en place un nouveau virtualenv pour python

python --version # Check you have 3.11 on Linux, macOS or Windows Powershell
python -m venv shark_venv
source shark_venv/bin/activate   # Use shark_venv/Scripts/activate on Windows

# If you are using conda create and activate a new conda env

# Some older pip installs may not be able to handle the recent PyTorch deps
python -m pip install --upgrade pip

Les utilisateurs de MacOS Metal Veuillez installer https://sdk.lunarg.com/sdk/download/latest/mac/vulkan-sdk.dmg et activer "Installer à l'échelle du système"

Installer le requin

Cette étape PIP installe des packages de requin et connexes sur Linux Python 3.8, 3.10 et 3.11 et MacOS / Windows Python 3.11

pip install nodai-shark -f https://nod-ai.github.io/SHARK/package-index/ -f https://llvm.github.io/torch-mlir/package-index/ -f  https://nod-ai.github.io/SRT/pip-release-links.html --extra-index-url https://download.pytorch.org/whl/nightly/cpu

Exécutez des tests de modèle de réservoir de requin.

pytest tank/test_models.py

Voir Tank / Readme.md pour une procédure pas à pas plus détaillée de notre suite Pytest et CLI.

Télécharger et exécuter Resnet50 Exemple

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/resnet50_script.py
# Install deps for test script
pip install --pre torch torchvision torchaudio tqdm pillow gsutil --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./resnet50_script.py --device= " cpu "  # use cuda or vulkan or metal

Télécharger et exécuter Bert (Minilm) Exemple

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/minilm_jit.py
# Install deps for test script
pip install transformers torch --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./minilm_jit.py --device= " cpu "  # use cuda or vulkan or metal

Développement, tests et références

Si vous souhaitez utiliser Python3.11 et avec des outils d'importation TF, vous pouvez utiliser les variables d'environnement comme: set USE_IREE=1 pour utiliser en amont iree

 # PYTHON=python3.11 VENV_DIR=0617_venv IMPORTER=1 ./setup_venv.sh

Exécutez l'une des centaines de modèles de réservoirs de requin via le cadre de test

python -m  shark.examples.shark_inference.resnet50_script --device= " cpu " # Use gpu | vulkan
# Or a pytest
pytest tank/test_models.py -k " MiniLM "

Comment utiliser votre IREE / TORCH-MLIR construit localement avec Shark

Si vous êtes un développeur Torch-Mlir ou un développeur Iree et que vous souhaitez tester les modifications locales, vous pouvez désinstaller les packages fournis avec pip uninstall torch-mlir et / ou pip uninstall iree-compiler iree-runtime et construire localement avec Python Bindings et définir votre PythonPath comme mentionné ici pour IREE et ici pour Torch-Mlir.

Comment utiliser votre torch-mlir construit localement avec le requin:

1.) Run ` ./setup_venv.sh in SHARK ` and activate ` shark.venv ` virtual env.
2.) Run ` pip uninstall torch-mlir ` .
3.) Go to your local Torch-MLIR directory.
4.) Activate mlir_venv virtual envirnoment.
5.) Run ` pip uninstall -r requirements.txt ` .
6.) Run ` pip install -r requirements.txt ` .
7.) Build Torch-MLIR.
8.) Activate shark.venv virtual environment from the Torch-MLIR directory.
8.) Run ` export PYTHONPATH= ` pwd ` /build/tools/torch-mlir/python_packages/torch_mlir: ` pwd ` /examples ` in the Torch-MLIR directory.
9.) Go to the SHARK directory.

Maintenant, le requin utilisera votre dépôt de torch-mlir à construire localement.

Dépêches d'analyse comparative

Pour produire des benchmarks de répartitions individuelles, vous pouvez ajouter --dispatch_benchmarks=All --dispatch_benchmarks_dir=<output_dir> à votre argument de ligne de commande pytest. Si vous souhaitez seulement compiler des réparations spécifiques, vous pouvez les spécifier avec une chaîne séparée d'espace au lieu de "All" . Par exemple --dispatch_benchmarks="0 1 2 10"

Par exemple, pour générer et exécuter des références d'expédition pour le miniil sur Cuda:

 pytest -k "MiniLM and torch and static and cuda" --benchmark_dispatches=All -s --dispatch_benchmarks_dir=./my_dispatch_benchmarks

La commande donnée remplira <dispatch_benchmarks_dir>/<model_name>/ avec un ordered_dispatches.txt qui répertorie et ordonne les répartitions et leurs latences, ainsi que des dossiers pour chaque répartition qui contiennent .mlir, .vmfb et les résultats de la référence pour cette répartition.

Si vous souhaitez plutôt incorporer cela dans un script Python, vous pouvez passer les commandes dispatch_benchmarks et dispatch_benchmarks_dir lors de l'initialisation SharkInference , et les repères seront générés lors de la compilation. Par exemple:

 shark_module = SharkInference(
        mlir_model,
        device=args.device,
        mlir_dialect="tm_tensor",
        dispatch_benchmarks="all",
        dispatch_benchmarks_dir="results"
    )

La sortie comprendra:

Une liste ordonnée ordonnée-disspatches.txt de tous les dépêches avec leur runtime
À l'intérieur du répertoire spécifié, il y aura un répertoire pour chaque répartition (il y aura des fichiers MLIR pour toutes les dépêches, mais uniquement des binaires compilés et des données de référence pour les dépêches spécifiées)
Un fichier .mlir contenant le benchmark de répartition
Un fichier .vmfb compilé contenant le benchmark de répartition
Un fichier .mlir contenant uniquement l'exécutable HAL
Un fichier .vmfb compilé de l'exécutable HAL
Un fichier .txt contenant une sortie de référence

Voir Tank / Readme.md pour d'autres instructions sur la façon d'exécuter des tests de modèle et des références du réservoir de requin.

Référence de l'API

API d'inférence du requin


from shark.shark_importer import SharkImporter

# SharkImporter imports mlir file from the torch, tensorflow or tf-lite module.

mlir_importer = SharkImporter(
    torch_module,
    (input),
    frontend="torch",  #tf, #tf-lite
)
torch_mlir, func_name = mlir_importer.import_mlir(tracing_required=True)

# SharkInference accepts mlir in linalg, mhlo, and tosa dialect.

from shark.shark_inference import SharkInference
shark_module = SharkInference(torch_mlir, device="cpu", mlir_dialect="linalg")
shark_module.compile()
result = shark_module.forward((input))

Exemple démontrant l'exécution de mhlo ir.

 from shark.shark_inference import SharkInference
import numpy as np

mhlo_ir = r"""builtin.module  {
      func.func @forward(%arg0: tensor<1x4xf32>, %arg1: tensor<4x1xf32>) -> tensor<4x4xf32> {
        %0 = chlo.broadcast_add %arg0, %arg1 : (tensor<1x4xf32>, tensor<4x1xf32>) -> tensor<4x4xf32>
        %1 = "mhlo.abs"(%0) : (tensor<4x4xf32>) -> tensor<4x4xf32>
        return %1 : tensor<4x4xf32>
      }
}"""

arg0 = np.ones((1, 4)).astype(np.float32)
arg1 = np.ones((4, 1)).astype(np.float32)
shark_module = SharkInference(mhlo_ir, device="cpu", mlir_dialect="mhlo")
shark_module.compile()
result = shark_module.forward((arg0, arg1))

Exemples utilisant l'API REST

Configuration du requin pour une utilisation avec Blender
Configuration du requin pour une utilisation avec koboldcpp

Modèles pris en charge et validé

Shark est maintenu pour soutenir les dernières innovations dans les modèles ML:

Modèles TF HuggingFace	Requin-CPU	Requin-cuda	Mital de requin
Bert
Distilbert
Gpt2
FLORAISON
Diffusion stable
Transformateur de vision
Resnet50

Pour une liste complète des modèles pris en charge dans Shark, veuillez vous référer à Tank / Readme.md.

Canaux de communication

Serveur de discorde de requin: discussions en temps réel avec l'équipe de requins et d'autres utilisateurs
Problèmes de github: demandes de fonctionnalités, bogues, etc.

Projets connexes

Canaux du projet Iree

Problèmes IREE en amont: Demandes de fonctionnalités, bogues et autres suivi du travail
Serveur de discorde Iree en amont: discussions quotidiennes de développement avec l'équipe de base et les collaborateurs
Liste des e-mails Iree-Discuss: annonces, discussion générale et faible priorité

Canaux du projet MLIR et TORCH-MLIR

#torch-mlir sur la discorde LLVM - c'est le canal de communication le plus actif
Torch-Mlir Github Problèmes ici
Section torch-mlir du discours LLVM
Réunions hebdomadaires le lundi à 9h PST. Voir ici pour plus d'informations.
Le sujet Mlir dans LLVM Discourse Shark et Iree sont activés par et s'appuient fortement sur Mlir.