Descargar SHARK Studio - Descargar el código fuente de SHARK Studio

SHARK Studio

Pitón

nod.ai SHARK 20240531.1300

Descargar

TIBURÓN

Distribución de aprendizaje automático de alto rendimiento

Actualmente estamos reconstruyendo tiburones para aprovechar la turbina. Hasta que eso esté completo, asegúrese de usar una versión .exe o un pago de la sucursal SHARK-1.0 , para un tiburón en funcionamiento

Prerrequisitos - Conductores

Instale sus controladores de hardware de Windows

[Usuarios de AMD RDNA] Descargue el último controlador (23.2.1 es el más antiguo admitido) aquí.
[Usuarios de MacOS] Descargue e instale el 1.3.216 Vulkan SDK desde aquí. Las versiones más nuevas del SDK no funcionarán.
[Usuarios de NVIDIA] Descargue e instale los últimos controladores Cuda / Vulkan desde aquí

Controladores de Linux

Los controladores MESA / RADV no funcionarán con FP16. Utilice los últimos controladores de AMGPU-Pro (los controladores que no son de PRO también no funcionarán) o los últimos controladores de Nvidia Linux.

Otros usuarios asegúrese de tener sus últimos controladores de proveedores y Vulkan SDK desde aquí y si está utilizando Vulkan Check vulkaninfo funciona en una ventana de terminal

Inicio rápido para la difusión estable de tiburones para usuarios de Windows 10/11

Instale el controlador desde (requisitos previos) [https://github.com/nod-ai/shark-studio#install-your-hardware-drivers] arriba

Descargue el lanzamiento estable o el prelanzamiento más reciente de Shark 1.0.

Haga doble clic en el .exe o ejecute desde la línea de comando (recomendado), y debe tener la interfaz de usuario en el navegador.

Si tiene modelos personalizados, colóquelos en un models/ directorio donde esté el .exe.

Disfrutar.

Más notas de instalación

* Le recomendamos que descargue EXE en una nueva carpeta, cada vez que descargue una nueva versión EXE. Si lo descarga en la misma carpeta que una instalación anterior, debe eliminar los viejos archivos ` *.vmfb` con` rm *.vmfb`. También puede usar el indicador `-CLEAR_ALL` una vez para limpiar todos los archivos antiguos. * Si recientemente actualizó el controlador o este binario (archivo exe), le recomendamos que borre todos los artefactos locales con `-CLEAR_All`

Correr

Abra un símbolo del sistema o terminal de PowerShell, cambie la carpeta ( cd ) a la carpeta .exe. Luego ejecute el exe desde el símbolo del sistema. De esa manera, si se produce un error, podrá cortarlo y pegarlo para pedir ayuda. (Si siempre funciona para usted sin error, simplemente puede hacer doble clic en EXE)
La primera ejecución puede tomar pocos minutos cuando se descargan y compilan los modelos. Tu paciencia es apreciada. La descarga podría ser de aproximadamente 5 GB.
Es probable que vea un mensaje de defensor de Windows que le pide que le dé permiso para abrir un puerto de servidor web. Acéptalo.
Abra un navegador para acceder al servidor web de difusión estable. Por defecto, el puerto es 8080, por lo que puede ir a http: // localhost: 8080/.
Si prefiere ejecutar siempre en el navegador, use el argumento del comando --ui=web al ejecutar EXE.

Parada

Seleccione el símbolo del sistema que ejecuta el exe. Presione CTRL-C y espere un momento o cierre el terminal.

Instalación avanzada (solo para desarrolladores)

Instalación avanzada (Windows, Linux y MacOS) para desarrolladores

Usuarios de Windows 10/11

Instale Git para Windows desde aquí si aún no lo tiene.

Mira el código

git clone https://github.com/nod-ai/SHARK.git
cd SHARK

Cambie a la rama correcta (¡importante!)

Actualmente, Shark está siendo reconstruido para la turbina en la rama main . Por ahora, se le desanima mucho el uso de main a menos que esté trabajando en el esfuerzo de reconstrucción, y no debe esperar que el código allí produzca una aplicación de trabajo para la generación de imágenes, por lo que por ahora necesitará cambiar a la rama SHARK-1.0 y usar el código estable.

git checkout SHARK-1.0

Las siguientes instrucciones de configuración suponen que está en esta rama.

Configuración de su Python VirtualEnvironment y Dependencias

Usuarios de Windows 10/11

Instale la última versión de Python 3.11.x desde aquí

Permita que el script de instalación se ejecute en PowerShell

 set-executionpolicy remotesigned

Configurar Venv e Instale los paquetes necesarios (Torch-Mlir, Nodlabs/Shark, ...)

. / setup_venv.ps1 # You can re-run this script to get the latest version

Usuarios de Linux / MacOS

./setup_venv.sh
source shark1.venv/bin/activate

Ejecute la difusión estable en su dispositivo - Webui

Usuarios de Windows 10/11

(shark1.venv) PS C:gshark > cd .appsstable_diffusionweb
(shark1.venv) PS C:gsharkappsstable_diffusionweb > python .index.py

Usuarios de Linux / MacOS

(shark1.venv) > cd apps/stable_diffusion/web
(shark1.venv) > python index.py

Acceso a la difusión estable en http: // localhost: 8080/? __Theme = oscuro

Ejecutar difusión estable en su dispositivo - línea de comandos

Usuarios de Windows 10/11

(shark1.venv) PS C:gshark > python .appsstable_diffusionscriptsmain.py -- app = " txt2img " -- precision = " fp16 " -- prompt = " tajmahal, snow, sunflowers, oil on canvas " -- device = " vulkan "

Usuarios de Linux / MacOS

python3.11 apps/stable_diffusion/scripts/main.py --app=txt2img --precision=fp16 --device=vulkan --prompt= " tajmahal, oil on canvas, sunflowers, 4k, uhd "

Puede reemplazar vulkan con cpu para ejecutar su CPU o con cuda para ejecutar en dispositivos CUDA. Si tiene múltiples dispositivos Vulkan, puede abordarlos con --device=vulkan://1 etc

La salida en un AMD 7900XTX se vería algo así como:

Average step time: 47.19188690185547ms/it
Clip Inference time (ms) = 109.531
VAE Inference time (ms): 78.590

Total image generation time: 2.5788655281066895sec

Aquí hay algunas muestras generadas:

Tajmahal, nieve, girasoles, aceite en lienzo_0

una foto de un cangrejo tocando una trompeta

Encuéntrenos en Shark Discord Server si tiene algún problema para ejecutarlo en su hardware.

Instalación binaria

Configurar un nuevo entorno virtual PIP

Este paso establece un nuevo VirtualEnv para Python

python --version # Check you have 3.11 on Linux, macOS or Windows Powershell
python -m venv shark_venv
source shark_venv/bin/activate   # Use shark_venv/Scripts/activate on Windows

# If you are using conda create and activate a new conda env

# Some older pip installs may not be able to handle the recent PyTorch deps
python -m pip install --upgrade pip

Usuarios de MacOS Metal Instale https://sdk.lunarg.com/sdk/download/latest/mac/vulkan-sdk.dmg y habilita la "instalación del sistema en todo el sistema"

Instalar tiburón

Este paso PIP instala tiburón y paquetes relacionados en Linux Python 3.8, 3.10 y 3.11 y MacOS / Windows Python 3.11

pip install nodai-shark -f https://nod-ai.github.io/SHARK/package-index/ -f https://llvm.github.io/torch-mlir/package-index/ -f  https://nod-ai.github.io/SRT/pip-release-links.html --extra-index-url https://download.pytorch.org/whl/nightly/cpu

Ejecutar pruebas de modelo de tanque de tiburón.

pytest tank/test_models.py

Vea Tank/Readme.md para un tutorial más detallado de nuestra suite y CLI de Pytest.

Descargar y ejecutar la muestra de resnet50

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/resnet50_script.py
# Install deps for test script
pip install --pre torch torchvision torchaudio tqdm pillow gsutil --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./resnet50_script.py --device= " cpu "  # use cuda or vulkan or metal

Descargar y ejecutar la muestra de Bert (minilm)

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/minilm_jit.py
# Install deps for test script
pip install transformers torch --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./minilm_jit.py --device= " cpu "  # use cuda or vulkan or metal

Desarrollo, pruebas y puntos de referencia

Si desea usar Python3.11 y con las herramientas de importación de TF, puede usar las variables de entorno como: set USE_IREE=1 para usar Iree ascendente

 # PYTHON=python3.11 VENV_DIR=0617_venv IMPORTER=1 ./setup_venv.sh

Ejecute cualquiera de los cientos de modelos de tanques de tiburones a través del marco de prueba

python -m  shark.examples.shark_inference.resnet50_script --device= " cpu " # Use gpu | vulkan
# Or a pytest
pytest tank/test_models.py -k " MiniLM "

Cómo usar su Irae / Torch-Mlir construido localmente con tiburón

Si usted es un desarrollador de Torch-Mlir o un desarrollador de Iree y desea probar los cambios locales, puede desinstalar los paquetes proporcionados con pip uninstall torch-mlir y / o pip uninstall iree-compiler iree-runtime y construir localmente con enlaces de Python y establecer su Pythonpath como se menciona aquí para IREE y aquí para Torch-Mlir.

Cómo usar su Torch-Mlir de construcción local con tiburón:

1.) Run ` ./setup_venv.sh in SHARK ` and activate ` shark.venv ` virtual env.
2.) Run ` pip uninstall torch-mlir ` .
3.) Go to your local Torch-MLIR directory.
4.) Activate mlir_venv virtual envirnoment.
5.) Run ` pip uninstall -r requirements.txt ` .
6.) Run ` pip install -r requirements.txt ` .
7.) Build Torch-MLIR.
8.) Activate shark.venv virtual environment from the Torch-MLIR directory.
8.) Run ` export PYTHONPATH= ` pwd ` /build/tools/torch-mlir/python_packages/torch_mlir: ` pwd ` /examples ` in the Torch-MLIR directory.
9.) Go to the SHARK directory.

Ahora el tiburón utilizará su repositorio de antorchas de construcción localmente.

Benchmarking despachos

Para producir puntos de referencia de despachos individuales, puede agregar --dispatch_benchmarks=All --dispatch_benchmarks_dir=<output_dir> a su argumento de línea de comandos Pytest. Si solo desea compilar despachos específicos, puede especificarlos con una cadena separada de espacio en lugar de "All" . Por ejemplo --dispatch_benchmarks="0 1 2 10"

Por ejemplo, para generar y ejecutar puntos de referencia de despacho para minilm en CUDA:

 pytest -k "MiniLM and torch and static and cuda" --benchmark_dispatches=All -s --dispatch_benchmarks_dir=./my_dispatch_benchmarks

El comando dado completará <dispatch_benchmarks_dir>/<model_name>/ con un ordered_dispatches.txt que enumera y ordena los despachos y sus latencias, así como carpetas para cada envío que contienen .mlir, .vmfb, y los resultados de la referencia para ese envío.

Si desea incorporar esto en un script de Python, puede pasar los comandos dispatch_benchmarks y dispatch_benchmarks_dir al inicializar SharkInference , y los puntos de referencia se generarán cuando se compilen. P.EJ:

 shark_module = SharkInference(
        mlir_model,
        device=args.device,
        mlir_dialect="tm_tensor",
        dispatch_benchmarks="all",
        dispatch_benchmarks_dir="results"
    )

La salida incluirá:

Una lista ordenada de discapacios ordenados.txt de todos los despachos con su tiempo de ejecución
Dentro del directorio especificado, habrá un directorio para cada envío (habrá archivos MLIR para todos los despachos, pero solo compiló binarios y datos de referencia para los envíos especificados)
Un archivo .mlir que contiene el punto de referencia de envío
Un archivo .vmfb compilado que contiene el punto de referencia de envío
Un archivo .mlir que contiene solo el ejecutable de HAL
Un archivo .vmfb compilado del ejecutable de HAL
Un archivo .txt que contiene salida de referencia

Consulte Tank/ReadMe.md para obtener más instrucciones sobre cómo ejecutar pruebas de modelo y puntos de referencia desde el tanque Shark.

Referencia de API

API de inferencia de tiburones


from shark.shark_importer import SharkImporter

# SharkImporter imports mlir file from the torch, tensorflow or tf-lite module.

mlir_importer = SharkImporter(
    torch_module,
    (input),
    frontend="torch",  #tf, #tf-lite
)
torch_mlir, func_name = mlir_importer.import_mlir(tracing_required=True)

# SharkInference accepts mlir in linalg, mhlo, and tosa dialect.

from shark.shark_inference import SharkInference
shark_module = SharkInference(torch_mlir, device="cpu", mlir_dialect="linalg")
shark_module.compile()
result = shark_module.forward((input))

Ejemplo demostrando ejecutar mhlo ir.

 from shark.shark_inference import SharkInference
import numpy as np

mhlo_ir = r"""builtin.module  {
      func.func @forward(%arg0: tensor<1x4xf32>, %arg1: tensor<4x1xf32>) -> tensor<4x4xf32> {
        %0 = chlo.broadcast_add %arg0, %arg1 : (tensor<1x4xf32>, tensor<4x1xf32>) -> tensor<4x4xf32>
        %1 = "mhlo.abs"(%0) : (tensor<4x4xf32>) -> tensor<4x4xf32>
        return %1 : tensor<4x4xf32>
      }
}"""

arg0 = np.ones((1, 4)).astype(np.float32)
arg1 = np.ones((4, 1)).astype(np.float32)
shark_module = SharkInference(mhlo_ir, device="cpu", mlir_dialect="mhlo")
shark_module.compile()
result = shark_module.forward((arg0, arg1))

Ejemplos utilizando la API REST

Configuración de tiburones para usar con licuadora
Configuración de tiburones para usar con koboldcpp

Modelos compatibles y validados

Shark se mantiene para apoyar las últimas innovaciones en modelos ML:

Modelos TF Huggingface	Tiburón	Tiburón	Tiburón
Bert
Distilbert
GPT2
FLORACIÓN
Difusión estable
Transformador de visión
Resnet50

Para obtener una lista completa de los modelos compatibles con Shark, consulte Tank/ReadMe.md.

Canales de comunicación

Shark Discord Server: discusiones en tiempo real con el equipo de Shark y otros usuarios
Problemas de Github: solicitudes de funciones, errores, etc.

Proyectos relacionados

Canales de proyecto Iree

Problemas ascendentes de Iree: solicitudes de funciones, errores y otros seguidores laborales
Servidor de discordia Irae Upstream: discusiones de desarrollo diario con el equipo principal y los colaboradores
Lista de correo electrónico de Irae-Discuss: anuncios, discusión general y de baja prioridad

Canales de proyecto MLIR y Torch-Mlir

#canal #torch-mlir en la discordia LLVM: este es el canal de comunicación más activo
Torch-Mlir Github Problemas aquí
Sección torch-mlir del discurso LLVM
Reuniones semanales los lunes a las 9 a.m. PST. Vea aquí para obtener más información.
Mlir Topic dentro de LLVM Discurso Shark y Iree se habilita y se basa en gran medida en MLIR.