ดาวน์โหลด SHARK Studio - SHARK Studio Source Source Download

SHARK Studio

หลาม

nod.ai SHARK 20240531.1300

ดาวน์โหลด

ฉลาม

การกระจายการเรียนรู้ของเครื่องประสิทธิภาพสูง

ขณะนี้เรากำลังสร้างฉลามใหม่เพื่อใช้ประโยชน์จากกังหัน จนกว่าจะเสร็จสมบูรณ์ตรวจสอบให้แน่ใจว่าคุณใช้การเปิดตัว. exe หรือการชำระเงินของสาขา SHARK-1.0 สำหรับฉลามที่ใช้งานได้

วิชาบังคับก่อน - ไดรเวอร์

ติดตั้งไดรเวอร์ฮาร์ดแวร์ Windows ของคุณ

[ผู้ใช้ AMD rDNA] ดาวน์โหลดไดรเวอร์ล่าสุด (23.2.1 เป็นผู้สนับสนุนที่เก่าแก่ที่สุด) ที่นี่
[ผู้ใช้ MacOS] ดาวน์โหลดและติดตั้ง 1.3.216 Vulkan SDK จากที่นี่ SDK รุ่นใหม่จะไม่ทำงาน
[ผู้ใช้ Nvidia] ดาวน์โหลดและติดตั้งไดรเวอร์ CUDA / Vulkan ล่าสุดจากที่นี่

ไดรเวอร์ Linux

ไดรเวอร์ MESA / RADV จะไม่ทำงานกับ FP16 โปรดใช้ไดรเวอร์ AMGPU-PRO ล่าสุด (ไดรเวอร์ที่ไม่ใช่ Pro OSS ยังไม่ทำงาน) หรือไดรเวอร์ Nvidia Linux ล่าสุด

ผู้ใช้รายอื่นโปรดตรวจสอบให้แน่ใจว่าคุณมีไดรเวอร์ผู้ขายล่าสุดและ Vulkan SDK จากที่นี่และหากคุณใช้ Vulkan Check vulkaninfo ทำงานในหน้าต่างเทอร์มินัล

เริ่มต้นอย่างรวดเร็วสำหรับการแพร่กระจายของ Shark Stable สำหรับผู้ใช้ Windows 10/11

ติดตั้งไดรเวอร์จาก (ข้อกำหนดเบื้องต้น) [https://github.com/nod-ai/shark-studio#install-your-hardware-drivers] ด้านบน

ดาวน์โหลดการเปิดตัวที่เสถียรหรือการเปิดตัว Shark 1.0 ล่าสุด

ดับเบิลคลิกที่. exe หรือเรียกใช้จากบรรทัดคำสั่ง (แนะนำ) และคุณควรมี UI ในเบราว์เซอร์

หากคุณมีโมเดลที่กำหนดเองวางไว้ใน models/ ไดเรกทอรีที่. exe คือ

สนุก.

บันทึกการติดตั้งเพิ่มเติม

* เราขอแนะนำให้คุณดาวน์โหลด exe ในโฟลเดอร์ใหม่เมื่อใดก็ตามที่คุณดาวน์โหลดเวอร์ชัน EXE ใหม่ หากคุณดาวน์โหลดในโฟลเดอร์เดียวกันกับการติดตั้งก่อนหน้านี้คุณต้องลบไฟล์ ` *.vmfb` เก่าด้วย` rm *.vmfb` นอกจากนี้คุณยังสามารถใช้ `-clear_all` ตั้งค่าสถานะหนึ่งครั้งเพื่อทำความสะอาดไฟล์เก่าทั้งหมด * หากคุณเพิ่งอัปเดตไดรเวอร์หรือไบนารี (ไฟล์ exe) เมื่อเร็ว ๆ นี้เราขอแนะนำให้คุณล้างสิ่งประดิษฐ์ท้องถิ่นทั้งหมดด้วย `-clear_all`

วิ่ง

เปิดคำสั่งพรอมต์หรือเทอร์มินัล PowerShell เปลี่ยนโฟลเดอร์ ( cd ) เป็นโฟลเดอร์. exe จากนั้นเรียกใช้ exe จากพรอมต์คำสั่ง ด้วยวิธีนี้หากเกิดข้อผิดพลาดคุณจะสามารถตัดและวางเพื่อขอความช่วยเหลือได้ (ถ้ามันใช้งานได้กับคุณเสมอโดยไม่มีข้อผิดพลาดคุณอาจดับเบิลคลิกที่ exe)
การเรียกใช้ครั้งแรกอาจใช้เวลาไม่กี่นาทีเมื่อมีการดาวน์โหลดและรวบรวมโมเดล ความอดทนของคุณได้รับการชื่นชม การดาวน์โหลดอาจเป็นประมาณ 5GB
คุณจะเห็นข้อความ Windows Defender ขอให้คุณอนุญาตให้เปิดพอร์ตเว็บเซิร์ฟเวอร์ ยอมรับมัน
เปิดเบราว์เซอร์เพื่อเข้าถึงเว็บเซิร์ฟเวอร์การแพร่กระจายที่เสถียร โดยค่าเริ่มต้นพอร์ตคือ 8080 ดังนั้นคุณสามารถไปที่ http: // localhost: 8080/
หากคุณต้องการทำงานในเบราว์เซอร์เสมอให้ใช้อาร์กิวเมนต์ --ui=web คำสั่งเมื่อเรียกใช้ EXE

การหยุด

เลือกพรอมต์คำสั่งที่เรียกใช้ exe กด CTRL-C แล้วรอสักครู่หรือปิดเทอร์มินัล

การติดตั้งขั้นสูง (สำหรับนักพัฒนาเท่านั้น)

การติดตั้งขั้นสูง (Windows, Linux และ MacOS) สำหรับนักพัฒนา

ผู้ใช้ Windows 10/11

ติดตั้ง Git สำหรับ Windows จากที่นี่หากคุณยังไม่มี

ตรวจสอบรหัส

git clone https://github.com/nod-ai/SHARK.git
cd SHARK

เปลี่ยนไปใช้สาขาที่ถูกต้อง (สำคัญ!)

ปัจจุบันฉลามกำลังถูกสร้างใหม่สำหรับกังหันในสาขา main สำหรับตอนนี้คุณท้อแท้อย่างยิ่งจากการใช้ main เว้นแต่คุณกำลังทำงานเกี่ยวกับความพยายามสร้างใหม่และไม่ควรคาดหวังว่ารหัสที่นั่นจะสร้างแอปพลิเคชันที่ใช้งานได้สำหรับการสร้างภาพดังนั้นตอนนี้คุณจะต้องสลับไปยังสาขา SHARK-1.0 และใช้รหัสที่เสถียร

git checkout SHARK-1.0

คำแนะนำการตั้งค่าต่อไปนี้ถือว่าคุณอยู่ในสาขานี้

ตั้งค่า Python VirtualEnvironment และการพึ่งพา

ผู้ใช้ Windows 10/11

ติดตั้งเวอร์ชัน Python 3.11.x ล่าสุดจากที่นี่

อนุญาตให้สคริปต์ติดตั้งทำงานใน PowerShell

 set-executionpolicy remotesigned

ตั้งค่า Venv และติดตั้งแพ็คเกจที่จำเป็น (Torch-MLIR, NodLabs/Shark, ... )

. / setup_venv.ps1 # You can re-run this script to get the latest version

ผู้ใช้ Linux / MacOS

./setup_venv.sh
source shark1.venv/bin/activate

เรียกใช้การแพร่กระจายที่เสถียรบนอุปกรณ์ของคุณ - webui

ผู้ใช้ Windows 10/11

(shark1.venv) PS C:gshark > cd .appsstable_diffusionweb
(shark1.venv) PS C:gsharkappsstable_diffusionweb > python .index.py

ผู้ใช้ Linux / MacOS

(shark1.venv) > cd apps/stable_diffusion/web
(shark1.venv) > python index.py

เข้าถึงการแพร่กระจายที่เสถียรบน http: // localhost: 8080/? __theme = มืด

เรียกใช้การแพร่กระจายที่เสถียรบนอุปกรณ์ของคุณ - commandline

ผู้ใช้ Windows 10/11

(shark1.venv) PS C:gshark > python .appsstable_diffusionscriptsmain.py -- app = " txt2img " -- precision = " fp16 " -- prompt = " tajmahal, snow, sunflowers, oil on canvas " -- device = " vulkan "

ผู้ใช้ Linux / MacOS

python3.11 apps/stable_diffusion/scripts/main.py --app=txt2img --precision=fp16 --device=vulkan --prompt= " tajmahal, oil on canvas, sunflowers, 4k, uhd "

คุณสามารถแทนที่ vulkan ด้วย cpu เพื่อทำงานบน CPU หรือ cuda เพื่อทำงานบนอุปกรณ์ CUDA หากคุณมีอุปกรณ์ Vulkan หลายตัวคุณสามารถจัดการได้ด้วย --device=vulkan://1 ฯลฯ

เอาต์พุตของ AMD 7900XTX จะมีลักษณะเช่น:

Average step time: 47.19188690185547ms/it
Clip Inference time (ms) = 109.531
VAE Inference time (ms): 78.590

Total image generation time: 2.5788655281066895sec

นี่คือตัวอย่างบางส่วนที่สร้างขึ้น:

Tajmahal, หิมะ, ดอกทานตะวัน, น้ำมันบน Canvas_0

รูปปูที่เล่นทรัมเป็ต

ค้นหาเราบน Shark Discord Server หากคุณมีปัญหาใด ๆ กับการรันบนฮาร์ดแวร์ของคุณ

การติดตั้งแบบไบนารี

ตั้งค่าสภาพแวดล้อมเสมือนจริง PIP ใหม่

ขั้นตอนนี้ตั้งค่า virtualenv ใหม่สำหรับ Python

python --version # Check you have 3.11 on Linux, macOS or Windows Powershell
python -m venv shark_venv
source shark_venv/bin/activate   # Use shark_venv/Scripts/activate on Windows

# If you are using conda create and activate a new conda env

# Some older pip installs may not be able to handle the recent PyTorch deps
python -m pip install --upgrade pip

ผู้ใช้ MacOS Metal โปรดติดตั้ง https://sdk.lunarg.com/sdk/download/latest/mac/vulkan-sdk.dmg และเปิดใช้งาน "System Wide Install"

ติดตั้งฉลาม

PIP ขั้นตอนนี้ติดตั้งฉลามและแพ็คเกจที่เกี่ยวข้องบน Linux Python 3.8, 3.10 และ 3.11 และ MacOS / Windows Python 3.11

pip install nodai-shark -f https://nod-ai.github.io/SHARK/package-index/ -f https://llvm.github.io/torch-mlir/package-index/ -f  https://nod-ai.github.io/SRT/pip-release-links.html --extra-index-url https://download.pytorch.org/whl/nightly/cpu

เรียกใช้การทดสอบแบบจำลองถังฉลาม

pytest tank/test_models.py

ดู Tank/Readme.md สำหรับคำแนะนำที่ละเอียดยิ่งขึ้นของชุด Pytest และ CLI ของเรา

ดาวน์โหลดและเรียกใช้ตัวอย่าง resnet50

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/resnet50_script.py
# Install deps for test script
pip install --pre torch torchvision torchaudio tqdm pillow gsutil --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./resnet50_script.py --device= " cpu "  # use cuda or vulkan or metal

ตัวอย่างดาวน์โหลดและเรียกใช้ Bert (MINILM)

curl -O https://raw.githubusercontent.com/nod-ai/SHARK/main/shark/examples/shark_inference/minilm_jit.py
# Install deps for test script
pip install transformers torch --extra-index-url https://download.pytorch.org/whl/nightly/cpu
python ./minilm_jit.py --device= " cpu "  # use cuda or vulkan or metal

พัฒนาการทดสอบและมาตรฐาน

หากคุณต้องการใช้ Python3.11 และด้วยเครื่องมือนำเข้า TF คุณสามารถใช้ตัวแปรสภาพแวดล้อมเช่น: SET USE_IREE=1 เพื่อใช้ IREE อัปสตรีม

 # PYTHON=python3.11 VENV_DIR=0617_venv IMPORTER=1 ./setup_venv.sh

เรียกใช้รถถังฉลามหลายร้อยรุ่นผ่านเฟรมเวิร์กทดสอบ

python -m  shark.examples.shark_inference.resnet50_script --device= " cpu " # Use gpu | vulkan
# Or a pytest
pytest tank/test_models.py -k " MiniLM "

วิธีใช้ iree / Torch-MLIR ที่สร้างขึ้นในพื้นที่ของคุณกับฉลาม

หากคุณเป็น นักพัฒนาคบเพลิง-MLIR หรือนักพัฒนา Iree และต้องการทดสอบการเปลี่ยนแปลงในท้องถิ่นคุณสามารถถอนการติดตั้งแพ็คเกจที่ให้ไว้ด้วย pip uninstall torch-mlir MLIR และ / หรือ pip uninstall iree-compiler iree-runtime และสร้างในท้องถิ่น

วิธีใช้คบเพลิงที่สร้างขึ้นในพื้นที่กับฉลาม:

1.) Run ` ./setup_venv.sh in SHARK ` and activate ` shark.venv ` virtual env.
2.) Run ` pip uninstall torch-mlir ` .
3.) Go to your local Torch-MLIR directory.
4.) Activate mlir_venv virtual envirnoment.
5.) Run ` pip uninstall -r requirements.txt ` .
6.) Run ` pip install -r requirements.txt ` .
7.) Build Torch-MLIR.
8.) Activate shark.venv virtual environment from the Torch-MLIR directory.
8.) Run ` export PYTHONPATH= ` pwd ` /build/tools/torch-mlir/python_packages/torch_mlir: ` pwd ` /examples ` in the Torch-MLIR directory.
9.) Go to the SHARK directory.

ตอนนี้ฉลามจะใช้ Repo Torch-MLIR ในพื้นที่ของคุณ

การเปรียบเทียบ

ในการสร้างเกณฑ์มาตรฐานของการจัดส่งแต่ละรายการคุณสามารถเพิ่ม --dispatch_benchmarks=All --dispatch_benchmarks_dir=<output_dir> ไปยังอาร์กิวเมนต์บรรทัดคำสั่ง pytest ของคุณ หากคุณต้องการรวบรวมเฉพาะการจัดส่งเฉพาะคุณสามารถระบุได้ด้วยสตริงที่แยกออกจากกันแทน "All" เช่น --dispatch_benchmarks="0 1 2 10"

ตัวอย่างเช่นในการสร้างและเรียกใช้มาตรฐานการจัดส่งสำหรับ minilm บน cuda:

 pytest -k "MiniLM and torch and static and cuda" --benchmark_dispatches=All -s --dispatch_benchmarks_dir=./my_dispatch_benchmarks

คำสั่งที่กำหนดจะเติม <dispatch_benchmarks_dir>/<model_name>/ ด้วย ordered_dispatches.txt ที่แสดงรายการและสั่งซื้อ dispatches และเวลาแฝงของพวกเขารวมถึงโฟลเดอร์สำหรับการจัดส่งแต่ละรายการ

หากคุณต้องการรวมสิ่งนี้ลงในสคริปต์ Python คุณสามารถส่งคำสั่ง dispatch_benchmarks และ dispatch_benchmarks_dir เมื่อเริ่มต้นการเริ่มต้น SharkInference และมาตรฐานจะถูกสร้างขึ้นเมื่อรวบรวม เช่น:

 shark_module = SharkInference(
        mlir_model,
        device=args.device,
        mlir_dialect="tm_tensor",
        dispatch_benchmarks="all",
        dispatch_benchmarks_dir="results"
    )

ผลลัพธ์จะรวมถึง:

รายการที่สั่งซื้อสั่งซื้อ dispatches.txt ของการจัดส่งทั้งหมดด้วยรันไทม์ของพวกเขา
ภายในไดเรกทอรีที่ระบุจะมีไดเรกทอรีสำหรับการจัดส่งแต่ละรายการ (จะมีไฟล์ MLIR สำหรับการจัดส่งทั้งหมด แต่มีเฉพาะไบนารีที่รวบรวมและข้อมูลมาตรฐานสำหรับการจัดส่งที่ระบุ)
ไฟล์. mLir ที่มีเกณฑ์มาตรฐานการจัดส่ง
ไฟล์. vmfb ที่คอมไพล์ที่มีเกณฑ์มาตรฐานการจัดส่ง
ไฟล์. MLIR ที่มีเพียง HAL ที่เรียกใช้งานได้
ไฟล์. vmfb ที่รวบรวมได้ของ HAL ที่เรียกใช้งานได้
ไฟล์. txt ที่มีเอาต์พุตมาตรฐาน

ดู Tank/Readme.MD สำหรับคำแนะนำเพิ่มเติมเกี่ยวกับวิธีเรียกใช้การทดสอบแบบจำลองและมาตรฐานจาก Shark Tank

การอ้างอิง API

การอนุมานฉลาม API


from shark.shark_importer import SharkImporter

# SharkImporter imports mlir file from the torch, tensorflow or tf-lite module.

mlir_importer = SharkImporter(
    torch_module,
    (input),
    frontend="torch",  #tf, #tf-lite
)
torch_mlir, func_name = mlir_importer.import_mlir(tracing_required=True)

# SharkInference accepts mlir in linalg, mhlo, and tosa dialect.

from shark.shark_inference import SharkInference
shark_module = SharkInference(torch_mlir, device="cpu", mlir_dialect="linalg")
shark_module.compile()
result = shark_module.forward((input))

ตัวอย่างแสดงให้เห็นถึงการรัน MHLO IR

 from shark.shark_inference import SharkInference
import numpy as np

mhlo_ir = r"""builtin.module  {
      func.func @forward(%arg0: tensor<1x4xf32>, %arg1: tensor<4x1xf32>) -> tensor<4x4xf32> {
        %0 = chlo.broadcast_add %arg0, %arg1 : (tensor<1x4xf32>, tensor<4x1xf32>) -> tensor<4x4xf32>
        %1 = "mhlo.abs"(%0) : (tensor<4x4xf32>) -> tensor<4x4xf32>
        return %1 : tensor<4x4xf32>
      }
}"""

arg0 = np.ones((1, 4)).astype(np.float32)
arg1 = np.ones((4, 1)).astype(np.float32)
shark_module = SharkInference(mhlo_ir, device="cpu", mlir_dialect="mhlo")
shark_module.compile()
result = shark_module.forward((arg0, arg1))

ตัวอย่างการใช้ส่วนที่เหลือ API

การตั้งค่าฉลามสำหรับใช้กับเครื่องปั่น
การตั้งค่าฉลามสำหรับใช้กับ koboldcpp

โมเดลที่ได้รับการสนับสนุนและผ่านการตรวจสอบ

ฉลามได้รับการบำรุงรักษาเพื่อสนับสนุนนวัตกรรมล่าสุดในรุ่น ML:

TF HuggingFace Models	ปลาฉลาม -CPU	ปลาฉลาม	โลหะฉลาม
เบิร์ต
กลั่นกรอง
GPT2
ผลิบาน
การแพร่กระจายที่มั่นคง
หม้อแปลงวิสัยทัศน์
resnet50

สำหรับรายการที่สมบูรณ์ของรุ่นที่รองรับใน Shark โปรดดูที่ Tank/Readme.md

ช่องทางการสื่อสาร

Shark Discord Server: การสนทนาแบบเรียลไทม์กับทีมฉลามและผู้ใช้รายอื่น
ปัญหา GitHub: คำขอคุณสมบัติข้อบกพร่อง ฯลฯ

โครงการที่เกี่ยวข้อง

ช่องโครงการ iree

ปัญหา Iree ต้นน้ำ: คำขอคุณสมบัติข้อบกพร่องและการติดตามงานอื่น ๆ
Upstream Iree Discord Server: การหารือการพัฒนารายวันกับทีมหลักและผู้ทำงานร่วมกัน
รายการอีเมล iree-discuss: ประกาศการสนทนาทั่วไปและลำดับความสำคัญต่ำ

ช่องทางโครงการ MLIR และ TORCH-MLIR

#torch-mlir บน LLVM Discord - นี่คือช่องทางการสื่อสารที่ใช้งานมากที่สุด
Torch-MLIR GitHub ปัญหาที่นี่
ส่วน torch-mlir ของวาทกรรม LLVM
การประชุมประจำสัปดาห์ในวันจันทร์ 9.00 น. PST ดูที่นี่สำหรับข้อมูลเพิ่มเติม
หัวข้อ MLIR ภายใน LLVM Discourse Shark และ Iree เปิดใช้งานและอาศัย MLIR อย่างหนัก