Download aphrodite engine - Unduh Kode Sumber aphrodite engine

aphrodite engine

Kode Sumber AI

v0.6.5

Unduh

Menghembuskan kehidupan ke dalam bahasa

Aphrodite adalah mesin backend resmi untuk Pygmalionai. Ini dirancang untuk berfungsi sebagai titik akhir inferensi untuk situs web Pygmalionai, dan untuk memungkinkan melayani model yang kompatibel dengan wajah memeluk sejumlah besar pengguna dengan kecepatan cepat yang menyala (berkat perhatian Paged VLLM).

Aphrodite dibangun dan mengintegrasikan pekerjaan luar biasa dari berbagai proyek.

Hitung yang diperlukan untuk pengembangan Aphrodite disediakan oleh ARC Compute.

Berita

(09/2024) V0.6.1 ada di sini. Anda sekarang dapat memuat model FP16 dalam format FP2 ke FP7, untuk mencapai throughput yang sangat tinggi dan menghemat memori.

(09/2024) V0.6.0 dirilis, dengan peningkatan throughput yang sangat besar, banyak format kuant baru (termasuk FP8 dan LLM-Compressor), paralel tensor asimetris, paralel pipa dan banyak lagi! Silakan periksa dokumentasi lengkap untuk pemandu pengguna dan pengembang.

Fitur

Batching terus menerus
Manajemen K/V yang efisien dengan pemasangan kembali dari VLLM
Kernel CUDA yang dioptimalkan untuk peningkatan inferensi
Dukungan kuantisasi melalui AQLM, AWQ, Bitsandbytes, GGUF, GPTQ, QUIP#, SmoothQuant+, Squeezellm, Marlin, FP2-FP12
Inferensi Terdistribusi
Cache KV 8-bit untuk panjang konteks yang lebih tinggi dan throughput, pada format FP8 E5M3 dan E4M3.

QuickStart

Pasang mesin:

pip install -U aphrodite-engine

Kemudian luncurkan model:

aphrodite run meta-llama/Meta-Llama-3.1-8B-Instruct

Ini akan membuat server API yang kompatibel dengan openai yang dapat diakses di port 2242 dari LocalHost. Anda dapat mencolokkan API ke UI yang mendukung Openai, seperti Sillytavern.

Silakan merujuk ke dokumentasi untuk daftar lengkap argumen dan bendera yang dapat Anda lewati ke mesin.

Anda dapat bermain -main dengan mesin di demo di sini:

Buruh pelabuhan

Selain itu, kami menyediakan gambar Docker untuk penempatan yang mudah. Berikut perintah dasar untuk memulai:

docker run --runtime nvidia --gpus all 
    -v ~ /.cache/huggingface:/root/.cache/huggingface 
    # --env "CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7" 
    -p 2242:2242 
    --ipc=host 
    alpindale/aphrodite-openai:latest 
    --model NousResearch/Meta-Llama-3.1-8B-Instruct 
    --tensor-parallel-size 8 
    --api-keys " sk-empty "

Ini akan menarik gambar engine Aphrodite (~ 8Gib unduh), dan meluncurkan mesin dengan model LLAMA-3.1-8B-instruct di Port 2242.

Persyaratan

Sistem Operasi: Linux (atau WSL untuk Windows)
Python: 3.8 hingga 3.12

Untuk pengguna Windows, disarankan untuk menggunakan Tabbyapi sebagai gantinya, jika Anda tidak memerlukan dukungan batching.

Membangun Persyaratan:

CUDA> = 11

Untuk perangkat yang didukung, lihat di sini. Secara umum, semua GPU semi -modern didukung - turun ke Pascal (GTX 10XX, P40, dll.) Kami juga mendukung AMD GPU, Intel CPU dan GPU, Google TPU, dan AWS Inferentia.

Catatan

Dengan desain, Aphrodite mengambil 90% dari VRAM GPU Anda. Jika Anda tidak melayani LLM pada skala, Anda mungkin ingin membatasi jumlah memori yang dibutuhkan. Anda dapat melakukan ini dalam contoh API dengan meluncurkan server dengan --gpu-memory-utilization 0.6 (0,6 berarti 60%).
Anda dapat melihat daftar lengkap perintah dengan menjalankan aphrodite run --help .

Ucapan Terima Kasih

Mesin Aphrodite tidak akan mungkin terjadi tanpa pekerjaan fenomenal dari proyek open-source lainnya. Kredit pergi ke:

VLLM (Cacheflow)
Tensorrt-llm
xformers
Perhatian Flash
llama.cpp
Autoawq
Autogptq
Squeezellm
Exllamav2
Tabbyapi
AQLM
Koboldai
WebUI pembuatan teks
Megatron-LM
Sinar

Berkontribusi

Setiap orang dipersilakan untuk berkontribusi. Anda dapat mendukung proyek dengan membuka permintaan tarik untuk fitur baru, perbaikan, atau perbaikan UX umum.

Memperluas

Informasi Tambahan

Versi v0.6.5
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-03
ukuran 9.47MB
Berasal dari Github

Aplikasi Terkait

FNF JS Engine

2024-11-10
Wallpaper Engine Wallpaper film lengkap The Wandering Earth 2

2023-05-24
Mesin templat PHPnow

2013-10-31
Mesin DataLife

2011-05-16
Mesin XOOPS

2011-05-05
Mesin Templat Xmark

2010-06-25

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua