Unduh auto ollama - Unduh Kode Sumber auto ollama

auto ollama

Kode Sumber AI

1.0.0

Unduh

AUTO-OLLAMA & AUTO-GGUF ⚡️

Inferensi atau Kuantisasi Model Bahasa Besar (LLM) secara lokal dengan perintah tunggal

Ringkasan

Auto-ollama adalah toolkit yang dirancang untuk menyederhanakan inferensi atau kuantisasi model bahasa besar (LLM) secara langsung di lingkungan lokal Anda. Dengan penekanan pada kemudahan penggunaan dan fleksibilitas, Auto-Ollama mendukung penggunaan langsung dan konversi model menjadi format yang efisien untuk penyebaran lokal.

Untuk kuantisasi, lihat paket baru yang disebut Auto-Quantllm ⚡️. Saat ini sedang dikembangkan, tetapi bertujuan untuk memberikan pendekatan yang ramping dan ramah pengguna untuk mengukur model bahasa besar (LLM) dengan metode kuantisasi yang berbeda.

Memulai

Instalasi

Klon Repositori untuk Memulai dengan Auto-Ollama:

git clone https://github.com/monk1337/auto-ollama.git
cd auto-ollama

Tur cepat

Menjalankan auto-ollama Gunakan skrip autollama.sh untuk dengan cepat inferensi LLMS. Script ini membutuhkan nama model dan nama file terkuantisasi sebagai argumen.

 # Deploy Large Language Models (LLMs) locally with Auto-Ollama
# Usage:
# ./scripts/autollama.sh -m <model path> -g <gguf file name>


# Example command:
./scripts/autollama.sh -m TheBloke/MistralLite-7B-GGUF -g mistrallite.Q4_K_M.gguf

Menangani model yang tidak quartisasi dengan autogguf

Jika model yang Anda inginkan tidak tersedia dalam format terkuantisasi yang cocok untuk penyebaran lokal, Auto-Ollama menawarkan utilitas autogguf. Alat ini dapat mengubah model wajah pemeluk apa pun menjadi format GGUF dan mengunggahnya ke hub Model Face Hugging.

 # Convert your Hugging Face model to GGUF format for local deployment
# Usage:
# ./scripts/autogguf.sh -m <MODEL_ID> [-u USERNAME] [-t TOKEN] [-q QUANTIZATION_METHODS]

# Example command:
./scripts/autogguf.sh -m unsloth/gemma-2b

Lebih banyak opsi

 # if want to upload the gguf model to hub after the conversion, provide the user and token
# Example command:
./scripts/autogguf.sh -m unsloth/gemma-2b -u user_name -t hf_token


# if wants to provide QUANTIZATION_METHODS
# Example command:
./scripts/autogguf.sh -m unsloth/gemma-2b -u user_name -t hf_token -q " q4_k_m,q5_k_m "

Rekomendasi Kuantisasi

Gunakan Q5_K_M untuk keseimbangan sumber daya kinerja terbaik.
Q4_K_M adalah pilihan yang baik jika Anda perlu menyimpan memori.
Versi K_M umumnya berkinerja lebih baik daripada K_S.

Dukungan dan Kontribusi

Untuk masalah, saran, atau kontribusi, silakan buka masalah atau tarik permintaan di repositori GitHub. Kami menyambut kontribusi dari komunitas untuk membuat auto-ulama menjadi lebih baik!

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-02
ukuran 13.03KB
Berasal dari Github

Aplikasi Terkait

ollama dl

2024-11-10
ComfyUI_Auto_Caption

2024-11-06
auto round

2024-11-06
Penggabungan Otomatis versi Cina

2023-11-28
Paket instalasi Auto Life I Brasil

2023-03-16
Taipan Dealer Mobil

2022-08-20

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua