تنزيل llama.py - تنزيل رمز المصدر llama.py

llama.py

كود الذكاء الاصطناعي

1.0.0

تنزيل

llama.py

llama.py هو شوكة llama.cpp التي توفر روابط Python لوقت الاستنتاج لنموذج Llama في C/C ++ النقي.

وصف

الهدف الرئيسي هو تشغيل النموذج باستخدام كمية 4 بت على جهاز كمبيوتر محمول.

تنفيذ C/C ++ عادي بدون تبعيات.
Apple Silicon Citizen من الدرجة الأولى - محسّن عبر ARM NEON.
دعم AVX2 للبنيات X86.
مختلطة F16 / F32 الدقة.
دعم الكمي 4 بت.
يعمل على وحدة المعالجة المركزية.

الاستخدام

بناء التعليمات يلي.

cmake -S . -B build/release
cmake --build build/release
ln -s build/release/llama/cc/_llama.cpython-310-x86_64-linux-gnu.so llama

الحصول على أوزان نموذج Llama الأصلي ووضعها في دليل data/model .

python -m llama pull -m data/model/7B -s 7B

نظرًا لأن الأوزان النموذجية يتم جلبها بنجاح ، يجب أن يبدو بنية الدليل أدناه.

 data/model
├── 7B
│   ├── checklist.chk
│   ├── consolidated.00.pth
│   └── params.json
├── tokenizer_checklist.chk
└── tokenizer.model

ثم يجب على المرء تحويل طراز 7B إلى تنسيق GGML FP16.

python -m llama convert data/model/7B

وعيش النموذج إلى 4 بت.

python -m llama quantize data/model/7B

ثم يمكن للمرء أن يبدأ مترجم بيثون واللعب مع روابط عارية.

 from llama . _llama import *

nothreads = 8
model = LLaMA . load ( './data/model/7B/ggml-model-q4_0.bin' , 512 , GGMLType . F32 )
mem_per_token = model . estimate_mem_per_token ( nothreads )
logits = model . apply ( context , context_size , mem_per_token , nothreads )

token_id = sample_next_token ( context , logits )

tokenizer = model . get_tokenizer ()
tokenizer . decode ( token_id )

أو تشغيل واجهة CLI.

متطلبات الذاكرة/القرص

نظرًا لأن النماذج يتم تحميلها بشكل كامل في الذاكرة ، فستحتاج إلى مساحة كافية من القرص لحفظها وذاكرة الوصول العشوائي الكافية لتحميلها. في الوقت الحالي ، تكون متطلبات الذاكرة والقرص هي نفسها.

نموذج	الحجم الأصلي	الحجم الكمي (4 بت)
7 ب	13 غيغابايت	3.9 جيجابايت
13 ب	24 غيغابايت	7.8 جيجابايت
30 ب	60 جيجابايت	19.5 غيغابايت
65 ب	120 غيغابايت	38.5 جيجابايت

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-11
الحجم 311.16KB
من Github

تطبيقات ذات صلة

node llama cpp

2024-11-11
llama models

2024-11-10
sentinel1 orbits py

2024-11-08
LLaMA Factory

2024-11-02
كود لاما

2023-10-30
اللاما 2

2023-08-17

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل