تنزيل gpt_llm - تنزيل رمز المصدر gpt

gpt_llm

كود الذكاء الاصطناعي

1.0.0

تنزيل

GPT NEOX 20B و OPT-30B

متشوق من https://github.com/mallorbc/gptneox20b_huggingface. يدير الاستدلال لـ GPT Neox 20b و OPT-30B

متطلبات GPT Neox 20b

من الناحية المثالية لديك واحدة أو أكثر من وحدات معالجة الرسومات التي يبلغ مجموعها 48 جيجابايت من VRAM أو أكثر.

ومع ذلك ، حتى لو لم يكن بإمكانك تشغيل النموذج ، فسوف يستغرق الأمر وقتًا أطول بكثير.

على سبيل المثال ، سيستغرق الركض مع واحد 3090 بدلاً من دقيقتين حوالي 10 دقائق لإنشاء 100 رمز مقابل 10-30 ثانية إذا قمت بتشغيله واحدًا واحدًا.

إذا لم يكن لديك ما يكفي من VRAM ، فأنت بحاجة إلى التأكد من أن لديك كمية كافية من ذاكرة الوصول العشوائي للتعويض عنها.

إذا كنت ترغب في تنزيل الأوزان بالطريقة التي أقوم بها ، فأنت بحاجة إلى ما لا يقل عن 50 جيجابايت من VRAM لأوزان Float16 أو Bfloat16. إذا كنت ترغب في استخدام BFLOAT16 ، فيجب عليك التأكد من دعم وحدة المعالجة المركزية و GPU.

متطلبات OPT-30B

يتطلب واحدة أو أكثر من وحدات معالجة الرسومات التي مجموعها 70 جيجابايت من VRAM أو أكثر. على غرار GPT-NEOX ، سيظل النموذج يتناسب مع وحدة المعالجة المركزية ولكن OptDecoderLayer بطيئة بشكل مؤلم باستخدام استنتاج وحدة المعالجة المركزية.

التبعيات

pip3 install -r requirements.txt

جري

 python3 main.py # for GPT NeoX 20B
# or alternatively
python3 main_opt.py # for OPT-30B

هناك علمان ، يمكن رؤية كل منهما مع -h

استخدم علامة --fp16 لتحميل وحفظ الأوزان في وضع Float16.

استخدم علامة --bf16 لتحميل وحفظ الأوزان في وضع BFLOAT16.

استخدم Bfloat16 عندما يمكنك أفضل.

عند التشغيل ، سيتم دائمًا إلقاء النموذج إلى Bfloat16 ما لم يتمكن وحدة المعالجة المركزية/وحدة المعالجة المركزية/وحدة المعالجة المركزية/وحدة المعالجة المركزية. قد ترغب في سلوك مختلف.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-07
الحجم 17.66KB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
TensorRT LLM

2024-11-10
nextcloud_share_url_downloader

2024-11-01
أحدث نسخة من GPT للسينما والتلفزيون

2023-10-30

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل