Téléchargement gpt_llm - Téléchargement du code source gpt

gpt_llm

Code Source AI

1.0.0

Télécharger

GPT NEOX 20B & OPT-30B

Filé à partir de https://github.com/mallorbc/gptneox20b_huggingface. Exécute l'inférence pour GPT NEOX 20B et OPT-30B

Exigences pour GPT NEOX 20B

Idéalement, vous avez un ou plusieurs GPU qui totalisent 48 Go de VRAM ou plus.

Cependant, même si vous ne le faites pas, vous pouvez toujours exécuter le modèle, cela prendra beaucoup plus de temps.

Par exemple, courir avec un 3090 plutôt que deux prendrait environ 10 minutes pour générer 100 jetons vs 10-30 secondes si vous le faisiez deux GPU.

Si vous n'avez pas assez de VRAM, vous devez vous assurer que vous avez assez de RAM pour compenser.

Si vous souhaitez télécharger les poids comme je le fais, vous avez besoin d'au moins 50 Go de VRAM pour les poids Float16 ou BFLOAT16. Si vous souhaitez utiliser BFLOAT16, vous devez vous assurer que votre CPU et votre GPU le soutiennent.

Exigences pour OPT-30B

Nécessite un ou plusieurs GPU qui totalisent 70 Go de VRAM ou plus. Semblable à GPT-Neox, le modèle s'adaptera toujours sur le CPU, mais l'OptDecoderlayer est douloureusement lent en utilisant l'inférence du CPU.

Dépendances

pip3 install -r requirements.txt

En cours d'exécution

 python3 main.py # for GPT NeoX 20B
# or alternatively
python3 main_opt.py # for OPT-30B

Il y a deux drapeaux, chacun peut être vu avec -h

Utilisez l'indicateur --fp16 pour charger et enregistrer les poids en mode float16.

Utilisez l'indicateur --bf16 pour charger et enregistrer les poids en mode BFLOAT16.

Utilisez BFLOAT16 lorsque vous le pouvez comme c'est meilleur.

Lors de l'exécution, le modèle sera toujours jeté sur BFLOAT16 à moins que votre GPU / CPU ne puisse le gérer. Vous pouvez désirer un comportement différent.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-07
taille 17.66KB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
TensorRT LLM

2024-11-10
nextcloud_share_url_downloader

2024-11-01
La dernière version du cinéma et de la télévision GPT

2023-10-30

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout