Descargar gpt_llm - Descargar el código fuente gpt

gpt_llm

Código Fuente de IA

1.0.0

Descargar

GPT NEOX 20B y OPT-30B

Bifurado desde https://github.com/mallorbc/gptneox20b_huggingface. Ejecuta inferencia para GPT NEOX 20B y OPT-30B

Requisitos para GPT NEOX 20B

Idealmente, tiene una o más GPU que totalizan 48 GB de VRAM o más.

Sin embargo, incluso si no lo hace, aún puede ejecutar el modelo, solo llevará mucho más tiempo.

Por ejemplo, correr con un 3090 en lugar de dos tomaría alrededor de 10 minutos para generar 100 tokens frente a 10-30 segundos si lo ejecutas dos GPU.

Si no tiene suficiente VRAM, debe asegurarse de tener suficiente RAM para compensarlo.

Si desea descargar los pesos como lo hago, necesita aproximadamente al menos 50 GB de VRAM para los pesos Float16 o BFloat16. Si desea usar BFLOAT16, debe asegurarse de que su CPU y GPU lo admitan.

Requisitos para OPT-30B

Requiere una o más GPU que totalizan en 70 GB de VRAM o más. Similar a GPT-NEOX, el modelo aún se ajustará a la CPU, pero el OptDecoderLayer es dolorosamente lento usando la inferencia de la CPU.

Dependencias

pip3 install -r requirements.txt

Correr

 python3 main.py # for GPT NeoX 20B
# or alternatively
python3 main_opt.py # for OPT-30B

Hay dos banderas, cada una se puede ver con -h

Use el indicador --fp16 para cargar y guardar los pesos en el modo Float16.

Use el indicador --bf16 para cargar y guardar los pesos en modo BFLOAT16.

Use BFLOAT16 cuando pueda, ya que sea mejor.

Cuando se ejecuta, el modelo siempre se lanzará a BFLOAT16 a menos que su GPU/CPU no pueda manejarlo. Puede desear un comportamiento diferente.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-07
tamaño 17.66KB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
TensorRT LLM

2024-11-10
nextcloud_share_url_downloader

2024-11-01
La última versión de GPT cine y televisión.

2023-10-30

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo