download gpt_llm - gpt_llm Download de código fonte

gpt_llm

Código-Fonte de IA

1.0.0

Baixar

Gpt Neox 20b & Opt-30b

Bifurcado em https://github.com/mallorbc/gptneox20b_huggingface. Executa a inferência para GPT Neox 20B e Opt-30b

Requisitos para GPT Neox 20b

Idealmente, você tem uma ou mais GPUs que totalizam 48 GB de VRAM ou mais.

No entanto, mesmo se não o fizer, você ainda pode executar o modelo, levará muito mais tempo.

Por exemplo, correr com um 3090 em vez de dois levaria cerca de 10 minutos para gerar 100 tokens vs 10-30 segundos se você o executasse um GPUs.

Se você não tiver VRAM suficiente, precisa ter certeza de que tem RAM suficiente para compensar isso.

Se você deseja baixar os pesos da maneira que eu faço, precisará de aproximadamente 50 GB de VRAM para os pesos Float16 ou BFLOAT16. Se você deseja usar o BFLOAT16, precisa garantir que a CPU e a GPU o suporte.

Requisitos para OPT-30B

Requer uma ou mais GPUs que totalizam 70 GB de VRAM ou mais. Semelhante ao GPT-Neox, o modelo ainda se encaixará na CPU, mas o OptDecoderLayer é dolorosamente lento usando a inferência da CPU.

Dependências

pip3 install -r requirements.txt

Correndo

 python3 main.py # for GPT NeoX 20B
# or alternatively
python3 main_opt.py # for OPT-30B

Existem duas bandeiras, cada uma pode ser vista com -h

Use o sinalizador --fp16 para carregar e salvar os pesos no modo Float16.

Use o sinalizador --bf16 para carregar e salvar os pesos no modo BFLOAT16.

Use o BFLOAT16 quando puder o melhor.

Ao funcionar, o modelo sempre será lançado para o BFLOAT16, a menos que sua GPU/CPU não possa lidar com isso. Você pode desejar um comportamento diferente.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-07
tamanho 17.66KB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
TensorRT LLM

2024-11-10
nextcloud_share_url_downloader

2024-11-01
A versão mais recente do filme e televisão GPT

2023-10-30

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos