Download gpt light - Download de código fonte gpt light

gpt light

Código-Fonte de IA

1.0.0

Baixar

GPT-Light

Tldr

O objetivo deste repositório é fornecer uma implementação simples dos modelos GPT que podem ser usados para aplicações de produção. Atualmente, o código suporta os seguintes casos de uso:

Treinando uma arquitetura GPT do zero.
Ajustando um modelo GPT existente (por exemplo, os modelos GPT2 de código aberto) em novos dados.
Usando um modelo GPT treinado para fazer previsões em lote.
Implantando um modelo GPT treinado como uma API REST para servir.

Sinta -se à vontade para gastar este repositório e usá -lo como um modelo para desenvolver seus próprios aplicativos GPT.

Trabalho futuro

Queremos eventualmente incluir o ajuste fino baseado em RL do ChatGPT. Em geral, isso não muda o modelo de conhecimento subjacente, mas torna a interação com o modelo mais parecido com o humano.

Configurar

A configuração do código é bastante mínima e pode ser facilmente reproduzida em ambientes de VM local ou em nuvem.*

Instale o Pytorch (com suporte opcional à GPU)
Crie o ambiente do CONDA:

 conda create -n python38 python=3.8
conda activate python38

Instale dependências:

 conda install --file requirements.txt

* No futuro, tentaremos fornecer uma versão do Docker desta configuração.

Executando as coisas

Preparando dados minúsculos-shakespeare

Fornecemos código de amostra que downloads e pré-processam o conjunto de dados de shakes minúsculos para treinamento e ajuste fino. Use este código como um modelo para criar pré -processamento de dados para seus próprios dados.

 python src/data_io/fetch_shakespeare.py

Treinando minúsculo shakespeare

Treinando um modelo GPT muito pequeno do zero no conjunto de dados de shakespeare minúsculo criado na etapa anterior. O modelo resultante não será muito generalizável, pois é bastante pequeno e treinado em um conjunto de dados muito pequeno, mas pode gerar citações do tipo Shakespeare.

Altere o arquivo de configuração e para treinar um modelo do zero em seus próprios dados. Neste ponto, você pode tecnicamente escalar para tamanhos de modelos muito grandes, de acordo com o tamanho e os recursos dos dados.*

 python src/training/train_main.py --config_file config/train_shakespeare_small.yml

* Para esta etapa, você provavelmente precisará de uma ou várias GPUs.

GPT2 de ajuste fino em Shakespeare

Ajustando o modelo GPT2 de código aberto em seus próprios dados. É possível usar qualquer modelo de código aberto GPT (GPT2-Medium, GPT2-XL etc). Essa é a opção mais comum, pois requer menos dados e recursos (é possível executar isso mesmo em uma CPU) e é muito mais rápido que o treinamento do zero.

 python src/training/train_main.py --config_file config/finetune_shakespeare.yml

Amostragem do modelo Shakespeare

Exemplo de várias saídas de um modelo treinado, com um prompt de entrada. Isso pode ser usado para inferência em lote.

 python src/inference/sample_main.py --config_file config/sample_shakespeare.yml

Start Server

Um servidor LightWeigth que serve um modelo treinado em uma API REST.

 uvicorn src.inference.service_main:app --reload --reload-include config/sample_gpt2.yml

Depois que o servidor estiver em execução, você poderá consultar o terminal com um prompt (como uma solicitação de postagem). Para mais detalhes sobre os detalhes da consulta, consulte o seguinte script de teste.

Teste de endpoint

Depois que o servidor estiver em execução, você pode testar o terminal usando o seguinte script.

 python src/inference/test_query.py

Teste

Este repositório foi implantado com um aplicativo de produção em mente e inclui testes de unidade e integração.

* Tesing não é um caixa eletrônico extenso, mas tentaremos aumentar a cobertura no futuro.

Executar testes de unidade

Testes de unidade foram incluídos para cobrir a funcionalidade principal. Você pode executar o conjunto completo de testes de unidade com o seguinte comando:

 pytest test/unit/

Execute testes de integração

Além dos testes de unidade, incluímos alguns testes de integração para os fluxos de trabalho de treinamento, ajuste fino e amostragem.

 pytest test/integration/

* Atualmente, o teste de integração exige que os dados funcionem (veja acima).

Configuração pré-comprometimento

Geralmente é aconselhável ativar ganchos pré-comprometidos ao trabalhar com o repositório. Atualmente, executa algumas verificações básicas de formatação e executa o conjunto de testes de unidade (mas não os testes de integração).

 conda install -c conda-forge pre-commit
pre-commit install

Agradecimentos

A implementação do GPT neste repositório é inspirada no Repo Nanogpt por Andrej Karpathy. Nosso objetivo era reimplementar, re-estruturar e estendê-lo com módulos que facilitam a criação de diferentes tipos de aplicações de produção.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-10
tamanho 468.07KB
Vindo de Github

Aplicativos Relacionados

A versão mais recente do filme e televisão GPT

2023-10-30
Software Light Lite

2023-07-11
Aplicativo BWEE Light

2023-06-17
Maze Light versão chinesa

2023-05-15
Derivador hiperleve

2022-08-08
Última Luz

2022-07-30

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos