llm foundry Download - llm foundry Source Code Download

llm foundry

Outro código-fonte

v0.15.1

Baixar

LLM Fundição

Este repositório contém código para treinamento, finetuning, avaliação e implantação de LLMs para inferência com o Composer e a plataforma MosaicML. Projetado para ser fácil de usar, eficiente e flexível, esta base de código permite uma rápida experimentação com as técnicas mais recentes.

Você encontrará neste repositório:

llmfoundry/ - código -fonte para modelos, conjuntos de dados, retornos de chamada, serviços públicos etc.
scripts/ - scripts para executar cargas de trabalho LLM
- data_prep/ - converter dados de texto de fontes originais em formato StreamingDataSet
- train/ - Trem modelos Finetune Huggingface e MPT de parâmetros 125m - 70B
  - train/benchmarking - Taxa de transferência de treinamento de perfil e MFU
- inference/ - Converter modelos em formato Huggingface ou Onnx e gerar respostas
  - inference/benchmarking - Latência e taxa de transferência de inferência do perfil
- eval/ -Avalie o LLMS em tarefas acadêmicas (ou personalizadas) no aprendizado de contexto
mcli/ - Inicie qualquer uma dessas cargas de trabalho usando o MCLI e a plataforma Mosaicml
TUTORIAL.md - um mergulho mais profundo no repositório, exemplo de fluxos de trabalho e perguntas frequentes

Dbrx

O DBRX é um código aberto LLM de última geração treinado pela equipe de Mosaic Databricks. Ele usa a arquitetura da mistura de especialistas (MOE) e foi treinado com versões otimizadas da Foundry Composer, LLM e megablocks. O modelo possui 132b parâmetros totais e 36b parâmetros ativos. Lançamos dois modelos DBRX:

Modelo	Comprimento do contexto	Download
Base dbrx	32768	https://huggingface.co/databricks/dbrx-base
DBRX Instruct	32768	https://huggingface.co/databricks/dbrx-instruct

Nosso modelo e pesos e código são licenciados para pesquisadores e entidades comerciais. A licença de código aberto dos Databricks pode ser encontrada na licença e nossa política de uso aceitável pode ser encontrada aqui.

Para obter mais informações sobre os modelos DBRX, consulte https://github.com/databricks/dbrx.

Mpt

Transformadores pré-gravados em mosaico (MPT) são modelos de estilo GPT com alguns recursos especiais-atenção flash para eficiência, álibi para extrapolação do comprimento do contexto e melhorias de estabilidade para mitigar os picos de perda. Como parte da série Foundation da MosaicML, temos vários modelos de MPT:

Modelo	Comprimento do contexto	Download	Uso comercial?
MPT-30B	8192	https://huggingface.co/mosicml/mpt-30b	Sim
MPT-30B-INUTRUTA	8192	https://huggingface.co/mosaicml/mpt-30b-instruct	Sim
MPT-30B-BACK	8192	https://huggingface.co/mosicml/mpt-30b-chat	Não
MPT-7B-8K	8192	https://huggingface.co/mosicml/mpt-7b-8k	Sim
MPT-7B-8K-CAT	8192	https://huggingface.co/mosicml/mpt-7b-8k-clat	Não
MPT-7B	2048	https://huggingface.co/mosicml/mpt-7b	Sim
MPT-7B-INUTRUTA	2048	https://huggingface.co/mosaicml/mpt-7b-instruct	Sim
MPT-7B-BACK	2048	https://huggingface.co/mosicml/mpt-7b-chat	Não
MPT-7B-StoryWriter	65536	https://huggingface.co/mosicml/mpt-7b-storywriter	Sim

Para experimentar esses modelos localmente, siga as instruções nos scripts/inference/README.md para solicitar modelos HF usando nossos scripts hf_gereate.py ou hf_chat.py.

Comunidade MPT

Ficamos impressionados com todo o trabalho incrível que a comunidade colocou no MPT! Aqui fornecemos alguns links para alguns deles:

Replitlm: replit-code-v1-3b é um modelo de linguagem causal de 2.7b focado na conclusão do código. O modelo foi treinado em um subconjunto do conjunto de dados da pilha Dedup v1.2, cobrindo 20 idiomas como Java, Python e C ++
LLAVA-MPT: ajuste de instrução visual para obter recursos multimodais MPT
GGML: versão MPT otimizada para inferência eficiente em hardware do consumidor
GPT4all: Sistema de bate -papo em execução localmente, agora com suporte ao MPT!
Q8MPT-CHAT: MPT otimizado de 8 bits para CPU por nossos amigos na Intel

Vídeos tutoriais da comunidade:

Usando MPT-7b com Langchain por @jamesbriggs
MPT-7B StoryWriter Introdução por Aitrepreneur
MPT-7B de ajuste fino em uma única GPU por @aiology2022
Como ajustar o MPT-7B-Instruct no Google Colab por @vrsen

Algo faltando? Contribua com um PR!

Últimas notícias

Blog: Apresentando DBRX: um novo LLM aberto de última geração
Blog: Treinamento e inferência de LLM com aceleradores Intel Gaudi2 AI
Blog: Training LLMS em escala com GPUs AMD MI250
Blog: Treinamento LLMS com GPUs AMD MI250 e Mosaicml
Blog: anunciando MPT-7B-8K: 8K Comprimento do contexto para entendimento de documentos
Blog: Treinamento LLMS com GPUs AMD MI250 e Mosaicml
Blog: MPT-30B: Aumentando os modelos de fundação da barra de código aberto
Blog: Apresentando o MPT-7B
Blog: Benchmarking LLMS no H100
Blog: avaliação incrivelmente rápida de LLM
Blog: qualidade GPT3 por US $ 500k
Blog: Treinamento de GPT de parâmetro de bilhão facilitado

Requisitos de hardware e software

Esta base de código foi testada com o Pytorch 2.4 com o NVIDIA A100S e H100S. Essa base de código também pode funcionar em sistemas com outros dispositivos, como cartões da NVIDIA do consumidor e cartões AMD, mas não estamos testando ativamente esses sistemas. Se você tiver sucesso/falha usando a LLM Foundry em outros sistemas, informe -nos em um problema do GitHub e atualizaremos a matriz de suporte!

Dispositivo	Versão da tocha	Versão CUDA	Status
A100-40GB/80 GB	2.5.1	12.4	✅ Suporte
H100-80GB	2.5.1	12.4	✅ Suporte

Imagens de Mosaicml Docker

É altamente recomendável usar nossas imagens pré -construídas do Docker. Você pode encontrá -los aqui: https://hub.docker.com/orgs/mosaicml/repositórios.

As imagens mosaicml/pytorch são fixadas em versões específicas de pytorch e cuda e são estáveis e raramente atualizadas.

As imagens mosaicml/llm-foundry são construídas com novas tags em todos os compromissos com o ramo main . Você pode selecionar um hash de confirmação específico, como mosaicml/llm-foundry:2.5.1_cu124-9867a7b ou pegar o mais recente usando mosaicml/llm-foundry:2.5.1_cu124-latest .

Observação: as imagens mosaicml/llm-foundry não vêm com o pacote llm-foundry pré-instalado, apenas as dependências. Você ainda precisará pip install llm-foundry da Pypi ou da fonte.

Imagem do Docker	Versão da tocha	Versão CUDA	LLM Foundry Dependências instaladas?
`mosaicml/pytorch:2.5.1_cu124-python3.11-ubuntu22.04`	2.5.1	12.4 (Infiniband)	Não
`mosaicml/llm-foundry:2.5.1_cu124-latest`	2.5.1	12.4 (Infiniband)	Sim
`mosaicml/llm-foundry:2.5.1_cu124_aws-latest`	2.5.1	12.4 (EFA)	Sim

Instalação

Isso pressupõe que você já tenha pytorch, cmake e embalagens instaladas. Caso contrário, você pode instalá -los com pip install cmake packaging torch .

Para começar, clone o repositório e configure seu ambiente. As instruções para fazer isso diferem um pouco, dependendo se você está usando o Docker.

Com Docker (recomendado)

Recomendamos fortemente trabalhar com a LLM Foundry dentro de um recipiente do docker (consulte a imagem recomendada do Docker acima). Se você estiver fazendo isso, siga estas etapas para clonar o repositório e instalar os requisitos.

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry
pip install -e " .[gpu] "  # or `pip install -e .` if no NVIDIA GPU.

Sem Docker (não recomendado)

Se você optar por não usar o Docker, deve criar e usar um ambiente virtual.

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry

# Creating and activate a virtual environment
python3 -m venv llmfoundry-venv
source llmfoundry-venv/bin/activate

pip install cmake packaging torch  # setup.py requires these be installed

pip install -e " .[gpu] "  # or `pip install -e .` if no NVIDIA GPU.

Suporte de TransformEnEngine e AMP_FP8

As GPUs NVIDIA H100 têm suporte a FP8; Já instalamos a atenção e o transformador em nossas imagens do Docker (veja acima). Se você não estiver usando nossas imagens do Docker, pode instalar esses pacotes com:

pip install flash-attn --no-build-isolation
pip install git+https://github.com/NVIDIA/TransformerEngine.git@stable

Veja aqui para obter mais detalhes sobre como ativar o TransformerEngine Camadas e AMP_FP8.

AMD (suporte beta)

Em nosso teste de GPUs AMD, a configuração Env inclui:

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry

# Creating and activate a virtual environment
python3 -m venv llmfoundry-venv-amd
source llmfoundry-venv-amd/bin/activate

# installs
pip install cmake packaging torch
pip install -e .  # This installs some things that are not needed but they don't hurt
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2

Por fim , instale o ROCM ativado a atenção flash (instruções aqui).

Notas:

Ainda não temos uma imagem do Docker, onde tudo funciona perfeitamente. Pode ser necessário aumentar/rebaixar alguns pacotes (no nosso caso, precisávamos fazer o downgrade para numpy==1.23.5 ) antes que tudo funcione sem problemas.

Intel Gaudi

O suporte à fundição da LLM nos dispositivos Intel Gaudi é experimental, use o ramo habana_alpha e veja o ReadMe naquela filial que possui instruções de instalação e problemas conhecidos.

Para resultados de desempenho de treinamento e inferência nos aceleradores Intel Gaudi2, consulte nosso blog: https://www.databricks.com/blog/llm-trening-and-inference-intel-gaudi2-ai-accellerator

Investir rápido

Observe que siga as etapas de instalação acima antes de tentar o QuickStart!

Aqui está um fluxo de trabalho de ponta a ponta para a preparação de um subconjunto do conjunto de dados C4, treinando um modelo MPT-125M para 10 lotes, convertendo o modelo em formato Hugging SFACE, avaliando o modelo no desafio do Winograd e gerando respostas aos avisos.

(Lembre -se de que este é um início rápido apenas para demonstrar as ferramentas - para obter boa qualidade, o LLM deve ser treinado por mais de 10 lotes?)

 cd scripts

# Convert C4 dataset to StreamingDataset format
python data_prep/convert_dataset_hf.py 
  --dataset allenai/c4 --data_subset en 
  --out_root my-copy-c4 --splits train_small val_small 
  --concat_tokens 2048 --tokenizer EleutherAI/gpt-neox-20b --eos_text ' <|endoftext|> '

# Train an MPT-125m model for 10 batches
composer train/train.py 
  train/yamls/pretrain/mpt-125m.yaml 
  variables.data_local=my-copy-c4 
  train_loader.dataset.split=train_small 
  eval_loader.dataset.split=val_small 
  max_duration=10ba 
  eval_interval=0 
  save_folder=mpt-125m

# Convert the model to HuggingFace format
python inference/convert_composer_to_hf.py 
  --composer_path mpt-125m/ep0-ba10-rank0.pt 
  --hf_output_path mpt-125m-hf 
  --output_precision bf16 
  # --hf_repo_for_upload user-org/repo-name

# Evaluate the model on a subset of tasks
composer eval/eval.py 
  eval/yamls/hf_eval.yaml 
  icl_tasks=eval/yamls/copa.yaml 
  model_name_or_path=mpt-125m-hf

# Generate responses to prompts
python inference/hf_generate.py 
  --name_or_path mpt-125m-hf 
  --max_new_tokens 256 
  --prompts 
    " The answer to life, the universe, and happiness is " 
    " Here's a quick recipe for baking chocolate chip cookies: Start by "

Nota: O comando composer usado acima para treinar o modelo refere -se ao lançador distribuído da biblioteca compositor.

Se você tiver um token de autenticação de Huggingface habilitado para gravação, pode opcionalmente fazer upload do seu modelo para o hub! Basta exportar seu token assim:

 export HF_TOKEN=your-auth-token

e descomment a linha que contém --hf_repo_for_upload ... na chamada acima para inference/convert_composer_to_hf.py .

Registro

Você pode usar o registro para personalizar seus fluxos de trabalho sem gastar na biblioteca. Alguns componentes da fundição LLM são registráveis, como modelos, madeireiros e retornos de chamada. Isso significa que você pode registrar novas opções para esses componentes e usá -las na sua configuração YAML.

Descobrindo componentes registráveis

Para ajudar a encontrar e entender os componentes registráveis, você pode usar o comando da CLI llmfoundry registry .

Nós fornecemos dois comandos atualmente:

llmfoundry registry get [--group] : Liste todos os registros e seus componentes, especificando opcionalmente um registro específico. Exemplo de uso: llmfoundry registry get --group loggers ou llmfoundry registry get
llmfoundry registry find <group> <name> : Obtenha informações sobre um componente registrado específico. Exemplo de uso: llmfoundry registry find loggers wandb

Use --help em qualquer um desses comandos para obter mais informações.

Esses comandos também podem ajudá -lo a entender do que cada registro é composto, pois cada registro contém um documento que será impresso. O conceito geral é que cada registro define uma interface e os componentes registrados nesse registro devem implementar essa interface. Se houver uma parte da biblioteca que não seja extensível no momento, mas você acha que deveria ser, abra um problema!

Como se registrar

Existem algumas maneiras de registrar um novo componente:

Python EntryPoints

Você pode especificar componentes registrados por meio de um ponto de entrada do Python se estiver criando seu próprio pacote com componentes registrados. Este seria o uso esperado se você estiver construindo uma grande extensão da fundição da LLM e substituirá muitos componentes. Observe que as coisas registradas através dos pontos de entrada substituirão os componentes registrados diretamente no código.

Por exemplo, o seguinte registraria a classe MyLogger , sob a chave my_logger , no Registro llm_foundry.loggers :

 [build-system]
requires = ["setuptools>=42", "wheel"]
build-backend = "setuptools.build_meta"

[project]
name = "foundry_registry"
version = "0.1.0"
dependencies = [
    " mosaicml " ,
    " llm-foundry " ,
]

# Note: Even though in python code, this would be llmfoundry.registry.loggers,
# when specified in the entry_points, it has to be "llmfoundry_loggers". That is,
# the segments of the name should be joined by an _ in the entry_points section.
[project.entry-points."llmfoundry_loggers"]
my_logger = "foundry_registry.loggers:MyLogger"

Se o desenvolvimento de novos componentes por meio de pontos de entrada, é importante observar que os pontos de entrada do Python são globais para o ambiente Python. Isso significa que, se você tiver vários pacotes que registram componentes com a mesma chave, a última instalada será a usada. Isso pode ser útil para substituir componentes na fundição da LLM, mas também pode levar a comportamentos inesperados, se não for cuidadosos. Além disso, se você alterar o PyProject.toml, precisará reinstalar o pacote para que as alterações entrem em vigor. Você pode fazer isso rapidamente instalando com pip install -e . --no-deps para evitar reinstalar as dependências.

Chamada direta para se registrar

Você também pode registrar um componente diretamente em seu código:

 from composer . loggers import LoggerDestination
from llmfoundry . registry import loggers

class MyLogger ( LoggerDestination ):
    pass

loggers . register ( "my_logger" , func = MyLogger )

Decoradores

Você também pode usar decoradores para registrar componentes diretamente do seu código:

 from composer . loggers import LoggerDestination
from llmfoundry . registry import loggers

@ loggers . register ( "my_logger" )
class MyLogger ( LoggerDestination ):
    pass

Para as abordagens de chamadas diretas e decoradores, se estiver usando os scripts de trem/avaliação da Foundry LLM, você precisará fornecer o argumento code_paths , que é uma lista de arquivos precisa executar para registrar seus componentes. Por exemplo, você pode ter um arquivo chamado foundry_imports.py que contém o seguinte:

 from foundry_registry . loggers import MyLogger
from llmfoundry . registry import loggers

loggers . register ( "my_logger" , func = MyLogger )

Você então forneceria code_paths para os scripts de trem/avaliação em sua configuração YAML:

...
code_paths :
  - foundry_imports.py
...

Um deles seria o uso esperado se você estiver construindo uma pequena extensão da fundição da LLM, substituindo apenas alguns componentes e, portanto, não deseja criar um pacote inteiro.

Saiba mais sobre a LLM Foundry!

Confira o tutorial.md para continuar aprendendo sobre como trabalhar com a LLM Foundry. O tutorial destaca o exemplo de fluxos de trabalho, aponta para outros recursos em todo o repositório e responde a perguntas frequentes!

Contate-nos

Se você tiver algum problema com o código, arquive problemas do GitHub diretamente neste repositório.

Se você deseja treinar LLMs na plataforma MosaicML, entre em contato conosco pelo [email protected]!

Expandir

Informações adicionais

Versão v0.15.1
Tipo Outro código-fonte
Data da Última Atualização 2025-04-19
tamanho 27.28MB
Vindo de Github

Aplicativos Relacionados

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
foundry

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos