Download Learning LLM - Learning LLM Download de código fonte

Learning LLM

Código-Fonte de IA

1.0.0

Baixar

Construa um grande modelo de linguagem (do zero)

Esse repositório contém o código para o desenvolvimento, pré-treinamento e fino de um LLM do tipo GPT e é o repositório oficial de código para o livro Construir um modelo de idioma grande (do zero).

No Build um grande modelo de idioma (do zero) , você aprenderá e entenderá como os grandes modelos de idiomas (LLMS) funcionam de dentro para fora, codificando -os desde o início, passo a passo. Neste livro, vou guiá -lo pela criação de seu próprio LLM, explicando cada estágio com texto claro, diagramas e exemplos.

O método descrito neste livro para treinar e desenvolver seu próprio modelo pequeno, porém-funcional, para fins educacionais reflete a abordagem usada na criação de modelos fundamentais em larga escala, como os por trás do ChatGPT. Além disso, este livro inclui código para carregar os pesos de modelos maiores pré -traidos para o Finetuning.

Link para o repositório oficial de código -fonte
Link para o livro em Manning
Link para a página do livro na Amazon
ISBN 9781633437166

Para baixar uma cópia deste repositório, clique no botão Zip Download ou execute o seguinte comando em seu terminal:

git clone --depth 1 https://github.com/ranpy13/Learning-LLM.git

(Se você baixou o pacote de código do site de Manning, considere visitar o repositório oficial de código no Github em https://github.com/ranpy13/learning-llm para obter as últimas atualizações.)

Índice

Observe que este arquivo README.md é um arquivo markdown ( .md ). Se você baixou este pacote de código no site de Manning e o está visualizando no computador local, recomendo usar um editor ou visualizador de marcação para visualização adequada. Se você ainda não instalou um editor de marcação, o MarkText é uma boa opção gratuita.

Como alternativa, você pode visualizar este e outros arquivos no github em https://github.com/ranpy13/learning-llm no seu navegador, o que renderiza o Markdown automaticamente.

Dica

Se você está buscando orientações sobre como instalar pacotes Python e Python e configurar seu ambiente de código, sugiro ler o arquivo readme.md localizado no diretório de configuração.

Título do capítulo	Código principal (para acesso rápido)	Todo o código + suplementar
Recomendações de configuração	-	-
Ch 1: Compreendendo modelos de linguagem grandes	Sem código	-
Ch 2: Trabalhando com dados de texto	- CH02.IPYNB - Dataloader.ipynb (resumo) - Exercício-solutions.ipynb	./ch02
Ch 3: mecanismos de atenção de codificação	- CH03.IPYNB - Multihead-attention.ipynb (resumo) - Exercício-solutions.ipynb	./ch03
Ch 4: implementando um modelo GPT do zero	- CH04.IPYNB - Gpt.py (resumo) - Exercício-solutions.ipynb	./ch04
CH 5: Pré -treinamento em dados não marcados	- CH05.IPYNB - gpt_train.py (resumo) - GPT_Generate.py (resumo) - Exercício-solutions.ipynb	./ch05
Ch 6: Finetuning para classificação de texto	- CH06.IPYNB - gpt_class_fineTune.py - Exercício-solutions.ipynb	./ch06
Ch 7: Finetuning para seguir as instruções	- CH07.IPYNB - gpt_instruction_finetuning.py (resumo) - ollama_evaluate.py (resumo) - Exercício-solutions.ipynb	./ch07
Apêndice A: Introdução ao Pytorch	- código-parte1.ipynb - Code-PART2.ipynb - ddp-script.py - Exercício-solutions.ipynb	./Apêndice-a
Apêndice B: Referências e leitura adicional	Sem código	-
Apêndice C: soluções de exercícios	Sem código	-
Apêndice D: Adicionando sinos e assobios ao loop de treinamento	- Apêndice-d.ipynb	./Apêndice-d
Apêndice E: Finetuning com eficiência de parâmetros com Lora	- Apêndice-e.ipynb	./Apêndice-e

O modelo mental abaixo resume o conteúdo coberto neste livro.

Requisitos de hardware

O código nos principais capítulos deste livro foi projetado para ser executado em laptops convencionais dentro de um prazo razoável e não requer hardware especializado. Essa abordagem garante que um amplo público possa se envolver com o material. Além disso, o código utiliza automaticamente as GPUs se estiverem disponíveis. (Consulte o documento de configuração para obter recomendações adicionais.)

Material bônus

Várias pastas contêm materiais opcionais como um bônus para os leitores interessados:

Configurar
- Dicas de configuração do Python
- Instalando pacotes e bibliotecas Python usadas neste livro
- Guia de configuração do ambiente do docker
Capítulo 2:
- Comparando implementações de codificação de vários pares de bytes (BPE)
- Compreendendo a diferença entre as camadas de incorporação e as camadas lineares
- Intuição de Dataloader com números simples
Capítulo 3:
- Comparando implementações eficientes de atenção de várias cabeças
- Entendendo os buffers de pytorch
Capítulo 4:
- Análise de flops
Capítulo 5:
- Carregamento alternativo de peso de abraçar o cubo do modelo de rosto usando transformadores
- GPT pré -treinamento no conjunto de dados do projeto Gutenberg
- Adicionando sinos e assobios ao loop de treinamento
- Otimizando hiperparâmetros para pré -treinamento
- Construindo uma interface de usuário para interagir com o LLM pré -treinado
Capítulo 6:
- Experimentos adicionais fino camadas diferentes e usando modelos maiores
- Finetuning diferentes modelos no conjunto de dados de revisão de filmes IMDB de 50k
- Construindo uma interface de usuário para interagir com o classificador de spam baseado em GPT
Capítulo 7:
- Utilitários de dados para encontrar duplicatas próximas e criar entradas de voz passivas
- Avaliando as respostas das instruções usando a API OpenAI e Ollama
- Gerando um conjunto de dados para instrução finetuning
- Melhorando um conjunto de dados para instrução finetuning
- Gerando um conjunto de dados de preferência com llama 3.1 70b e ollama
- Otimização de preferência direta (DPO) para alinhamento LLM
- Construindo uma interface do usuário para interagir com o modelo GPT do FinetUned

Perguntas, feedback e contribuição para este repositório

Congratulo -me com todo tipo de feedback, melhor compartilhado através do Fórum Manning ou das discussões do Github. Da mesma forma, se você tiver alguma dúvida ou apenas quiser superar as idéias de outras pessoas, não hesite em publicá -las no fórum também.

Observe que, como este repositório contém o código correspondente a um livro de impressão, atualmente não posso aceitar contribuições que estenderiam o conteúdo do código principal do capítulo, pois ele introduziria desvios do livro físico. Mantê -lo consistente ajuda a garantir uma experiência suave para todos.

Citação

Se você achar este livro ou código útil para sua pesquisa, considere citá -lo.

Citação no estilo de Chicago:

Raschka, Sebastian. Crie um modelo de linguagem grande (do zero) . Manning, 2024. ISBN: 978-1633437166.

Entrada Bibtex:

 @book{build-llms-from-scratch-book,
  author       = {Sebastian Raschka},
  title        = {Build A Large Language Model (From Scratch)},
  publisher    = {Manning},
  year         = {2024},
  isbn         = {978-1633437166},
  url          = {https://www.manning.com/books/build-a-large-language-model-from-scratch},
  github       = {https://github.com/ranpy13/Learning-LLM}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-11
tamanho 1.67MB
Vindo de Github

Aplicativos Relacionados

TensorRT LLM

2024-11-10
Parameter Efficient Transfer Learning Benchmark

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Aprendizagem PHP5 (Aprendendo PHP)

2009-05-24
OReilly Aprendendo PHP e MySQL 2ª Edição

2009-05-24

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos