Téléchargement Learning LLM - Téléchargement du code source Learning LLM

Learning LLM

Code Source AI

1.0.0

Télécharger

Construisez un grand modèle de langue (à partir de zéro)

Ce référentiel contient le code pour le développement, la pré-entraînement et le déseturation d'un LLM de type GPT et est le référentiel de code officiel pour le livre Build a un grand modèle de langue (à partir de zéro).

Dans Build A Large Language Model (à partir de zéro) , vous apprendrez et comprendrez comment les grands modèles de langue (LLMS) fonctionnent de l'intérieur en les codant à partir de zéro, étape par étape. Dans ce livre, je vous guiderai à travers la création de votre propre LLM, expliquant chaque étape avec du texte, des diagrammes et des exemples clairs.

La méthode décrite dans ce livre pour la formation et le développement de votre propre modèle petit mais fonctionnel à des fins éducatives reflète l'approche utilisée pour créer des modèles fondamentaux à grande échelle tels que ceux derrière Chatgpt. De plus, ce livre comprend du code pour charger les poids de modèles pré-entraînés plus grands pour les fusions.

Lien vers le référentiel officiel du code source
Lien vers le livre à Manning
Lien vers la page du livre sur Amazon
ISBN 9781633437166

Pour télécharger une copie de ce référentiel, cliquez sur le bouton Télécharger Zip ou exécutez la commande suivante dans votre terminal:

git clone --depth 1 https://github.com/ranpy13/Learning-LLM.git

(Si vous avez téléchargé le bundle de code sur le site Web de Manning, veuillez envisager de visiter le référentiel de code officiel sur GitHub à https://github.com/ranpy13/learning-llm pour les dernières mises à jour.)

Table des matières

Veuillez noter que ce fichier README.md est un fichier Markdown ( .md ). Si vous avez téléchargé ce bundle de code à partir du site Web de Manning et que vous le consultez sur votre ordinateur local, je recommande d'utiliser un éditeur ou un aperçu de Markdown pour une visualisation appropriée. Si vous n'avez pas encore installé un éditeur de Markdown, MarkText est une bonne option gratuite.

Vous pouvez également afficher ceci et d'autres fichiers sur github sur https://github.com/ranpy13/learning-llm dans votre navigateur, qui rend automatiquement Markdown.

Conseil

Si vous cherchez des conseils sur l'installation de packages Python et Python et la configuration de votre environnement de code, je suggère de lire le fichier readme.md situé dans le répertoire de configuration.

Titre de chapitre	Code principal (pour un accès rapide)	Tout code + supplémentaire
Recommandations de configuration	-	-
CH 1: comprendre de grands modèles de langue	Pas de code	-
CH 2: Travailler avec des données de texte	- ch02.ipynb - dataloader.ipynb (résumé) - Exercice-solutions.ipynb	./CH02
CH 3: Mécanismes d'attention de codage	- ch03.ipynb - Multihead-Atention.Ipynb (Résumé) - Exercice-solutions.ipynb	./Ch03
CH 4: Implémentation d'un modèle GPT à partir de zéro	- ch04.ipynb - gpt.py (résumé) - Exercice-solutions.ipynb	./Ch04
CH 5: pré-entraîner les données non marquées	- ch05.ipynb - gpt_train.py (résumé) - gpt_generate.py (résumé) - Exercice-solutions.ipynb	./CH05
CH 6: Finetuning pour la classification du texte	- ch06.ipynb - gpt_class_finetune.py - Exercice-solutions.ipynb	./CH06
CH 7: Finetuning pour suivre les instructions	- ch07.ipynb - gpt_instruction_finetuning.py (résumé) - olllama_evaluate.py (résumé) - Exercice-solutions.ipynb	./Ch07
Annexe A: Introduction à Pytorch	- code-parti1.ipynb - code-parti2.Ipynb - ddp-script.py - Exercice-solutions.ipynb	./APPENDIX-A
Annexe B: références et lecture complémentaire	Pas de code	-
Annexe C: Solutions d'exercice	Pas de code	-
Annexe D: Ajouter des cloches et des sifflets à la boucle de formation	- Annexe-D.ipynb	./Apendedix-D
Annexe E: Finetuning économe en paramètres avec LORA	- Annexe-e.ipynb	./APPENDIX-E

Le modèle mental ci-dessous résume le contenu couvert dans ce livre.

Exigences matérielles

Le code dans les chapitres principaux de ce livre est conçu pour fonctionner sur des ordinateurs portables conventionnels dans un délai raisonnable et ne nécessite pas de matériel spécialisé. Cette approche garantit qu'un large public peut s'engager avec le matériel. De plus, le code utilise automatiquement les GPU s'ils sont disponibles. (Veuillez consulter le document de configuration pour des recommandations supplémentaires.)

Matériel bonus

Plusieurs dossiers contiennent des matériaux facultatifs en bonus pour les lecteurs intéressés:

Installation
- Conseils de configuration Python
- Installation de packages et de bibliothèques Python utilisées dans ce livre
- Guide de configuration de l'environnement Docker
Chapitre 2:
- Comparaison de diverses implémentations de codage de paires d'octets (BPE)
- Comprendre la différence entre les couches d'intégration et les couches linéaires
- Intuition de dataloder avec des nombres simples
Chapitre 3:
- Comparaison des implémentations d'attention multiples efficaces
- Comprendre les tampons pytorch
Chapitre 4:
- Analyse des flops
Chapitre 5:
- Chargement de poids alternatif à partir de la hub de modèle de visage étreint à l'aide de transformateurs
- GPT de pré-entraînement sur l'ensemble de données du projet Gutenberg
- Ajouter des cloches et des sifflets à la boucle d'entraînement
- Optimisation des hyperparamètres pour pré-formation
- Construire une interface utilisateur pour interagir avec le LLM pré-entraîné
Chapitre 6:
- Des expériences supplémentaires en train de mener des couches différentes et en utilisant des modèles plus grands
- Finetuning différents modèles sur un ensemble de données de revue de film IMDB 50K
- Construire une interface utilisateur pour interagir avec le classificateur de spam basé sur GPT
Chapitre 7:
- Utilitaires d'ensemble de données pour trouver des doublons proches et créer des entrées vocales passives
- Évaluation des réponses des instructions à l'aide de l'API OpenAI et Olllay
- Génération d'un ensemble de données pour l'instruction Finetuning
- Amélioration d'un ensemble de données pour l'instruction Finetuning
- Génération d'un ensemble de données de préférence avec LLAMA 3.1 70B et Olllama
- Optimisation directe des préférences (DPO) pour l'alignement LLM
- Construire une interface utilisateur pour interagir avec le modèle GPT Finetuned Instruction

Questions, commentaires et contribution à ce référentiel

Je salue toutes sortes de commentaires, mieux partagés via les discussions Manning Forum ou GitHub. De même, si vous avez des questions ou si vous souhaitez simplement faire rebondir les idées des autres, n'hésitez pas également à les publier dans le forum.

Veuillez noter que comme ce référentiel contient le code correspondant à un livre d'impression, je ne peux actuellement pas accepter les contributions qui étendraient le contenu du code de chapitre principal, car il introduirait les écarts par rapport au livre physique. Le garder cohérent permet d'assurer une expérience fluide pour tout le monde.

Citation

Si vous trouvez ce livre ou code utile pour vos recherches, veuillez envisager de le citer.

Citation de style Chicago:

Raschka, Sebastian. Construisez un grand modèle de langue (à partir de zéro) . Manning, 2024. ISBN: 978-1633437166.

Entrée Bibtex:

 @book{build-llms-from-scratch-book,
  author       = {Sebastian Raschka},
  title        = {Build A Large Language Model (From Scratch)},
  publisher    = {Manning},
  year         = {2024},
  isbn         = {978-1633437166},
  url          = {https://www.manning.com/books/build-a-large-language-model-from-scratch},
  github       = {https://github.com/ranpy13/Learning-LLM}
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-11
taille 1.67MB
Provenant de Github

Applications connexes

TensorRT LLM

2024-11-10
Parameter Efficient Transfer Learning Benchmark

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Apprentissage PHP5 (Apprentissage PHP)

2009-05-24
OReilly Learning PHP et MySQL 2e édition

2009-05-24

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout