GPT from Scratch with Tensorflow -Download - GPT from Scratch with Tensorflow Source Code Download

GPT from Scratch with Tensorflow

AI-Quellcode

1.0.0

Herunterladen

Genesismus-Building-GPT-From-Scratch

GPT "Generative PreAnt Transformator" ist die erste Version der GPT-Serie von Modellen, die natürliche Sprachverarbeitung mit ihren autoregressiven Sprachmodellierungsfunktionen revolutionierte, die auf der Transformatorarchitektur basieren.

Überblick

Dieses Projekt ist eine Implementierung des GPT-Modells (Generative Pre-trainierte Transformator) von Grund auf den TensorFlow. Es enthält alle Komponenten des Modells, wie die Positionsbettendings, Aufmerksamkeitsmechanismus, Vorwärtsschichten und mehr.

Wichtiger Hinweis: Ziel dieses Projekts ist es, die GPT -Architektur und ihre innere Funktionsweise ein tiefes Verständnis zu vermitteln. Es ist also hauptsächlich für Bildungszwecke. Sie können die Struktur und den Arbeitsmechanismus dieses Modells hier vollständig verstehen und die Komponenten verwenden, die ich in Ihren Projekten implementiert habe. Wenn Sie das Projekt verwenden möchten, um Ihr Sprachmodell mit Big Data zu trainieren, müssen Sie im Allgemeinen die Datensatzdatei ändern, um Big Data effizienter zu verarbeiten. Ich habe die Datensatzdatei hauptsächlich so gestaltet, dass einfache, nicht große Daten verarbeitet werden, da ich in dieser Hinsicht jetzt nicht bin.

Es gibt mehrere Versionen des GPT. Diese Implementierung konzentriert sich hauptsächlich auf die Implementierung von "Verbesserung des Sprachverständnisses durch generatives Vorverbrauch".

Projektstruktur

config.py : Konfigurationsdatei für Modellhyperparameter.
decoder.py : GPT -Decoder.
positional_embeddings.py : Positionseinbettungserzeugung.
embeddings.py : Token -Einbettungserzeugung.
attention.py : Selbstbekämpfungsmechanismus.
feed_forward.py : Neuronales Feed-Forward-Netzwerk.
lr_schedule.py : Planung der Lernrate.
utils.py : Versorgungsfunktionen für Training und Inferenz.
loss_functions.py : benutzerdefinierte Verlustfunktionen.
metrics.py : benutzerdefinierte Bewertungsmetriken.
streamer.py : Data Streamer für ein effizientes Training.
gpt_model.py : Haupt -GPT -Modellimplementierung.
bpe_tokenizer.py : Tokenizer für BPE (Byte -Paar -Kodierung) Tokenisierung.
tokenizer.py : Vorausgebildeter GPT-Tokenizer.
prepare_dataset.py : Eine Datei, über die wir einige Vorgänge im Datensatz ausführen (Erstellen eines speziellen Ordners für Validierungsdaten).
inferance.py : Eine Datei, die zum Generieren von Sätzen aus dem Modell basierend auf der Eingabeaufforderung erforderlich ist.
tmp/ : Verzeichnis zum Speichern von Modellkontrollpunkten.
demo/ : Projektdokumentation.
tokenizer/ : Verzeichnis zum Speichern des umkassierten Tokens.
dummy_data/ : Verzeichnis, in dem wir einige Daten einstellen, um den Streamer zu testen.

Anforderungen

Python 3.10.6
Tensorflow 2.12.0
Transformatoren 4.33.2 (nur für Tokenizer)

Dokumentation

Eine detaillierte Projektdokumentation finden Sie im demo/ Verzeichnis. Es enthält Erklärungen der GPT -Architektur, Schulungsverfahren und der Verwendung des Modells für verschiedene Aufgaben zur Verarbeitung natürlicher Sprache.

Verwendung

Klonen Sie das Repository:

git clone https://github.com/AliHaiderAhmad001/GPT-from-Scratch-with-Tensorflow.git
cd GPT-from-Scratch-with-Tensorflow

Erstellen Sie eine virtuelle Umgebung (optional, aber empfohlen):

python -m venv venv
source venv/bin/activate  # On Windows: venvScriptsactivate

Projektabhängigkeiten installieren:
```
pip install -r requirements.txt
```
Download und vorbereiten Sie den Datensatz: Sie können die Demo überprüfen. Sie können an demselben Datensatz arbeiten, diese ändern oder Ihre Einstellungen anpassen. Sie können den Datensatz jedoch hier direkt herunterladen. Sie können einen Teil davon zur Validierung über den folgenden Code nehmen:
```
python prepare_dataset.py aclImdb/test aclImdb/valid --num_files_to_move 2500
```

Der von mir verwendete Datenloader erfordert den Validierungssatz, um sich in einem separaten Ordner zu befinden.

Optional können Sie GPT-Tokinizer erneut ausbauen:

python bpe_tokenizer.py aclImdb --batch_size 1000 --vocab_size 50357 --save --save_fp tokenizer/adapted-tokenizer

Trainieren Sie das GPT -Modell (geben Sie bei Bedarf spezifischere Anweisungen an):
- Mit dem Training von Grund auf zu beginnen: python train.py
- Um das Training von einem Kontrollpunkt aus wieder aufzunehmen: python train.py --resume

Sätze erzeugen. Sie können den folgenden Befehl verwenden, um Text mit Ihrem Skript zu generieren:

python inferance.py " input_text_prompt " --sampler " greedy "  # For greedy sampling

Oder:

python inferance.py " input_text_prompt " --sampler " beam " --beam_width 5  # For beam search sampling with a beam width of 5

Lizenz

Dieses Projekt ist unter der MIT -Lizenz lizenziert. Weitere Informationen finden Sie in der Lizenzdatei.

Anerkennung

Openai GPT.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2025-09-10
Größe 1.17MB
Kommt von Github

Ähnliche Anwendungen

Flucht vor

2022-08-20
Entkomme Tarko

2022-08-09
Ein Kuss vom Tod

2022-08-01
Flucht aus der Terrorstadt

2022-07-31
Flucht aus der Schule

2022-07-29
Flucht von Monkey Island

2022-07-24

GPT from Scratch with Tensorflow

Genesismus-Building-GPT-From-Scratch

Überblick

Projektstruktur

Anforderungen

Dokumentation

Verwendung

Lizenz

Anerkennung

Flucht vor

Entkomme Tarko

Ein Kuss vom Tod

Flucht aus der Terrorstadt

Flucht aus der Schule

Flucht von Monkey Island

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express