Extracting Training Data from Large Langauge Models Download - Extracting Training Data from Large Langauge Models Quellcode Download

Extracting Training Data from Large Langauge Models

AI-Quellcode

1.0.0

Herunterladen

Extrahieren von Trainingsdaten aus großen Langauge -Modellen

Eine Neuimplementierung des "Extrahierens von Trainingsdaten aus Großsprachenmodellen" von Carlini et al. Das Papier verfügt bereits über eine offizielle Implementierung - https://github.com/ftramer/lm_memorization, aus der ich Teile des Codes geliehen habe und gleichzeitig die Lesbarkeit einiger Funktionen verbessert.

Das offizielle Repository behandelt jedoch nicht -

Probenahmemethode - Probenahme mit einer Verfallstemperatur (Abschnitt 5.1.1 des Papiers)
Metrik - Mindestverwirrung in einem Schieberfenster (Abschnitt 5.2 des Papiers)

Ich war wirklich fasziniert von der Zeitung und wollte es selbst umsetzen. Wie bei der offiziellen Implementierung habe ich auch eine modples.md-Datei aufgenommen, die einige der auswendig gelernten Inhalte enthält, die ich aus GPT-2 extrahieren könnte. Obwohl ich in der Lage bin, einige interessante inhaltliche Inhalte zu finden, haben die Ergebnisse immer noch einige Einschränkungen -

Aufgrund von Rechenzeitbeschränkungen konnte ich nur 25.000 Proben für jede Stichprobenmethode erstellen (im Vergleich zu 600.000, die von den Papierautoren generiert wurden)
Aufgrund von Speicherbeschränkungen konnte ich das metrische Verhältnis von logarithmischen Durchläufen von GPT2-XL und GPT2-Medium nicht einbeziehen. Ich habe den Code dafür in das Skript einbezogen und wenn man ausreichend berechnet hat, können sie die relevanten Zeilen überzeugen und diese Metrik auch einbeziehen.

Anforderungen

Pytorch
Transformatoren
Numpy
Tqdm

Oder direkt

pip install -r requirements.txt

Daten extrahieren

Metriken für das Ranking

Die erzeugten Proben werden nach sechs in der Arbeit eingeführten sechs Mitgliedschaftsmetriken eingestuft:

Die Protokolldurchlässigkeit des GPT2-XL-Modells
Das Verhältnis der logarithmischen Perplexitäten des GPT2-XL-Modells und des GPT2-Small-Modells
Das Verhältnis der logarithmischen Perplexitäten des GPT2-XL-Modells und des GPT2-MEDIUM-Modells (implementiert, aber nicht aufgrund von Berechnungsbeschränkungen ausgeführt werden konnten)
Das Verhältnis des logarithmischen Verwirrens von GPT2-XL und der von ZLIB geschätzten Entropie der Stichprobe
Das Verhältnis der logarithmischen Perplexitäten des GPT2-XL für die erzeugte Probe und dieselbe Probe in Buchstaben unter den Niederlagen
Die minimale Protokolldurchlässigkeit von GPT2-XL am Fenster der Größe 50

Die Top -10 -Proben entsprechend jeder Metrik werden ausgedruckt, und die Top 100 Proben gemäß jeder Metrik AE, die in der Outfile protokolliert sind. Diese Stichproben enthalten wahrscheinlich einen wörtlichen Text aus den GPT-2-Trainingsdaten.

Top-K-Probenahme

 python extraction_top_n.py --N 5000 --batch_size 20 --outfile top_n_samples.txt

Dies erzeugt 5000 Proben mit GPT2-XL. Die Proben werden mit Top-K-Stichproben (K = 40) und einer leeren Eingabeaufforderung erzeugt.

Temperaturverfall

 python extraction_temperature_decay.py --N 5000 --batch_size 20 --outfile temperature_decay_samples.txt

Dies erzeugt 5000 Proben mit GPT2-XL. Die Proben werden mit Probenahme mit Temperaturabfall erzeugt (zerfallen die Softmax -Temperatur von 10 bis 1 oder die ersten 20 Token und 1 für alle nachfolgenden Token) und eine leere Eingabeaufforderung.

Konditionierung im Internettext

In dem Papier versuchten die Autoren auch, das GT2-XL-Modell mit Textausschnitten aus dem Web (Commoncrawl) zu veranlassen, was die Wahrscheinlichkeit des Modells, den sich ausgelernten Inhalten erzeugte, erhöhte.

Ich habe die gleiche Probe des Crawl vom Mai 2021 (~ 350 MB) verwendet, der von den Autoren verwendet wurde.

 ./download_cc.sh

Dann,

 python extraction_commoncrawl.py --N 5000 --batch_size 20 --outfile commoncrawl_samples.txt

Alle erzeugten Sequenzen haben eine endgültige Länge von erstklassigen 256 Token.

Probenausgänge

Einige interessante Ausgänge, die aus GPT-2 extrahiert wurden, finden Sie hier.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2025-09-06
Größe 40.66KB
Kommt von Github

Ähnliche Anwendungen

llama models

2024-11-10
EMIT Data Resources

2024-11-09
pytorch image models

2024-11-03
Ensemble-Ausbildung

2023-08-15
Biologisches Data Mining

2010-03-22
Intelligente Datenwiederherstellung

2009-06-18

Extracting Training Data from Large Langauge Models

Extrahieren von Trainingsdaten aus großen Langauge -Modellen

Anforderungen

Daten extrahieren

Metriken für das Ranking

Top-K-Probenahme

Temperaturverfall

Konditionierung im Internettext

Probenausgänge

llama models

EMIT Data Resources

pytorch image models

Ensemble-Ausbildung

Biologisches Data Mining

Intelligente Datenwiederherstellung

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express