ydata synthetic Download - ydata synthetic Quellcode herunterladen

ydata synthetic

Python

2.0.0

Herunterladen

Machen Sie mit

Ydata synthetisch

YData-Synthetic ist ein Open-Source-Paket, das 2020 mit dem Hauptziel entwickelt wurde, um Benutzer über generative Modelle für die Erzeugung der synthetischen Daten aufzuklären. Als Sammlung von Modellen wurde es für explorative Studien und Bildungszwecke bestimmt. Es wurde jedoch nicht für die Qualitäts-, Leistung und Skalierbarkeitsanforderungen optimiert, die normalerweise von Organisationen erforderlich sind.

!!! Beachten Sie "Update", obwohl die Reise Spaß gemacht hat, und wir haben viel aus der Community gelernt. Es ist jetzt an der Zeit, ydata-synthetic zu verbessern. Auf dem Weg zur Zukunft der synthetischen Datengenerierung empfehlen wir den Benutzern, zu ydata-sdk zu übergehen, was ein überlegenes Erlebnis mit verbesserter Leistung, Präzision und Benutzerfreundlichkeit bietet und es zum bevorzugten Werkzeug für die Erzeugung synthetischer Daten und eine perfekte Einführung in die generative KI macht.

Synthetische Daten

Was sind synthetische Daten?

Synthetische Daten sind künstlich generierte Daten, die nicht von Ereignissen der realen Welt erfasst werden. Es repliziert die statistischen Komponenten realer Daten, ohne identifizierbare Informationen zu enthalten, um die Privatsphäre des Einzelnen sicherzustellen.

Warum synthetische Daten?

Synthetische Daten können für viele Anwendungen verwendet werden:

Privatsphäre Einhaltung von Datenaustausch und Entwicklung des maschinellen Lernens
Verzerrung entfernen
Gleichgewichtsdatensätze
Datensätze erweitern

Suchen Sie nach einer End-to-End-Lösung für die Erzeugung der synthetischen Daten?
Ydata Fabric ermöglicht die Erzeugung hochwertiger Datensätze innerhalb einer vollständigen Benutzeroberflächenerfahrung, von Datenvorbereitung bis hin zur Erzeugung und Bewertung der synthetischen Daten.
Schauen Sie sich die Community -Version an.

ydata-synthetisch an ydata-sdk

Mit dem bevorstehenden Update von ydata-synthetic an ydata-sdk haben Benutzer nun Zugriff auf eine einzelne API, die automatisch das beste generative Modell für ihre Daten auswählt und optimiert. Dieser optimierte Ansatz beseitigt die Notwendigkeit, zwischen verschiedenen Modellen manuell zu wählen, da die API das optimale Modell basierend auf dem spezifischen Datensatz und des Anwendungsfalls intelligent identifiziert.

Anstatt manuell aus Modellen wie:

Gan
Cgan (bedingte Gan)
Wgan (Wasserstein Gan)
WGAN-GP (Wassertein Gan mit Gradientenstrafe)
Dragan (Deep Conferation Analytic Gan)
Cramer Gan (Cramer -Entfernungslösung für voreingenommene Wasserstein -Gradienten)
CWGAN-GP (Conditional Wassertein Gan mit Gradientenstrafe)
Ctgan (bedingte tabellarische Gan)
Timegan (speziell für Zeitreihendaten )
Doppelgänger (speziell für Zeitreihendaten )

Die neue API übernimmt automatisch die Modellauswahl und optimiert die beste Leistung in Bezug auf Treue, Nutzen und Privatsphäre. Dies vereinfacht den Prozess der synthetischen Datenerzeugung erheblich und sorgt dafür, dass Benutzer die höchste Ausgabe von höchster Qualität erhalten, ohne dass manuelle Interventionen und anstrengende Hyperparameterabstimmungen benötigen.

Sind Sie bereit, mehr über synthetische Daten und die Best-Practices für die Erzeugung von synthetischen Daten zu erfahren? Weitere Materialien zur Erzeugung der synthetischen Daten mit Python finden Sie in der Dokumentation.

QuickStart

Binäre Installateure für die neueste Version sind im Python Package Index (PYPI) erhältlich.

 pip install ydata-sdk

Der UI -Leitfaden für synthetische Datenerzeugung

Ydata Fabric bietet eine UI -Schnittstelle, die Sie durch die Schritte und Eingaben führt, um Strukturdaten zu generieren. Sie können heute mit Ydata Fabric experimentieren, indem Sie die Community -Version registrieren.

Beispiele

Hier finden Sie Nutzungsbeispiele für das Paket und die Modelle, um tabellarische Daten zu synthetisieren.

Tabelle synthetische Datengenerierung auf dem Titanic Kaggle -Datensatz
Zeitreihen -synthetische Datenerzeugung
Weitere Beispiele werden kontinuierlich hinzugefügt und können im Beispielverzeichnis gefunden werden.

Datensätze, mit denen Sie experimentieren können

Hier sind einige Beispiel -Datensätze, die Sie mit den Synthesizern ausprobieren können:

Tabellarische Datensätze

Zensus für Erwachsene
Kreditkartenbetrug
Herz -Kreislauf -Erkrankungsdatensatz

Sequentielle Datensätze

Aktiendaten
FCC -MBA -Daten

Projektressourcen

Nachfolgend finden Sie nützliche Literatur zum Generieren von synthetischen Daten und verfügbaren generativen Modellen:

Tabellarische Daten

Gan
Cgan (bedingte Gan)
Wgan (Wasserstein Gan)
WGAN-GP (Wassertein Gan mit Gradientenstrafe)
Dragan (über Konvergenz und Stabilität von Gans)
Cramer Gan (die Cramer -Entfernung als Lösung für voreingenommene Wasserstein -Gradienten)
CWGAN-GP (Conditional Wassertein Gan mit Gradientenstrafe)
Ctgan (bedingte tabellarische Gan)
Gaußsche Mischung

Sequentielle Daten

Timegan
Doppelgänger

Unterstützung

Für die Unterstützung bei der Verwendung dieser Bibliothek treten Sie auf unserem Discord -Server bei. Unsere Discord -Community ist sehr freundlich und großartig, wenn es darum geht, Fragen zur Verwendung und Entwicklung der Bibliothek schnell zu beantworten. Klicken Sie hier, um unserer Discord -Community beizutreten!

FAQs

Haben Sie eine Frage? Schauen Sie sich die häufig gestellten Fragen zu ydata-synthetic an. Wenn Sie das Gefühl haben, dass etwas fehlt, können Sie gerne einen bärtigen informellen Chat mit uns buchen.