Dies ist der unterstützende Code für das Papier, das tabellarische Datensätze unter Differential Privatsphäre generiert.
Bitte sehen Sie sich einen kurzen Überblick in meinem Blog an.
TabledSiffusion ist ein Projekt, das sich auf die Bereitstellung von differentiell privaten generativen Modellen für sensible tabellarische Daten konzentriert. Ziel ist es, die Synthese von Daten zu aktivieren, die die statistischen Eigenschaften des ursprünglichen Datensatzes beibehalten und gleichzeitig die Privatsphäre der Informationen des Einzelnen sicherstellen.
Das bemerkenswerteste Modell aus dieser Arbeit ist die sortierende TableDiffusion für tabellarische Daten. Siehe tabledSiffusion/models/table_diffusion.py
Euen Haftungsausschluss : Diese Codebasis ist nur für Forschungszwecke bestimmt und ist nicht bereit für die Produktion. Die aktuelle Implementierung kann aufgrund von Saatgut- und Stichprobeneinstellungen, die für eine Produktionsumgebung nicht geeignet sind, keine Datenschutzgarantie beibehalten.
https://youtu.be/2qrrgwoxob4
Truda, Gianluca. "Generieren von tabellarischen Datensätzen unter differentieller Privatsphäre." Arxiv Preprint Arxiv: 2308.14784 (2023).
@article{truda2023generating,
title={Generating tabular datasets under differential privacy},
author={Truda, Gianluca},
journal={arXiv preprint arXiv:2308.14784},
year={2023}
}