Il s'agit du code de support pour les ensembles de données tabulaires générant du papier sous confidentialité différentielle.
Veuillez consulter un aperçu rapide de mon blog.
TablediFusion est un projet axé sur la fourniture de modèles génératifs différentiellement privés pour les données tabulaires sensibles. L'objectif est de permettre la synthèse des données qui maintient les propriétés statistiques de l'ensemble de données d'origine tout en garantissant la confidentialité des informations des individus.
Le modèle le plus notable de ce travail est TableDiffusion , le premier modèle de diffusion différentiellement privé pour les données tabulaires. Voir Tablediffusion / Modèles / Table_Diffusion.py
️ Avertissement : Cette base de code est destinée à des fins de recherche uniquement et n'est pas prête pour une utilisation en production. La mise en œuvre actuelle peut ne pas préserver les garanties de confidentialité en raison des paramètres de semences et d'échantillonneur qui ne conviennent pas à un environnement de production.
https://youtu.be/2qrrgwoxob4
Truda, Gianluca. "Génération d'ensembles de données tabulaires sous confidentialité différentielle." ARXIV PRÉALLAGE ARXIV: 2308.14784 (2023).
@article{truda2023generating,
title={Generating tabular datasets under differential privacy},
author={Truda, Gianluca},
journal={arXiv preprint arXiv:2308.14784},
year={2023}
}