Este es el código de soporte para los conjuntos de datos tabulares que generan papel bajo privacidad diferencial.
Echa un vistazo a una descripción general rápida en mi blog.
Tablediffusion es un proyecto centrado en proporcionar modelos generativos diferencialmente privados para datos tabulares confidenciales. El objetivo es habilitar la síntesis de datos que mantenga las propiedades estadísticas del conjunto de datos original al tiempo que garantiza la privacidad de la información de las personas.
El modelo más notable de este trabajo es TableDiffusion , el primer modelo de difusión diferencial-privado para datos tabulares. Ver Tablediffusion/Models/table_diffusion.py
️ Descargo de responsabilidad : esta base de código está destinada solo a fines de investigación y no está listo para el uso de producción. La implementación actual no puede preservar las garantías de privacidad debido a la configuración de semillas y muestras que no son adecuadas para un entorno de producción.
https://youtu.be/2qrrgwoxob4
Truda, Gianluca. "Generar conjuntos de datos tabulares bajo privacidad diferencial". Preimpresión ARXIV ARXIV: 2308.14784 (2023).
@article{truda2023generating,
title={Generating tabular datasets under differential privacy},
author={Truda, Gianluca},
journal={arXiv preprint arXiv:2308.14784},
year={2023}
}