Это вспомогательный код для бумаги, генерирующих табличные наборы данных в рамках дифференциальной конфиденциальности.
Пожалуйста, ознакомьтесь с быстрым обзором в моем блоге.
TableDiffusion-это проект, ориентированный на предоставление различных частных генеративных моделей для конфиденциальных табличных данных. Цель состоит в том, чтобы обеспечить синтез данных, которые сохраняют статистические свойства исходного набора данных, обеспечивая при этом конфиденциальность информации отдельных лиц.
Наиболее заметной моделью из этой работы является TableDiffusion , первая диффузионная модель диффузии с диффузией для табличных данных. См. TableDiffusion/Models/table_diffusion.py
️ Отказ от ответственности : эта кодовая база предназначена только для исследовательских целей и не готова к использованию производства. Нынешняя реализация может не сохранить гарантии конфиденциальности из -за настройки семян и пробоотборника, которые не подходят для производственной среды.
https://youtu.be/2qrrgwoxob4
Труда, Джанлука. «Создание табличных наборов данных при дифференциальной конфиденциальности». Arxiv Preprint arxiv: 2308.14784 (2023).
@article{truda2023generating,
title={Generating tabular datasets under differential privacy},
author={Truda, Gianluca},
journal={arXiv preprint arXiv:2308.14784},
year={2023}
}