La herramienta de identificación de riesgos de Python para IA generativa (Pyrit) es un marco de código abierto creado para capacitar a los profesionales e ingenieros de seguridad para identificar de manera proactiva los riesgos en los sistemas de IA generativos.
Este proyecto puede contener marcas comerciales o logotipos para proyectos, productos o servicios. El uso autorizado de marcas o logotipos de Microsoft está sujeto y debe seguir las pautas de marca y marca de Microsoft. El uso de marcas registradas de Microsoft o logotipos en versiones modificadas de este proyecto no debe causar confusión o implicar el patrocinio de Microsoft. Cualquier uso de marcas comerciales o logotipos de terceros está sujeto a las políticas de esas partes de terceros.
Si usa Pyrit en su investigación, cite nuestro artículo de preimpresión de la siguiente manera:
@misc{munoz2024pyritframeworksecurityrisk,
title={PyRIT: A Framework for Security Risk Identification and Red Teaming in Generative AI Systems},
author={Gary D. Lopez Munoz and Amanda J. Minnich and Roman Lutz and Richard Lundeen and Raja Sekhar Rao Dheekonda and Nina Chikanov and Bolor-Erdene Jagdagdorj and Martin Pouliot and Shiven Chawla and Whitney Maxwell and Blake Bullwinkel and Katherine Pratt and Joris de Gruyter and Charlotte Siska and Pete Bryan and Tori Westerhoff and Chang Kawaguchi and Christian Seifert and Ram Shankar Siva Kumar and Yonatan Zunger},
year={2024},
eprint={2410.02828},
archivePrefix={arXiv},
primaryClass={cs.CR},
url={https://arxiv.org/abs/2410.02828},
}
Además, cita la herramienta en sí siguiendo el archivo CITATION.cff en la raíz de este repositorio.