gdc
1.0.0
Le contrôle de distribution génératif (GDC) est un cadre général pour imposer des contraintes aux échantillons de modèles de langage pré-étendus. Les contraintes peuvent être soit ponctuelles (par exemple, tous les échantillons doivent être non offensifs) ou la distribution (par exemple, un pourcentage spécifié d'échantillons doit mentionner les femmes).
Ce repo contient du code accompagnant les trois articles suivants:
/dpg : une approche distributionnelle de la génération de texte contrôlée (ICLR 2021)/cdpg : contrôler les modèles de langage conditionnel sans oublier catastrophique (ICML 2022)/rm_vs_dm : Sur l'apprentissage du renforcement et l'appariement de distribution pour les modèles de langage final sans oublie catastrophique (Neirips 2022)