gdc
1.0.0
O controle de distribuição generativa (GDC) é uma estrutura geral para impor restrições a amostras de modelos de linguagem pré -treinados. As restrições podem ser pontuais (por exemplo, todas as amostras devem ser não ofensivas) ou distributivas (por exemplo, uma porcentagem especificada de amostras deve mencionar as mulheres).
Este repo contém código que acompanha os três artigos a seguir:
/dpg : Uma abordagem de distribuição para geração de texto controlada (ICLR 2021)/cdpg : Controlando modelos de linguagem condicional sem esquecimento catastrófico (ICML 2022)/rm_vs_dm : na correspondência de aprendizado e distribuição de reforço para modelos de linguagem de ajuste fino, sem esquecimento catastrófico (Neurips 2022)