Generative AI with Large Language Models
1.0.0
该存储库包含有关Coursera课程的实验室工作,该课程是“具有大语言模型的生成AI”。
使用生成AI执行对话框摘要。在上下文学习中进行实验,例如零拍摄,一击和很少的射击推断和与调节相关的配置参数,以影响结果。
通过Flan-T5型号在现有的LLM上进行指导微调。探索完整的微调以及PEFT(参数有效调谐)方法,例如LORA(低级适应)和使用Rouge指标进行评估。
使用奖励模型(例如Meta AI的仇恨言论奖励模型),进一步微调了Flan-T5模型,以产生较小的毒性摘要。使用近端策略优化(PPO)微调和排毒模型。