Generative AI with Large Language Models
1.0.0
該存儲庫包含有關Coursera課程的實驗室工作,該課程是“具有大語言模型的生成AI”。
使用生成AI執行對話框摘要。在上下文學習中進行實驗,例如零拍攝,一擊和很少的射擊推斷和與調節相關的配置參數,以影響結果。
通過Flan-T5型號在現有的LLM上進行指導微調。探索完整的微調以及PEFT(參數有效調諧)方法,例如LORA(低級適應)和使用Rouge指標進行評估。
使用獎勵模型(例如Meta AI的仇恨言論獎勵模型),進一步微調了Flan-T5模型,以產生較小的毒性摘要。使用近端策略優化(PPO)微調和排毒模型。