Generative AI with Large Language Models
1.0.0
このリポジトリには、「大規模な言語モデルを持つ生成AI」に関するCourseraコースのラボ作業が含まれています。
生成AIを使用してダイアログ要約を実行します。ゼロショット、1つのショット、いくつかのショットの推論、および影響を与えるための推論で関連する構成パラメーターをチューニングするなどのコンテキスト学習で実験します。
Flan-T5モデルの抱きしめから既存のLLMで監督の微調整を実行します。 LORA(低ランク適応)などのPEFT(パラメーター効率的な微調整)と、ルージュメトリックを使用した評価の両方を探索します。
Meta AIのヘイトスピーチ報酬モデルなどの報酬モデルを使用して、強化学習を使用して、補強材の概要を生成するための報酬モデルを使用して、Flan-T5モデルをさらに微調整します。近位ポリシー最適化(PPO)を使用して、モデルを微調整および解毒します。