Dieses Repository enthält die Laborarbeit für den Coursera -Kurs auf "generativen KI mit großartigen Modellen".
Führen Sie die Dialogübersicht mit der generativen AI durch. Experimentieren Sie mit dem Kontextlernen wie Null -Shot, einem Schuss und wenigen Schussschlendern und den zugehörigen Konfigurationsparametern mit Inferenz, um die Ergebnisse zu beeinflussen.
Führen Sie eine Feinabstimmung der Anweisungen auf einem vorhandenen LLM vom Umarmungsgesicht, Flan-T5-Modell durch. Erforschen Sie sowohl die vollständige Feinabstimmung als auch die PEFT -Methoden (Parameter effiziente Feinabstimmung) wie LORA (Anpassung mit niedriger Rang) und die Bewertung unter Verwendung von Rouge -Metriken.
Weitere feine Melodie Ein Flan-T5-Modell mit Verstärkungslernen mit einem Belohnungsmodell wie dem Hassreden-Belohnungsmodell von Meta Ai, um weniger giftige Zusammenfassungen zu erzeugen. Verwenden Sie die proximale Richtlinienoptimierung (PPO), um das Modell zu optimieren und zu entgiften.