
BHI 2023 Tutorial (Okt. 2023)
ACL 2023 Tutorial (Juli 2023)

Sprachmodelle: Ein Überblick über Sprachmodelle, der sich auf die Architektur und den Betrieb von GPT-2 konzentriert. Enthält interaktive Demonstrationen, wie diese Modelle Wortsequenzwahrscheinlichkeiten schätzen, die nächsten Token vorhersagen und kohärenten Text erzeugen.
Basics auffordern: Demonstriert nur wenige Schuss- und Null-Shot-Aufforderung. Durch die Verwendung der OpenAI -API ermöglicht das Spielen mit Parametern wie Temperatur, Stopp -Token und maximale Token, wodurch ihre Auswirkungen auf Sprachmodellausgänge beobachtet werden.
Aufmerksamkeit von Schlüsseltechniken: Zeigt einen typischen Workflow für die Aufforderung von Sprachmodellen an, einschließlich der Auswahl zwischen Eingabeaufforderungen (direkten und kettendenkenden Eingabeaufforderungen) und Parsing-Ausgängen für die Bewertung. Es enthält auch eine Demonstration des memory unterstützten Aufforderung, bei dem die Eingabeaufforderung in jedem Schritt mit dem generierten Text aktualisiert wird.