Basierend auf hochwertigen Referenzmaterialien haben wir leicht Tipps zum Erstellen von LLM-Aufforderungen (großflächiger Sprachmodell) erstellt.
Es wird nur der Überblick gegeben. Weitere Informationen finden Sie in jedem Dokument.
Sofortige technische Techniken können in gewissem Maße durch veröffentlichte Materialien gelernt werden. Wenn Sie darüber nachdenken, einen Kurs, einen Kurs, Waren oder ein Buch über schnelle Engineering zu kaufen (häufig für diejenigen mit wenig Informationen), lesen Sie bitte zuerst diese Materialien.
Schnelltechnik - OpenAI -API
Sechs Strategien
- Schreiben Sie klare Anweisungen
- Details eingeben
- Eine Persona zuweisen
- Teilen Sie die verschiedenen Teile der Eingabeanweisung klar auf
- Geben Sie die erforderlichen Schritte an, um die Aufgabe auszufüllen
- Präsentieren Sie ein Beispiel
- Geben Sie die Länge der gewünschten Antwort an
- Referenztext angeben
- Sie unterweisen Sie, mit Referenztext zu antworten
- Weisen Sie sie an, ein Zitat aus dem Referenztext zu entpacken
- Teilen Sie komplexe Aufgaben in einfache Unteraufgaben auf
- Identifizieren Sie hochrelevante Anweisungen für die Abfragen eines Benutzers mithilfe der Intent -Klassifizierung
- Fassen Sie frühere Wechselwirkungen in interaktiven Anwendungen zusammen, die sehr lange Gespräche erfordern
- Lange Dokumente werden in Fragmenten zusammengefasst und dann die Gesamtübersicht rekursiv konstruiert.
- Geben Sie dem Modell Zeit zum Nachdenken an
- Sagen Sie dem Modell selbst, er solle eine Lösung finden, bevor er zur Schlussfolgerung springt
- Verstecken Sie den Inferenzprozess des Modells mit inneren Monologen und einer Reihe von Abfragen
- Fragen Sie das Modell, ob im vorherigen Pass etwas fehlte
- Verwenden Sie externe Werkzeuge
- Führen Sie effiziente Wissensabrufe mithilfe von Einbettungs-basierten Suche durch
- Verwenden Sie die Codeausführung, um genauere Berechnungen und externe API -Aufrufe zu tätigen
- Geben Sie den Modellzugriff auf eine bestimmte Funktion
- Testen Sie Ihre Änderungen systematisch
- Bewerten Sie die Ausgabe des Modells anhand der Goldstandard -Antwort
Schnelle Designstrategien | Google AI für Entwickler
Schnelle Designstrategie
- Geben Sie klare und spezifische Anweisungen
- Definieren Sie die für die Ausführung der Aufgaben
- Geben Sie alle Einschränkungen an
- Definieren Sie das Format Ihrer Antwort
- Einige Beispiele einschließen
- Null-Shot- und wenige Schussaufforderungen
- Finden Sie die optimale Anzahl von Beispielen
- Beispiele werden verwendet, um Muster und eher Anti-Muster zu zeigen.
- Die vorgestellten Beispiele verwenden ein konsistentes Format
- Fügen Sie Kontextinformationen hinzu
- Fügen Sie ein Präfix hinzu
- Eingabeprefix
- Ausgabepräfix
- Beispielpräfix
- Geben Sie dem Modell teilweise Eingabe an, um es zu vervollständigen
- Aufschlüsselungsanträge in einfache Komponenten
- Anweisungen abbauen
- Erstellen Sie eine Kette von Eingaben (erstellen Sie die Ausgabe der vorherigen Eingabeaufforderung als Eingabe der nächsten Eingabeaufforderung).
- Aggregatantworten
- Probieren Sie verschiedene Parameterwerte aus
- Maximaler Ausgangs -Token
- Temperatur
- Top-K
- Top-P
- Sofort -Verbesserungszyklusstrategie
- Einen anderen Satz verwenden
- Wechseln Sie zu einer ähnlichen Aufgabe
- Umkämpfe Inhalte neu bestellen
- Fallback -Antwort
- Dinge zu vermeiden
- Vermeiden Sie es, sich auf Modelle zu verlassen, um Fakteninformationen zu generieren
- Verwenden Sie Mathematik und Logikprobleme mit Vorsicht
Schnelltechnik für generische AI | Maschinelles Lernen | Google für Entwickler
Schnelltechnik für die Generierung von KI
Schnelle Best Practices der Erstellung
- Kommunizieren Sie klar, welche Inhalte und Informationen am wichtigsten sind.
- Strukturieren Sie die Eingabeaufforderung: Beginnen Sie mit der Rollendefinition, geben Sie Kontext- und Eingabedaten an und geben Sie Anweisungen an.
- Verwenden Sie konkrete und verschiedene Beispiele, damit das Modell genaue Ergebnisse mit einem Fokus erzielen kann.
- Geben Sie Einschränkungen an, um den Umfang der Ausgabe des Modells zu begrenzen. Wenn Sie dies tun, werden Sie von Anweisungen abweichen und ungenaue Informationen bereitstellen.
- Komplexe Aufgaben werden in einfache Sequenzen unterteilt.
- Weisen Sie das Modell an, ihre eigenen Antworten zu bewerten und zu überprüfen, bevor Sie sie generieren ("Antworten sollten innerhalb von 3 Sätzen liegen", "bewerten Sie die Kürze der Ausgabe auf einer Skala von 1-10." "Glaubst du, das ist richtig?").
Schnelltyp
- Direkte Aufforderung (Null-Shot)
- Aufforderung mit einem Beispiel (One-Shot/ Few-Shot/ Multi-Shot)
- COT (Kette der Gedanken) Aufforderung
- Null-Shot-Kinderbett
- Sofort -Verbesserungszyklusstrategie
Schnelltechnik
- Definieren Sie Aufgaben und Erfolgskriterien
- Wichtige Erfolgskriterien zu berücksichtigen
- Leistung und Genauigkeit
- Latenz
- Preis
- Erstellen Sie einen Testfall
- Erstellen Sie eine vorübergehende Eingabeaufforderung
- Versuchen Sie eine Eingabeaufforderung in einem Testfall
- Die Eingabeaufforderung verbessern
- Kehren Sie zu Schritt 4 zurück und wiederholen Sie die Verbesserungen
- Polierte Eingabeaufforderungen freigeben
Beginnend mit den fähigsten Modellen und langen Eingabeaufforderungen und nach der gewünschten Ausgangsqualität versuchen Sie kleinere Modelle oder kürzere Eingabeaufforderungen für Latenz- und Kosteneinsparungen.
Schnelle technische Techniken
- Sagen Sie ihnen klar und direkt
- Verwenden Sie das Beispiel
- Geben Sie dem Modell eine Rolle
- Verwenden von XML -Tags (Claudespezifisch)
- Trennen Sie die großen Eingabeaufforderungen
- Lassen Sie das Modell Schritt für Schritt nachdenken
- Geben Sie den Beginn der erwarteten Ausgabe an
- Geben Sie das Ausgangsformat an
- Bitte schreiben Sie neu
- Modelle mit langen Kontextfenstern nutzen es
Schnelltechnik Guide
LLM -Einstellungen
Name Erläuterung Temperatur Der Grad der Zufälligkeit. Die Erhöhung der Temperatur erhöht die Zufälligkeit, während niedriger die Zufälligkeit verringert. ober p Eine Probenahmemethode, die als Nucleus -Probenahme bezeichnet wird. Höheres Top P erhöht die Vielfalt der Antworten. Maximale Länge Maximale Länge der Antwort. Die Einheiten variieren je nach Modell wie der Anzahl der Token und Zeichen. Stop -Sequenz Ein String -Muster, das keine Antworten generiert. Frequenzstrafe Strafe für die Häufigkeit des Auftretens eines bestimmten Tokens. Präsenzstrafe Strafe für die Häufigkeit des Auftretens eines Tokens. Schnellkomponenten
Betrachten Sie Folgendes als Komponenten der Eingabeaufforderung:
Name japanisch Erläuterung Anweisung Anweisungen Aufgaben, die Sie modellieren möchten Kontext Kontext Externe Informationen und zusätzlicher Kontext Eingabedaten Eingabedaten Inputs und Fragen zu Antworten stellen Ausgangsindikator Ausgangsindikator Ausgangstyp und Format Allgemeine Tipps
- Beginnen Sie einfach und wiederholen Sie die Verbesserungen
- Anfragen auf ordnungsgemäße Weise anweisen
- Speziell direkt
- Vermeiden Sie Ungenauigkeiten
- "So ist es" anstatt "tun Sie das nicht".
Sofortige Schöpfungstechniken
- Null-Shot-Aufforderung
- Wenige Schüsse Aufforderung
- COT (Kette der Gedanken) Aufforderung
- Selbstkonsistenz
- Erzeugte Wissensaufforderung
- Sofortige Verkettung
- TOT (Baum der Gedanken)
- Lappen (Abruf Augmented Generation)
- Kunst (automatisches Denken und Werkzeugnutzung)
- APE (automatischer Eingabeaufenthaltsingenieur)
- Aktiver Prompt
- Richtungsreizanlauf
- PAL (programmgestützte Sprachmodelle)
- Reagieren aufzufordern
- Reflexion
- Multimodales Kinderbetrag
- GraphPrompt
Risiko und Missbrauch
- Feindliche Aufforderung (schnelle Angriff)
- Sofortige Injektion
- Promptre King
- Jailbreak (Jailbreak)
- Wahrheit
- Voreingenommenheit