llm prompting practices ja Télécharger - llm prompting practices ja du code source

llm prompting practices ja

Code Source AI

2024.03.12

Télécharger

(Japonais) Conseils pour créer des invites LLM

Sur la base de matériaux de référence de haute qualité, nous avons facilement compilé des conseils pour créer des invites LLM (modèle de langue à grande échelle).

Seul l'aperçu est fourni. Veuillez vous référer à chaque document pour plus de détails.

Des techniques d'ingénierie rapides peuvent être apprises dans une certaine mesure grâce à des documents publiés. Si vous envisagez d'acheter un cours, des marchandises ou des livres sur l'ingénierie rapide (souvent pour ceux qui ont peu d'informations), assurez-vous d'abord de lire ces documents.

Conseils

OpenAI: ingénierie rapide

Ingénierie rapide - API OpenAI

Six stratégies
Écrire des instructions claires
Inclure les détails
Attribuer un personnage
Divisez clairement les différentes parties de l'instruction d'entrée
Spécifiez les étapes nécessaires pour terminer la tâche
Présenter un exemple
Spécifiez la durée de la réponse que vous souhaitez
Fournir un texte de référence
Vous instruire de répondre en utilisant du texte de référence
Demandez-leur de se décompresser avec une citation du texte de référence
Diviser les tâches complexes en sous-tâches simples
Identifiez les instructions très pertinentes pour les requêtes d'un utilisateur en utilisant la classification de l'intention
Résumer ou filtrer les interactions précédentes dans des applications interactives qui nécessitent de très longues conversations
De longs documents sont résumés en fragments puis construits récursivement le résumé global.
Donnez au modèle le temps de réfléchir
Dites au modèle lui-même de trouver une solution avant de sauter à la conclusion
Masquer le processus d'inférence du modèle à l'aide de monologues intérieurs et un ensemble de requêtes
Demandez au modèle s'il manquait quelque chose dans la passe précédente
Utiliser des outils externes
Faire des connaissances efficaces Retrievel en utilisant la recherche basée sur les intégres
Utiliser l'exécution du code pour effectuer des calculs plus précis et des appels d'API externes
Donner au modèle un accès à une fonction spécifique
Testez vos modifications systématiquement
Évaluez la sortie du modèle à l'aide de la réponse à l'étalon-or

Google: stratégies de conception rapide

Stratégies de conception rapide | Google AI pour les développeurs

Stratégie de conception rapide
Donnez des instructions claires et spécifiques
Définir les tâches pour effectuer
Spécifiez toutes les contraintes
Définissez le format de votre réponse
Inclure quelques exemples
invites zéro-shot et à quelques coups
Trouver le nombre optimal d'exemples
Des exemples sont utilisés pour montrer des modèles plutôt que des anti-motifs.
Les exemples présentés utilisent un format cohérent
Ajouter des informations contextuelles
Ajouter un préfixe
Préfixe d'entrée
Préfixe de sortie
Exemple de préfixe
Donnez au modèle une entrée partielle pour le compléter
La panne se moque en composants simples
Décomposer les instructions
Créer une chaîne d'invites (faire la sortie de l'invite précédente comme entrée de l'invite suivante)
Réponses agrégées
Essayez différentes valeurs de paramètres
Jeton de sortie maximal
Température
Top-k
Top-p
Stratégie du cycle d'amélioration rapide
Utilisez une expression différente
Passez à une tâche similaire
Réorganiser le contenu rapide
Réponse de secours
Choses à éviter
Évitez de compter sur des modèles pour générer des informations factuelles
Utilisez des problèmes de mathématiques et de logique avec prudence

Google: ingénierie rapide pour l'IA générique

Ingénierie rapide pour l'IA générique | Apprentissage automatique | Google pour les développeurs

Ingénierie rapide pour générer l'IA
Meilleures pratiques de création rapide
Communiquez clairement le contenu et les informations les plus importants.
Structurez l'invite: commencez par la définition du rôle, fournissez des données de contexte et d'entrée et fournissez des instructions.
Utilisez des exemples en béton et divers pour permettre au modèle de produire des résultats précis avec une focalisation.
Donnez des contraintes pour limiter la portée de la sortie du modèle. Cela évitera de s'écarter des instructions et de fournir des informations inexactes.
Les tâches complexes sont décomposées en séquences simples.
Demandez au modèle d'évaluer et de vérifier ses propres réponses avant de les générer ("Les réponses devraient être dans les 3 phrases", "Évaluez la concision de la sortie sur une échelle de 1-10." "Pensez-vous que c'est correct?").
Type d'invite
Invitation directe (zéro-shot)
Inviter avec un exemple (One-Shot / Fiw-Shot / Multi-Shot)
COT (chaîne de pensée)
lit zéro-shot
Stratégie du cycle d'amélioration rapide

Anthropique: ingénierie rapide

Ingénierie rapide

Cycle de vie du développement rapide

Définir les tâches et les critères de réussite
Critères de réussite clés à considérer
Performance et précision
Latence
prix
Créer un cas de test
Créer une invite temporaire
Essayez une invite sur un cas de test
Améliorer l'invite
Revenir à l'étape 4 et répéter les améliorations
Libérer des invites polies
En commençant par les modèles les plus capables et les longs invites, et une fois que vous avez la qualité de sortie souhaitée, essayez des modèles plus petits ou des invites plus courtes pour les économies de latence et de coûts.
Techniques d'ingénierie rapides
Dites-leur clairement et directement
Utilisez l'exemple
Donner un rôle au modèle
Utilisation de balises XML (Claude spécifique)
Séparez les grandes invites
Faites réfléchir au modèle avec étape par étape
Spécifiez le début de la sortie attendue
Spécifiez le format de sortie
Veuillez réécrire
Les modèles avec de longues fenêtres de contexte en profitent

Dair.ai: guide d'ingénierie rapide

Guide d'ingénierie rapide

Paramètres LLM
nom explication
température Le degré de hasard. L'augmentation de la température augmente l'aléatoire, tandis que la baisse diminue l'aléatoire.
top p Une méthode d'échantillonnage appelée échantillonnage du noyau. Présentant supérieur P augmente la diversité des réponses.
longueur maximale Longueur maximale de la réponse. Les unités varient en fonction du modèle, comme le nombre de jetons et de caractères.
séquence d'arrêt Un modèle de chaîne qui cesse de générer des réponses.
pénalité de fréquence Pénalité pour la fréquence d'occurrence d'un jeton particulier.
Pénalité de présence Pénalité pour la fréquence d'occurrence de tout jeton.
Composants rapides
Considérez ce qui suit comme des composants de l'invite:
nom japonais explication
instruction Instructions Tâches que vous souhaitez modéliser
contexte contexte Informations externes et contexte supplémentaire
données d'entrée Données d'entrée Entrées et questions à demander des réponses
indicateur de sortie Indicateur de sortie Type de sortie et format
Conseils généraux
Commencez simplement et répétez les améliorations
Instruire les demandes de manière ordonnée
Plus précisément, directement
Évitez les inexactitudes
"C'est comme ça" plutôt que "ne faites pas ça."
Techniques de création rapides
Invitation zéro-shot
Invitation à quelques coups
COT (chaîne de pensée)
Auto-cohérence
Des connaissances générées d'incitation
Chaînage rapide
Tot (arbre de pensées)
Rag (récupération de génération augmentée)
Art (raisonnement automatique et utilisation d'outils)
APE (ingénieur rapide automatique)
Se promener actif
Stimulation directionnelle
PAL (modèles de langue assistés par le programme)
Réagir
Réflexion
COT multimodal
Graphprompt
Risque et abus
Invitation hostile (attaque rapide)
Injection rapide
Roi Prom
Jailbreaking (jailbreak)
Vérité
biais

nom	explication
température	Le degré de hasard. L'augmentation de la température augmente l'aléatoire, tandis que la baisse diminue l'aléatoire.
top p	Une méthode d'échantillonnage appelée échantillonnage du noyau. Présentant supérieur P augmente la diversité des réponses.
longueur maximale	Longueur maximale de la réponse. Les unités varient en fonction du modèle, comme le nombre de jetons et de caractères.
séquence d'arrêt	Un modèle de chaîne qui cesse de générer des réponses.
pénalité de fréquence	Pénalité pour la fréquence d'occurrence d'un jeton particulier.
Pénalité de présence	Pénalité pour la fréquence d'occurrence de tout jeton.

nom	japonais	explication
instruction	Instructions	Tâches que vous souhaitez modéliser
contexte	contexte	Informations externes et contexte supplémentaire
données d'entrée	Données d'entrée	Entrées et questions à demander des réponses
indicateur de sortie	Indicateur de sortie	Type de sortie et format

Références

Lignes directrices

OpenAI: ingénierie rapide - API OpenAI
Google: Stratégies de conception rapide | Google AI pour les développeurs
Google: ingénierie rapide pour l'IA générique | Apprentissage automatique | Google pour les développeurs
Anthropique: ingénierie rapide
Dair.ai: guide d'ingénierie rapide