llm prompting practices ja DESCARGA - llm prompting practices ja Descarga del código fuente

llm prompting practices ja

Código Fuente de IA

2024.03.12

Descargar

(Japonés) Consejos para crear indicaciones de LLM

Basado en materiales de referencia de alta calidad, hemos compilado fácilmente consejos para crear indicaciones LLM (modelo de lenguaje a gran escala).

Solo se proporciona la descripción general. Consulte cada documento para más detalles.

Se pueden aprender técnicas de ingeniería rápidas hasta cierto punto a través de materiales publicados. Si está considerando comprar un curso, mercancía o reservar sobre ingeniería rápida (a menudo para aquellos con poca información), asegúrese de leer estos materiales primero.

Consejos

OpenAI: ingeniería rápida

Ingeniería rápida - API de OpenAI

Seis estrategias
Escribe instrucciones claras
Incluir detalles
Asignar una persona
Divida claramente las diferentes partes de la declaración de entrada
Especifique los pasos necesarios para completar la tarea
Presentar un ejemplo
Especifique la longitud de la respuesta que desea
Proporcionar texto de referencia
Instruyéndole que responda usando texto de referencia
Instruirles que descompriman con una cita del texto de referencia
Dividir tareas complejas en subtareas simples
Identificar instrucciones altamente relevantes para las consultas de un usuario utilizando la clasificación de intención
Resumir o filtrar interacciones anteriores en aplicaciones interactivas que requieren conversaciones muy largas
Los documentos largos se resumen en fragmentos y luego construyen recursivamente el resumen general.
Dale tiempo al modelo para pensar
Dígale al modelo en sí que encuentre una solución antes de saltar a la conclusión
Ocultar el proceso de inferencia del modelo utilizando monólogos internos y un conjunto de consultas
Pregúntele al modelo si faltaba algo del pase anterior
Utilizar herramientas externas
Hacer el conocimiento eficiente recuperar utilizando la búsqueda basada en incrustaciones
Use la ejecución del código para realizar cálculos más precisos y llamadas de API externas
Darle al modelo acceso a una función específica
Pon a prueba tus cambios sistemáticamente
Evaluar la salida del modelo utilizando la respuesta estándar de oro

Google: estrategias de diseño rápidas

Estrategias de diseño inmediato | Google AI para desarrolladores

Estrategia de diseño rápido
Dar instrucciones claras y específicas
Defina las tareas para realizar
Especificar todas las restricciones
Defina el formato de su respuesta
Incluir algunos ejemplos
indicaciones de cero disparos y pocos disparos
Encuentra el número óptimo de ejemplos
Se utilizan ejemplos para mostrar patrones en lugar de antipatrones.
Los ejemplos presentados usan un formato consistente
Agregar información contextual
Agregar un prefijo
Prefijo de entrada
Prefijo de salida
Ejemplo de prefijo
Dé el modelo de entrada parcial para completarla
Involucraciones de desglose en componentes simples
Instrucciones de desglose
Cree una cadena de indicaciones (realice la salida de la solicitud anterior como entrada de la siguiente solicitud)
Respuestas agregadas
Pruebe diferentes valores de parámetros
Token de salida máximo
Temperatura
Top-K
Top-P
Estrategia de ciclo de mejora inmediata
Usa una frase diferente
Cambiar a una tarea similar
Reordenar contenido rápido
Respuesta alternativa
Cosas que evitar
Evite confiar en los modelos para generar información objetiva
Use matemáticas y problemas lógicos con precaución

Google: ingeniería rápida para IA genérica

Ingeniería rápida para la IA genérica | Aprendizaje automático | Google para desarrolladores

Ingeniería rápida para generar IA
Mejores prácticas de la creación rápida
Comunica claramente qué contenido y información son más importantes.
Estructura El mensaje: comience con la definición de roles, proporcione datos de contexto y entrada, y proporcione instrucciones.
Use ejemplos concretos y diversos para permitir que el modelo produzca resultados precisos con un enfoque.
Dé limitaciones para limitar el alcance de la salida del modelo. Hacerlo evitará desviarse de las instrucciones y proporcionar información inexacta.
Las tareas complejas se dividen en secuencias simples.
Indique al modelo que califique y verifique sus propias respuestas antes de generarlas ("Las respuestas deben estar dentro de 3 oraciones", "Califique la brevedad de la salida en una escala de 1-10". "¿Crees que esto es correcto?").
Tipo de inmediato
Solicitante directo (cero-shot)
Significando con un ejemplo (One-Shot/ Pew-Shot/ Multi-Shot)
Cot (cadena de pensamiento) Involucrar
cuna de disparo cero
Estrategia de ciclo de mejora inmediata

Antropic: ingeniería rápida

Ingeniería rápida

Iniciado de vida de desarrollo rápido

Definir tareas y criterios de éxito
Criterios de éxito clave a considerar
Rendimiento y precisión
Estado latente
precio
Crear un caso de prueba
Crear un aviso temporal
Pruebe un aviso en un caso de prueba
Mejorar el aviso
Vuelva al paso 4 y repita las mejoras
Liberar indicaciones pulidas
Comenzando primero con los modelos más capaces y las indicaciones largas, y una vez que tenga la calidad de salida deseada, pruebe modelos más pequeños o indicaciones más cortas para la latencia y los ahorros de costos.
Técnicas de ingeniería rápida
Dígales clara y directamente
Usa el ejemplo
Dar un papel al modelo
Uso de etiquetas XML (Claude específica)
Separar las grandes indicaciones
Hacer que el modelo piense con paso a paso
Especificar el comienzo de la salida esperada
Especificar el formato de salida
Por favor reescribe
Modelos con ventanas de contexto largas lo aprovechan

Dair.ai: guía de ingeniería rápida

Guía de ingeniería rápida

Configuración de LLM
nombre explicación
temperatura El grado de aleatoriedad. Aumentar la temperatura aumenta la aleatoriedad, mientras que la menor disminuye la aleatoriedad.
Top P Un método de muestreo llamado muestreo de núcleo. La P más alta aumenta la diversidad de respuestas.
longitud máxima Longitud máxima de la respuesta. Las unidades varían según el modelo, como el número de tokens y caracteres.
secuencia de parada Un patrón de cadena que deja de generar respuestas.
penalización de frecuencia Penalización por la frecuencia de ocurrencia de un token particular.
Penalización de presencia Penalización por la frecuencia de ocurrencia de cualquier token.
Componentes de inmediato
Considere lo siguiente como componentes del aviso:
nombre japonés explicación
instrucción Instrucciones Tareas que desea modelar
contexto contexto Información externa y contexto adicional
datos de entrada Datos de entrada Entradas y preguntas para hacer respuestas
indicador de salida Indicador de salida Tipo de salida y formato
Consejos generales
Comience simplemente y repita las mejoras
Instruir solicitudes de manera ordenada
Específicamente, directamente
Evite las inexactitudes
"Así es" en lugar de "no hagas esto".
Técnicas de creación rápidas
Indicación de disparo cero
Pocas de disparo
Cot (cadena de pensamiento) Involucrar
Autoconsistencia
Provocación de conocimiento generado
Encadenamiento rápido
Tot (Árbol de pensamientos)
Trapo (generación de recuperación aumentada)
Arte (razonamiento automático y uso de herramientas)
APE (ingeniero automático de inmediato)
Activo
Estímulo direccional
PAL (modelos de idiomas asistidos por programas)
Reaccionar
Reflexión
Provisión de cuna multimodal
Graphprompt
Riesgo y mal uso
Información hostil (ataque rápido)
Inyección rápida
Rey de Promptre
Jailbreaking (jailbreak)
Verdad
inclinación

nombre	explicación
temperatura	El grado de aleatoriedad. Aumentar la temperatura aumenta la aleatoriedad, mientras que la menor disminuye la aleatoriedad.
Top P	Un método de muestreo llamado muestreo de núcleo. La P más alta aumenta la diversidad de respuestas.
longitud máxima	Longitud máxima de la respuesta. Las unidades varían según el modelo, como el número de tokens y caracteres.
secuencia de parada	Un patrón de cadena que deja de generar respuestas.
penalización de frecuencia	Penalización por la frecuencia de ocurrencia de un token particular.
Penalización de presencia	Penalización por la frecuencia de ocurrencia de cualquier token.

nombre	japonés	explicación
instrucción	Instrucciones	Tareas que desea modelar
contexto	contexto	Información externa y contexto adicional
datos de entrada	Datos de entrada	Entradas y preguntas para hacer respuestas
indicador de salida	Indicador de salida	Tipo de salida y formato

Referencias

Pautas

OpenAI: Ingeniería rápida - API de OpenAI
Google: estrategias de diseño rápidas | Google AI para desarrolladores
Google: Ingeniería rápida para la IA genérica | Aprendizaje automático | Google para desarrolladores
Antropic: ingeniería rápida
Dair.ai: guía de ingeniería rápida