Basado en materiales de referencia de alta calidad, hemos compilado fácilmente consejos para crear indicaciones LLM (modelo de lenguaje a gran escala).
Solo se proporciona la descripción general. Consulte cada documento para más detalles.
Se pueden aprender técnicas de ingeniería rápidas hasta cierto punto a través de materiales publicados. Si está considerando comprar un curso, mercancía o reservar sobre ingeniería rápida (a menudo para aquellos con poca información), asegúrese de leer estos materiales primero.
Ingeniería rápida - API de OpenAI
Seis estrategias
- Escribe instrucciones claras
- Incluir detalles
- Asignar una persona
- Divida claramente las diferentes partes de la declaración de entrada
- Especifique los pasos necesarios para completar la tarea
- Presentar un ejemplo
- Especifique la longitud de la respuesta que desea
- Proporcionar texto de referencia
- Instruyéndole que responda usando texto de referencia
- Instruirles que descompriman con una cita del texto de referencia
- Dividir tareas complejas en subtareas simples
- Identificar instrucciones altamente relevantes para las consultas de un usuario utilizando la clasificación de intención
- Resumir o filtrar interacciones anteriores en aplicaciones interactivas que requieren conversaciones muy largas
- Los documentos largos se resumen en fragmentos y luego construyen recursivamente el resumen general.
- Dale tiempo al modelo para pensar
- Dígale al modelo en sí que encuentre una solución antes de saltar a la conclusión
- Ocultar el proceso de inferencia del modelo utilizando monólogos internos y un conjunto de consultas
- Pregúntele al modelo si faltaba algo del pase anterior
- Utilizar herramientas externas
- Hacer el conocimiento eficiente recuperar utilizando la búsqueda basada en incrustaciones
- Use la ejecución del código para realizar cálculos más precisos y llamadas de API externas
- Darle al modelo acceso a una función específica
- Pon a prueba tus cambios sistemáticamente
- Evaluar la salida del modelo utilizando la respuesta estándar de oro
Estrategias de diseño inmediato | Google AI para desarrolladores
Estrategia de diseño rápido
- Dar instrucciones claras y específicas
- Defina las tareas para realizar
- Especificar todas las restricciones
- Defina el formato de su respuesta
- Incluir algunos ejemplos
- indicaciones de cero disparos y pocos disparos
- Encuentra el número óptimo de ejemplos
- Se utilizan ejemplos para mostrar patrones en lugar de antipatrones.
- Los ejemplos presentados usan un formato consistente
- Agregar información contextual
- Agregar un prefijo
- Prefijo de entrada
- Prefijo de salida
- Ejemplo de prefijo
- Dé el modelo de entrada parcial para completarla
- Involucraciones de desglose en componentes simples
- Instrucciones de desglose
- Cree una cadena de indicaciones (realice la salida de la solicitud anterior como entrada de la siguiente solicitud)
- Respuestas agregadas
- Pruebe diferentes valores de parámetros
- Token de salida máximo
- Temperatura
- Top-K
- Top-P
- Estrategia de ciclo de mejora inmediata
- Usa una frase diferente
- Cambiar a una tarea similar
- Reordenar contenido rápido
- Respuesta alternativa
- Cosas que evitar
- Evite confiar en los modelos para generar información objetiva
- Use matemáticas y problemas lógicos con precaución
Ingeniería rápida para la IA genérica | Aprendizaje automático | Google para desarrolladores
Ingeniería rápida para generar IA
Mejores prácticas de la creación rápida
- Comunica claramente qué contenido y información son más importantes.
- Estructura El mensaje: comience con la definición de roles, proporcione datos de contexto y entrada, y proporcione instrucciones.
- Use ejemplos concretos y diversos para permitir que el modelo produzca resultados precisos con un enfoque.
- Dé limitaciones para limitar el alcance de la salida del modelo. Hacerlo evitará desviarse de las instrucciones y proporcionar información inexacta.
- Las tareas complejas se dividen en secuencias simples.
- Indique al modelo que califique y verifique sus propias respuestas antes de generarlas ("Las respuestas deben estar dentro de 3 oraciones", "Califique la brevedad de la salida en una escala de 1-10". "¿Crees que esto es correcto?").
Tipo de inmediato
- Solicitante directo (cero-shot)
- Significando con un ejemplo (One-Shot/ Pew-Shot/ Multi-Shot)
- Cot (cadena de pensamiento) Involucrar
- cuna de disparo cero
- Estrategia de ciclo de mejora inmediata
Ingeniería rápida
- Definir tareas y criterios de éxito
- Criterios de éxito clave a considerar
- Rendimiento y precisión
- Estado latente
- precio
- Crear un caso de prueba
- Crear un aviso temporal
- Pruebe un aviso en un caso de prueba
- Mejorar el aviso
- Vuelva al paso 4 y repita las mejoras
- Liberar indicaciones pulidas
Comenzando primero con los modelos más capaces y las indicaciones largas, y una vez que tenga la calidad de salida deseada, pruebe modelos más pequeños o indicaciones más cortas para la latencia y los ahorros de costos.
Técnicas de ingeniería rápida
- Dígales clara y directamente
- Usa el ejemplo
- Dar un papel al modelo
- Uso de etiquetas XML (Claude específica)
- Separar las grandes indicaciones
- Hacer que el modelo piense con paso a paso
- Especificar el comienzo de la salida esperada
- Especificar el formato de salida
- Por favor reescribe
- Modelos con ventanas de contexto largas lo aprovechan
Guía de ingeniería rápida
Configuración de LLM
nombre explicación temperatura El grado de aleatoriedad. Aumentar la temperatura aumenta la aleatoriedad, mientras que la menor disminuye la aleatoriedad. Top P Un método de muestreo llamado muestreo de núcleo. La P más alta aumenta la diversidad de respuestas. longitud máxima Longitud máxima de la respuesta. Las unidades varían según el modelo, como el número de tokens y caracteres. secuencia de parada Un patrón de cadena que deja de generar respuestas. penalización de frecuencia Penalización por la frecuencia de ocurrencia de un token particular. Penalización de presencia Penalización por la frecuencia de ocurrencia de cualquier token. Componentes de inmediato
Considere lo siguiente como componentes del aviso:
nombre japonés explicación instrucción Instrucciones Tareas que desea modelar contexto contexto Información externa y contexto adicional datos de entrada Datos de entrada Entradas y preguntas para hacer respuestas indicador de salida Indicador de salida Tipo de salida y formato Consejos generales
- Comience simplemente y repita las mejoras
- Instruir solicitudes de manera ordenada
- Específicamente, directamente
- Evite las inexactitudes
- "Así es" en lugar de "no hagas esto".
Técnicas de creación rápidas
- Indicación de disparo cero
- Pocas de disparo
- Cot (cadena de pensamiento) Involucrar
- Autoconsistencia
- Provocación de conocimiento generado
- Encadenamiento rápido
- Tot (Árbol de pensamientos)
- Trapo (generación de recuperación aumentada)
- Arte (razonamiento automático y uso de herramientas)
- APE (ingeniero automático de inmediato)
- Activo
- Estímulo direccional
- PAL (modelos de idiomas asistidos por programas)
- Reaccionar
- Reflexión
- Provisión de cuna multimodal
- Graphprompt
Riesgo y mal uso
- Información hostil (ataque rápido)
- Inyección rápida
- Rey de Promptre
- Jailbreaking (jailbreak)
- Verdad
- inclinación