Com base em materiais de referência de alta qualidade, temos dicas facilmente compiladas para a criação de avisos de LLM (modelo de idioma em larga escala).
Somente a visão geral é fornecida. Consulte cada documento para obter detalhes.
Técnicas rápidas de engenharia podem ser aprendidas em certa medida através de materiais publicados. Se você está pensando em comprar um curso, mercadoria ou livro sobre engenharia imediata (geralmente para aqueles com pouca informação), leia esses materiais primeiro.
Engenharia rápida - API OpenAI
Seis estratégias
- Escreva instruções claras
- Inclua detalhes
- Atribuir uma persona
- Divida claramente as diferentes partes da declaração de entrada
- Especifique as etapas necessárias para concluir a tarefa
- Apresentar um exemplo
- Especifique a duração da resposta que você deseja
- Forneça texto de referência
- Instruindo você a responder usando o texto de referência
- Instrua -os a descompactar com uma citação do texto de referência
- Dividir tarefas complexas em subtarefas simples
- Identifique instruções altamente relevantes para as consultas de um usuário usando a classificação de intenções
- Resumir ou filtrar interações anteriores em aplicativos interativos que requerem conversas muito longas
- Documentos longos estão resumidos em fragmentos e, em seguida, construíram recursivamente o resumo geral.
- Dê tempo ao modelo para pensar
- Diga ao próprio modelo para encontrar uma solução antes de chegar à conclusão
- Ocultar o processo de inferência do modelo usando monólogos internos e um conjunto de consultas
- Pergunte ao modelo se havia algo faltando no passe anterior
- Use ferramentas externas
- Faça um conhecimento eficiente recupere usando pesquisa baseada em incorpidas
- Use a execução do código para fazer cálculos mais precisos e chamadas de API externas
- Dê ao modelo acesso a uma função específica
- Teste suas alterações sistematicamente
- Avalie a saída do modelo usando a resposta padrão -ouro
Estratégias de design imediato | Google AI para desenvolvedores
Estratégia de design imediato
- Dê instruções claras e específicas
- Defina as tarefas para executar
- Especifique todas as restrições
- Defina o formato da sua resposta
- Inclua alguns exemplos
- Plactos de tiro zero e poucos tiro
- Encontre o número ideal de exemplos
- Exemplos são usados para mostrar padrões em vez de anti-padrões.
- Os exemplos apresentados usam um formato consistente
- Adicione informações contextuais
- Adicione um prefixo
- Prefixo de entrada
- Prefixo de saída
- Exemplo prefixo
- Dê ao modelo entrada parcial para concluí -lo
- Promotos de avaria em componentes simples
- Quebrar as instruções
- Crie uma cadeia de avisos (faça a saída do prompt anterior como entrada do próximo prompt)
- Respostas agregadas
- Tente diferentes valores de parâmetros
- Token de saída máxima
- Temperatura
- Top-K
- Top-P
- Estratégia de ciclo de melhoria imediata
- Use uma frase diferente
- Mude para uma tarefa semelhante
- Reordenar conteúdo rápido
- Resposta de fallback
- Coisas a serem evitadas
- Evite confiar nos modelos para gerar informações factuais
- Use problemas de matemática e lógica com cautela
Engenharia imediata para IA genérica | Aprendizado de máquina | Google para desenvolvedores
Engenharia imediata para gerar IA
Melhores práticas de criação pronta
- Comunique -se claramente qual conteúdo e informação são mais importantes.
- Estruture o prompt: inicie com a definição de função, forneça dados de contexto e entrada e forneça instruções.
- Use exemplos concretos e diversos para permitir que o modelo produza resultados precisos com foco.
- Dê restrições para limitar o escopo da saída do modelo. Isso evitará se desviar das instruções e fornecer informações imprecisas.
- Tarefas complexas são divididas em seqüências simples.
- Instrua o modelo a avaliar e verifique suas próprias respostas antes de gerá-las ("as respostas devem estar dentro de 3 frases", "avalie a brevidade da saída em uma escala de 1-10." "Você acha que isso está correto?").
Tipo rápido
- Solicitação direta (zero tiro)
- Solicitando com um exemplo (One-shot/ Few-Shot/ Multi-Shot)
- Berço (cadeia de pensamento) solicitando
- Berço de tiro zero
- Estratégia de ciclo de melhoria imediata
Engenharia rápida
- Defina tarefas e critérios de sucesso
- Critérios importantes de sucesso a considerar
- Desempenho e precisão
- Latência
- preço
- Crie um caso de teste
- Crie um prompt temporário
- Tente um prompt em um caso de teste
- Melhorar o prompt
- Retorne à Etapa 4 e repita as melhorias
- Libere prompts polidas
Começando com os modelos mais capazes e instruções longas primeiro, e depois de ter a qualidade da saída desejada, tente modelos menores ou instruções mais curtas para obter latência e economia de custos.
Técnicas prontas de engenharia
- Diga a eles de forma clara e direta
- Use o exemplo
- Dê um papel ao modelo
- Usando tags XML (Claude específico)
- Separe os grandes prompts
- Faça o modelo pensar com passo a passo
- Especifique o início da saída esperada
- Especifique o formato de saída
- Por favor, reescreva
- Modelos com longas janelas de contexto aproveitam isso
Guia de engenharia imediata
Configurações de LLM
nome explicação temperatura O grau de aleatoriedade. O aumento da temperatura aumenta a aleatoriedade, enquanto menor diminui a aleatoriedade. Top p Um método de amostragem chamado amostragem de núcleo. O Top P superior aumenta a diversidade de respostas. comprimento máximo Comprimento máximo da resposta. As unidades variam dependendo do modelo, como o número de tokens e caracteres. Stop Sequence Um padrão de string que para de gerar respostas. Pena de frequência Penalidade pela frequência de ocorrência de um determinado token. Penalidade de presença Penalidade pela frequência de ocorrência de qualquer token. Componentes rápidos
Considere o seguinte como componentes do prompt:
nome japonês explicação instrução Instruções Tarefas que você deseja modelar contexto contexto Informações externas e contexto adicional dados de entrada Dados de entrada Entradas e perguntas para fazer respostas Indicador de saída Indicador de saída Tipo de saída e formato Dicas gerais
- Comece simplesmente e repita as melhorias
- Instrua solicitações de maneira ordenada
- Especificamente, diretamente
- Evite imprecisões
- "É assim que é" em vez de "não faça isso".
Técnicas de criação rápidas
- Zero Shot solicitando
- Poucos pedidos de tiro
- Berço (cadeia de pensamento) solicitando
- Autoconsistência
- Conhecimento gerado solicitando
- Encadeamento imediato
- Tot (Tree of Thoughts)
- Rag (geração aumentada de recuperação)
- Arte (raciocínio automático e uso de ferramentas)
- APE (Engenheiro Prompt Automático)
- Promoção ativa
- Estímulo direcional solicitando
- PAL (modelos de idiomas auxiliados pelo programa)
- Reagir solicitação
- Reflexão
- Berço multimodal solicitando
- GraphPrompt
Risco e uso indevido
- Solicitação hostil (ataque imediato)
- Injeção imediata
- Promptre King
- Jailbreaking (jailbreak)
- Verdade
- viés