llm prompting practices ja llm prompting practices ja

llm prompting practices ja

Código-Fonte de IA

2024.03.12

Baixar

(Japonês) Dicas para criar prompts de LLM

Com base em materiais de referência de alta qualidade, temos dicas facilmente compiladas para a criação de avisos de LLM (modelo de idioma em larga escala).

Somente a visão geral é fornecida. Consulte cada documento para obter detalhes.

Técnicas rápidas de engenharia podem ser aprendidas em certa medida através de materiais publicados. Se você está pensando em comprar um curso, mercadoria ou livro sobre engenharia imediata (geralmente para aqueles com pouca informação), leia esses materiais primeiro.

Pontas

OpenAI: engenharia imediata

Engenharia rápida - API OpenAI

Seis estratégias
Escreva instruções claras
Inclua detalhes
Atribuir uma persona
Divida claramente as diferentes partes da declaração de entrada
Especifique as etapas necessárias para concluir a tarefa
Apresentar um exemplo
Especifique a duração da resposta que você deseja
Forneça texto de referência
Instruindo você a responder usando o texto de referência
Instrua -os a descompactar com uma citação do texto de referência
Dividir tarefas complexas em subtarefas simples
Identifique instruções altamente relevantes para as consultas de um usuário usando a classificação de intenções
Resumir ou filtrar interações anteriores em aplicativos interativos que requerem conversas muito longas
Documentos longos estão resumidos em fragmentos e, em seguida, construíram recursivamente o resumo geral.
Dê tempo ao modelo para pensar
Diga ao próprio modelo para encontrar uma solução antes de chegar à conclusão
Ocultar o processo de inferência do modelo usando monólogos internos e um conjunto de consultas
Pergunte ao modelo se havia algo faltando no passe anterior
Use ferramentas externas
Faça um conhecimento eficiente recupere usando pesquisa baseada em incorpidas
Use a execução do código para fazer cálculos mais precisos e chamadas de API externas
Dê ao modelo acesso a uma função específica
Teste suas alterações sistematicamente
Avalie a saída do modelo usando a resposta padrão -ouro

Google: Estratégias de design imediato

Estratégias de design imediato | Google AI para desenvolvedores

Estratégia de design imediato
Dê instruções claras e específicas
Defina as tarefas para executar
Especifique todas as restrições
Defina o formato da sua resposta
Inclua alguns exemplos
Plactos de tiro zero e poucos tiro
Encontre o número ideal de exemplos
Exemplos são usados para mostrar padrões em vez de anti-padrões.
Os exemplos apresentados usam um formato consistente
Adicione informações contextuais
Adicione um prefixo
Prefixo de entrada
Prefixo de saída
Exemplo prefixo
Dê ao modelo entrada parcial para concluí -lo
Promotos de avaria em componentes simples
Quebrar as instruções
Crie uma cadeia de avisos (faça a saída do prompt anterior como entrada do próximo prompt)
Respostas agregadas
Tente diferentes valores de parâmetros
Token de saída máxima
Temperatura
Top-K
Top-P
Estratégia de ciclo de melhoria imediata
Use uma frase diferente
Mude para uma tarefa semelhante
Reordenar conteúdo rápido
Resposta de fallback
Coisas a serem evitadas
Evite confiar nos modelos para gerar informações factuais
Use problemas de matemática e lógica com cautela

Google: engenharia imediata para IA genérica

Engenharia imediata para IA genérica | Aprendizado de máquina | Google para desenvolvedores

Engenharia imediata para gerar IA
Melhores práticas de criação pronta
Comunique -se claramente qual conteúdo e informação são mais importantes.
Estruture o prompt: inicie com a definição de função, forneça dados de contexto e entrada e forneça instruções.
Use exemplos concretos e diversos para permitir que o modelo produza resultados precisos com foco.
Dê restrições para limitar o escopo da saída do modelo. Isso evitará se desviar das instruções e fornecer informações imprecisas.
Tarefas complexas são divididas em seqüências simples.
Instrua o modelo a avaliar e verifique suas próprias respostas antes de gerá-las ("as respostas devem estar dentro de 3 frases", "avalie a brevidade da saída em uma escala de 1-10." "Você acha que isso está correto?").
Tipo rápido
Solicitação direta (zero tiro)
Solicitando com um exemplo (One-shot/ Few-Shot/ Multi-Shot)
Berço (cadeia de pensamento) solicitando
Berço de tiro zero
Estratégia de ciclo de melhoria imediata

Antrópico: engenharia imediata

Engenharia rápida

Ciclo de vida rápido do desenvolvimento

Defina tarefas e critérios de sucesso
Critérios importantes de sucesso a considerar
Desempenho e precisão
Latência
preço
Crie um caso de teste
Crie um prompt temporário
Tente um prompt em um caso de teste
Melhorar o prompt
Retorne à Etapa 4 e repita as melhorias
Libere prompts polidas
Começando com os modelos mais capazes e instruções longas primeiro, e depois de ter a qualidade da saída desejada, tente modelos menores ou instruções mais curtas para obter latência e economia de custos.
Técnicas prontas de engenharia
Diga a eles de forma clara e direta
Use o exemplo
Dê um papel ao modelo
Usando tags XML (Claude específico)
Separe os grandes prompts
Faça o modelo pensar com passo a passo
Especifique o início da saída esperada
Especifique o formato de saída
Por favor, reescreva
Modelos com longas janelas de contexto aproveitam isso

Dair.ai: Guia de engenharia imediata

Guia de engenharia imediata

Configurações de LLM
nome explicação
temperatura O grau de aleatoriedade. O aumento da temperatura aumenta a aleatoriedade, enquanto menor diminui a aleatoriedade.
Top p Um método de amostragem chamado amostragem de núcleo. O Top P superior aumenta a diversidade de respostas.
comprimento máximo Comprimento máximo da resposta. As unidades variam dependendo do modelo, como o número de tokens e caracteres.
Stop Sequence Um padrão de string que para de gerar respostas.
Pena de frequência Penalidade pela frequência de ocorrência de um determinado token.
Penalidade de presença Penalidade pela frequência de ocorrência de qualquer token.
Componentes rápidos
Considere o seguinte como componentes do prompt:
nome japonês explicação
instrução Instruções Tarefas que você deseja modelar
contexto contexto Informações externas e contexto adicional
dados de entrada Dados de entrada Entradas e perguntas para fazer respostas
Indicador de saída Indicador de saída Tipo de saída e formato
Dicas gerais
Comece simplesmente e repita as melhorias
Instrua solicitações de maneira ordenada
Especificamente, diretamente
Evite imprecisões
"É assim que é" em vez de "não faça isso".
Técnicas de criação rápidas
Zero Shot solicitando
Poucos pedidos de tiro
Berço (cadeia de pensamento) solicitando
Autoconsistência
Conhecimento gerado solicitando
Encadeamento imediato
Tot (Tree of Thoughts)
Rag (geração aumentada de recuperação)
Arte (raciocínio automático e uso de ferramentas)
APE (Engenheiro Prompt Automático)
Promoção ativa
Estímulo direcional solicitando
PAL (modelos de idiomas auxiliados pelo programa)
Reagir solicitação
Reflexão
Berço multimodal solicitando
GraphPrompt
Risco e uso indevido
Solicitação hostil (ataque imediato)
Injeção imediata
Promptre King
Jailbreaking (jailbreak)
Verdade
viés

nome	explicação
temperatura	O grau de aleatoriedade. O aumento da temperatura aumenta a aleatoriedade, enquanto menor diminui a aleatoriedade.
Top p	Um método de amostragem chamado amostragem de núcleo. O Top P superior aumenta a diversidade de respostas.
comprimento máximo	Comprimento máximo da resposta. As unidades variam dependendo do modelo, como o número de tokens e caracteres.
Stop Sequence	Um padrão de string que para de gerar respostas.
Pena de frequência	Penalidade pela frequência de ocorrência de um determinado token.
Penalidade de presença	Penalidade pela frequência de ocorrência de qualquer token.

nome	japonês	explicação
instrução	Instruções	Tarefas que você deseja modelar
contexto	contexto	Informações externas e contexto adicional
dados de entrada	Dados de entrada	Entradas e perguntas para fazer respostas
Indicador de saída	Indicador de saída	Tipo de saída e formato

Referências

Diretrizes

OpenAI: Engenharia rápida - API OpenAI
Google: Estratégias de design imediato | Google AI para desenvolvedores
Google: engenharia imediata para IA genérica | Aprendizado de máquina | Google para desenvolvedores
Antrópico: engenharia imediata
Dair.ai: Guia de engenharia imediata