? Agentes incríveis de IA
Eu sempre acredito em código aberto e adoro compartilhar todos os pontos de conhecimento que acho valiosos e interessantes para o agente durante meu trabalho e estudo, e os escreva regularmente em blogs para discutir e aprender com todos e progredir juntos.
Também somos muito bem -vindos a contribuir com o PR para melhorar continuamente este blog e torná -lo um manual de agente real.
Recomendamos fortemente que você leia este discurso do Sr. Ng para começar com o agente Workflow:
O ORPO propõe um método muito inovador: fundir o estágio de alinhamento do modelo e o estágio da SFT para melhorar o método de treinamento do modelo.
No estágio SFT, os dados alinhados são adicionados diretamente ao treinamento e a capacidade de alinhamento do modelo é realizada no estágio SFT.
解决的问题: este artigo tem como objetivo melhorar a capacidade de fornecer um método de criar instruções de alta qualidade seguindo os conjuntos de dados, melhorando assim a capacidade de aprender instruções em diferentes métodos.
Neste artigo, geramos uma função para detectar se o conteúdo da resposta está correto, melhorando assim a qualidade dos dados.
O método deste artigo não é muito inovador, mas nos diz até certo ponto: a importância da qualidade dos dados.