? Agentes de IA impresionantes
Siempre creo en el código abierto y me encanta compartir todos los puntos de conocimiento que creo que son valiosos e interesantes para el agente durante mi trabajo y estudio, y los escribo regularmente en blogs para discutir y aprender con todos y progresar juntos.
También somos muy bienvenidos para contribuir con PR a mejorar continuamente este blog y convertirlo en un manual de agente real.
Recomendamos encarecidamente que lea este discurso del Sr. Ng para comenzar con el flujo de trabajo del agente:
ORPO propone un método muy innovador: fusionar la etapa de alineación del modelo y la etapa SFT para mejorar el método de entrenamiento del modelo.
En la etapa SFT, los datos alineados se agregan directamente al entrenamiento, y la capacidad de alineación del modelo se realiza en la etapa SFT.
解决的问题: este documento tiene como objetivo mejorar la capacidad de proporcionar un método para crear instrucciones de alta calidad siguiendo conjuntos de datos, mejorando así la capacidad de aprender instrucciones en diferentes métodos.
En este documento, generamos una función para detectar si el contenido de respuesta es correcto, mejorando así la calidad de los datos.
El método de este documento no es muy innovador, pero nos dice hasta cierto punto: la importancia de la calidad de los datos.