? Потрясающие агенты ИИ
Я всегда верю в открытый исходный код и люблю делиться всеми знаниями, которые, я считаю ценными и интересными для агента во время моей работы и учебы, и регулярно писать их в блоги, чтобы обсудить и учиться со всеми и добиться успеха вместе.
Мы также очень рады внести свой вклад, чтобы постоянно улучшать этот блог и сделать его настоящим агентом.
Мы настоятельно рекомендуем вам прочитать эту речь мистера Нг, чтобы начать работу с рабочим процессом агента:
Орпо предлагает очень инновационный метод: объединить стадию выравнивания модели и этап SFT вместе, чтобы улучшить метод обучения модели.
На стадии SFT выровненные данные напрямую добавляются к обучению, а способность выравнивания модели реализуется на стадии SFT.
解决的问题: эта статья направлена на улучшение возможности обеспечения метода создания высококачественных инструкций после наборов данных, тем самым улучшая способность изучать инструкции в различных методах.
В этой статье мы генерируем функцию, чтобы определить, является ли содержимое ответа правильным, тем самым улучшая качество данных.
Метод этой статьи не очень инновационный, но он говорит нам в определенной степени: важность качества данных.