? Agen AI yang luar biasa
Saya selalu percaya pada open source dan suka berbagi semua poin pengetahuan yang menurut saya berharga dan menarik bagi agen selama pekerjaan dan belajar, dan secara teratur menuliskannya ke blog untuk didiskusikan dan belajar dengan semua orang dan membuat kemajuan bersama.
Kami juga sangat disambut untuk berkontribusi PR untuk terus meningkatkan blog ini dan menjadikannya buku pegangan agen nyata.
Kami sangat menyarankan Anda membaca pidato ini oleh Mr. Ng untuk memulai dengan Alur Kerja Agen:
ORPO mengusulkan metode yang sangat inovatif: menggabungkan tahap penyelarasan model dan tahap SFT bersama -sama untuk meningkatkan metode pelatihan model.
Pada tahap SFT, data yang selaras ditambahkan secara langsung ke pelatihan, dan kemampuan penyelarasan model direalisasikan pada tahap SFT.
解决的问题: Makalah ini bertujuan untuk meningkatkan kemampuan untuk memberikan metode membuat instruksi berkualitas tinggi mengikuti set data, sehingga meningkatkan kemampuan untuk mempelajari instruksi dalam metode yang berbeda.
Dalam makalah ini, kami menghasilkan fungsi untuk mendeteksi apakah konten respons benar, sehingga meningkatkan kualitas data.
Metode makalah ini tidak terlalu inovatif, tetapi memberi tahu kita sampai batas tertentu: pentingnya kualitas data.