Openai melepaskan GPT -4.5: Model yang paling kuat hingga saat ini mengungkap untuk meningkatkan penalaran dan kecerdasan emosional - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-05-25 18:50:02

Pada tanggal 27 Februari 2025, Openai secara resmi merilis model bahasa terbarunya GPT-4.5, yang merupakan yang pertama terbuka untuk pengguna ChatGPT Pro sebagai versi pratinjau penelitian, dengan biaya berlangganan US $ 200 per bulan. Dibangun di atas GPT-4O, model ini secara luas dianggap sebagai model bahasa terbesar dan paling berpengetahuan hingga saat ini. GPT-4.5 telah mencapai peningkatan yang signifikan dalam kemampuan inferensi, kecerdasan emosional, fungsi praktis seperti penulisan dan pemrograman, menandai terobosan besar lainnya dalam teknologi kecerdasan buatan. Openai mengatakan bahwa dalam beberapa minggu ke depan, GPT-4.5 akan secara bertahap dibuka untuk pengguna Plus, Team, Enterprise, dan EDU, lebih lanjut memperluas ruang lingkup aplikasinya.

GPT-4.5 telah menunjukkan kemajuan luar biasa di banyak bidang. Menurut kartu sistem yang dirilis oleh OpenAI, model secara signifikan mengurangi fenomena "ilusi" (mis., Kesalahan atau informasi fiksi) melalui pelatihan fine-tuning (SFT) dan penguatan (RLHF) yang diawasi, dan meningkatkan kealamian kecerdasan emosional dan interaksi pengguna. Misalnya, dalam tes PersonQA, tingkat halusinasi GPT-4.5 hanya 19%, yang jauh lebih rendah dari 52% GPT-4O. Dalam hal pengalaman pengguna, GPT-4.5 berkinerja baik dalam tugas menulis dan pemrograman, menghasilkan konten yang lebih kreatif dan intuitif secara estetika sambil memahami niat pengguna dengan lebih akurat. X Pengguna Simon Willison mengatakan setelah persidangan: "Ini berkinerja lebih baik dalam hal kedalaman pengetahuan dan pembuatan konten (seperti menggambar pelikan), dan memiliki pengalaman interaktif yang lebih alami." Selain itu, model ini mendukung unggahan file dan gambar dan mengintegrasikan alat kanvas ChatGPT, tetapi saat ini tidak mendukung fitur multimodal seperti suara, video, atau berbagi layar.

OpenAI mengungkapkan bahwa data pelatihan GPT-4.5 berasal dari berbagai saluran, termasuk data publik, data mitra berpemilik, dan set data yang disesuaikan internal, yang disaring secara ketat untuk memastikan kualitas dan melindungi privasi. Dalam hal keamanan, model ini dilengkapi dengan API moderasi dan classifier untuk secara efektif mencegah konten berbahaya yang dihasilkan. Dalam penilaian pihak ketiga, Apollo Research dan Metr menguji risiko penipuan dan otonomi GPT-4.5, dan hasilnya menunjukkan bahwa risikonya secara keseluruhan adalah "sedang". Terutama di bidang kimia, biologi, bahan nuklir radioaktif (CBRN) dan persuasi, risikonya sedang, sedangkan cybersecurity dan model otonomi rendah. OpenAI telah mengambil langkah-langkah seperti pra-pelatihan untuk memfilter data CBRN dan memantau potensi penyalahgunaan untuk memastikan keamanan.

Umpan balik dari batch pertama pengguna menunjukkan bahwa GPT-4.5 diterima dengan baik dalam hal luas pengetahuan dan kreativitas. X pengguna @pckraftwerk memuji "kemampuan menulis dan pengkodean yang ditingkatkan secara signifikan, dengan berkurangnya fenomena halusinasi". Namun, masalah kecepatan juga menarik perhatian. Simon Willison menunjukkan bahwa ketika digunakan melalui API, GPT-4.5 lambat untuk merespons, yang dapat memengaruhi skenario aplikasi waktu nyata. Dia juga mengungkapkan bahwa model ini menggunakan sumber daya komputasi pelatihan 10 kali lebih banyak daripada GPT-4, dan peningkatan kinerja adalah investasi besar di belakangnya. Selain itu, Openai memperjelas bahwa GPT-4.5 tidak dirancang untuk penalaran yang mendalam, dan disarankan agar pengguna memilih model O1 atau O3-Mini ketika penalaran yang kompleks diperlukan. Posisi ini juga memicu beberapa diskusi.

Sebagai karya terbaru Openai, GPT-4.5 diyakini untuk mempromosikan inovasi produktivitas di bidang-bidang seperti menulis, pemrograman, dan pemecahan masalah. Kinerja multibahasa juga mengesankan. Dalam uji Benchmark MMLU, tingkat akurasi bahasa Inggris mencapai 0,896, Spanyol 0,8840, dan Arab 0,8598, melampaui GPT-4O dalam semua aspek. Orang dalam industri memperkirakan bahwa dengan promosi bertahap GPT-4.5, fungsi yang kuat dan keamanan tinggi akan lebih lanjut mengkonsolidasikan posisi terkemuka Openai di bidang AI. Di masa depan, OpenAI berencana untuk mengoptimalkan model berdasarkan umpan balik pengguna, dan dapat memperluas fungsi seperti suara dan video untuk lebih memperkaya skenario aplikasinya.

Rilis GPT-4.5 tidak hanya menunjukkan ambisi teknis Openai, tetapi juga menyoroti penekanannya pada keamanan dan pengalaman pengguna. Meskipun masalah kecepatan masih harus diselesaikan, model ini tidak diragukan lagi membuka bab baru dalam pengembangan AI. Seperti yang dikatakan Openai dalam pernyataannya: "Kami berharap GPT-4.5 akan membawa pengguna pengalaman asisten yang lebih pintar dan lebih andal."