Pada tanggal 27 Februari 2025, Openai secara resmi merilis model obrolan terbaru GPT-4.5, dan berita tersebut dengan cepat memicu diskusi luas di Twitter (sekarang platform X). Sebagai model percakapan paling kuat dari Openai hingga saat ini, GPT-4.5 telah mencapai terobosan yang signifikan dalam kinerja, tetapi harganya yang tinggi juga telah menyebabkan pengguna dan pengembang membicarakannya. Pada saat yang sama, orang dalam industri memiliki perdebatan sengit tentang perbandingan kemampuannya dengan model yang ada.
Harga GPT-4.5 adalah 13 hingga 30 kali lebih tinggi dari GPT-4O sebelumnya. Secara khusus, harga API -nya adalah token input $ 75 per juta dan token output $ 150 per juta. Netizen @Verysmallwoods bercanda berkata: "Setelah satu makan, Anda dapat makan panas dalam satu tanya jawab!" Sebaliknya, harga input GPT-4O adalah US $ 5 per juta token dan harga output adalah US $ 15, sementara pesaing domestik seperti Deepseek masih merebut pangsa pasar melalui "pengurangan harga di luar puncak". Kenaikan harga yang signifikan telah membuat banyak pengguna menyebutnya "keterlaluan". Beberapa pengembang bahkan mengatakan bahwa Openai mungkin perlu mengevaluasi kembali apakah akan terus memberikan versi API ini.

Netizen @alchainhust bahkan mengungkapkan bahwa ketika ia memasukkan informasi harga GPT-4.5 ke GPT-4O dan menanyakan pendapatnya, GPT-4O sebenarnya mengatakan "tidak mungkin untuk menjadi kenyataan, terlalu keterlaluan" dan mempertanyakan sumber data. Interaksi ini telah membangkitkan lelucon netizen, dan juga menyoroti kontroversi harga GPT-4.5.

Terlepas dari harga yang mengejutkan, kinerja GPT-4.5 masih menjadi fokus perhatian. GPT-4.5 secara signifikan meningkatkan pemahaman intuitif dan luas pengetahuan dunia dengan memperluas pembelajaran tanpa pengawasan dan mengurangi masalah "ilusi" umum dalam model. Berbeda dengan seri O1 yang bergantung pada rantai inferensi, GPT-4.5 lebih bergantung pada data skala besar dan daya komputasi untuk mengoptimalkan kinerja. Dalam benchmark SimpleQA, keakuratan GPT-4.5 mencapai 62,5%, dan tingkat halusinasi turun menjadi 37,1%, lebih baik daripada kinerja GPT-4O, O1 dan O3-Mini. Kemajuan ini dianggap sebagai manifestasi dari "kecerdasan emosional" yang lebih tinggi, terutama ketika berhadapan dengan dialog yang kompleks dan masalah-masalah yang berpikiran terbuka.
Namun, @Alchainhust menunjukkan bahwa terlepas dari peningkatan kinerja GPT-4.5, tampaknya tidak memihak pada beberapa tolok ukur evaluasi model, yang tidak sebanding dengan harganya yang tinggi. Sebaliknya, pesaing seperti Anthropic's Claude 3.5 sonnet (yang dikatakan dihargai 25 kali lipat dari harga GPT-4.5) memiliki keunggulan yang lebih baik dalam hal efektivitas biaya.


Openai memposisikan GPT-4.5 sebagai model yang "menarik kecerdasan ke ekstrem melalui pra-pelatihan skala-up". Menurut pengguna Twitter, strategi ini telah diverifikasi oleh prediksi sebelumnya oleh Ilya Sutskever, mantan Kepala Ilmuwan Openai, yaitu dengan meningkatkan data dan daya komputasi, kurva kinerja model dapat terus meningkat. Saat ini, GPT-4.5 terbuka untuk pengguna pro, sementara Plus dan pengguna tim harus menunggu hingga minggu depan untuk menggunakannya. Namun, biaya tinggi juga menyebabkan keraguan internal tentang prospek komersialisasi, dan bahkan dapat memengaruhi rencana pasokan API berikutnya.
Menilai dari umpan balik pengguna dari platform X, rilis GPT-4.5 telah membawa kejutan dan pertanyaan. Di satu sisi, peningkatan dalam pemahaman dan kualitas dialog dianggap sebagai tanda bahwa teknologi AI telah mencapai ketinggian baru; Di sisi lain, harga yang melonjak telah mencegah banyak pengembang kecil dan menengah dan pengguna biasa. Pada saat yang sama, strategi harga rendah dari produsen domestik seperti Deepseek mengintensifkan persaingan pasar, dan masih belum diketahui apakah rute kelas atas Openai dapat terus diakui.
Secara umum, debut GPT-4.5 tidak diragukan lagi telah menyuntikkan topik baru ke dalam bidang AI. Apakah peningkatan kemampuannya cukup untuk mendukung harga tinggi? Seberapa besar kesenjangan antara itu dan GPT-4O, O1 dan bahkan model pabrikan lainnya? Pertanyaan -pertanyaan ini hanya dapat disimpulkan setelah lebih banyak pengalaman pengguna dan data ulasan dirilis. Dalam game "Performance and Price" ini, game catur Openai berikutnya patut diperhatikan.