Pesatnya perkembangan AI generatif, khususnya rangkaian model GPT, telah membawa kemungkinan baru di banyak bidang. Dari peningkatan signifikan dalam nilai ujian pengacara hingga penerapannya di bidang bisnis, GPT-4 telah menunjukkan kemampuannya yang luar biasa. Namun, beberapa pakar industri mempertanyakan kemampuan pemahaman dan keandalan AI generatif saat ini, karena percaya bahwa kemampuan penalaran dan pemahaman dunia masih belum memadai, dan pengembangan di masa depan masih menghadapi banyak tantangan. Editor Downcodes akan mengajak Anda mengeksplorasi secara mendalam arah pengembangan AI generatif di masa depan, serta peluang dan tantangan yang dihadapi industri AI generatif dalam negeri.
Di manakah arah pengembangan AI generatif di masa depan?
Tidak dapat dipungkiri bahwa GPT-4 saat ini telah mengalami peningkatan yang signifikan dalam banyak kemampuannya. Dibandingkan dengan GPT-3.5, performa GPT-4 di bidang profesional yang kompleks telah meningkat pesat, dan kemampuan penalaran logisnya juga lebih kuat. Dalam Ujian Kualifikasi Pengacara AS, skor GPT-4 dapat mencapai 10% teratas, namun GPT-4 3,5 hanya dapat mencapai level 10% terbawah.

Sumber gambar: AI Terbuka
Peningkatan kemampuan yang substansial juga memungkinkan Chat GPT membuka lebih banyak skenario penggunaan. Saat ini, Open AI secara resmi menyediakan beberapa skenario aplikasi utama, seperti menambahkan AI ke Duolingo untuk mengobrol dengan pengguna setiap hari guna mempercepat pembelajaran bahasa pengguna Morgan Stanley menggunakan GPT-4 untuk mengelola basis pengetahuannya guna membantu karyawan mengakses dengan cepat; konten yang Anda inginkan.
Namun, banyak nama besar yang meragukan kemampuan GPT saat ini. Stuart Russell menunjukkan dalam pidatonya bahwa Obrolan GPT dan GPT-4 tidak memahami dunia, juga tidak "menjawab" pertanyaan. Model bahasa besar saat ini hanyalah sepotong teka-teki pada akhirnya akan terlihat seperti ini. Banyaknya kekurangan dalam kemampuan juga menentukan bahwa jalan yang harus ditempuh untuk mengembangkan kecerdasan buatan secara umum masih panjang. Karena berbagai keraguan tentang kemampuan GPT-4, Stuart Russell juga memodifikasi PPT selama pidato Sam Altman.

Sumber gambar: Konferensi Kebijaksanaan
Yang juga memiliki pandangan yang sama dengan Stuart Russell adalah Yang Likun, pemenang Turing Award, salah satu dari "Tiga Besar Pembelajaran Mendalam" dan kepala ilmuwan kecerdasan buatan di Meta. Dia percaya bahwa model autoregresif GPT saat ini kurang memiliki perencanaan, sehingga mengakibatkan kemampuan penalarannya Saat ini tidak mungkin. Jika model bahasa besar berdasarkan probabilitas dihasilkan, pada dasarnya tidak mungkin untuk menyelesaikan masalah kesalahan. Ketika teks masukan meningkat, kemungkinan kesalahan juga akan meningkat secara eksponensial.
Faktanya, tuduhan dua orang besar terhadap GPT bukannya tidak beralasan. Karena algoritme RLHF yang digunakan oleh Chat GPT sendiri bergantung pada persepsi manusia, algoritme ini memungkinkan model menilai kualitas jawabannya sendiri dan melatih dirinya sendiri untuk secara bertahap memberikan jawaban dengan kualitas lebih tinggi. Jika Anda ingin meningkatkan kemampuan penalaran model, Anda perlu melengkapi sejumlah besar parameter dalam database dan terus mengulangi algoritme.

Sumber: Sekuritas Barat Daya
Namun, adanya berbagai risiko juga menghalangi banyak perusahaan AI generatif untuk mencoba dengan mudah. Jika AI generatif dapat mencapai kemampuan penalaran cerita dan kemampuan menciptakan emosi karakter yang sama dengan penulis novel, apakah ini akan membuat AI generatif sepenuhnya di luar kendali manusia? Meskipun hal ini menyebabkan kepanikan global, apakah hal ini juga akan menghadapi pengawasan yang ketat dari pemerintah daerah, sehingga menyebabkan investasi sebelumnya pada AI generatif menjadi sia-sia?
Mengenai arah pengembangan AI generatif ke depan, jawaban Yang Likun adalah model dunia. Model dunia ini bukan hanya model yang meniru otak manusia pada tingkat saraf, tetapi juga model dunia yang sepenuhnya sesuai dengan partisi otak manusia dalam hal modul kognitif. Perbedaan terbesar antara model ini dan model bahasa besar adalah model tersebut dapat memiliki kemampuan perencanaan dan prediksi (model dunia) dan kemampuan penetapan biaya (modul biaya).
Dengan bantuan model dunia, kita dapat lebih memahami dunia dan memprediksi serta merencanakan masa depan. Melalui modul akuntansi biaya, dikombinasikan dengan permintaan sederhana (masa depan harus direncanakan berdasarkan logika yang paling menghemat biaya tindakan), itu dapat menghilangkan semua potensi racun dan konsekuensi yang tidak perlu.

Sumber gambar: Konferensi Kebijaksanaan
Namun masalahnya adalah parameter, algoritma, biaya, dll dari model dunia selama pelatihan. Misalnya menggunakan model self-supervised untuk melatih dan membangun model berpikir multi level, dll, namun Yang Likun tidak mampu memberikan rencana lengkap bagaimana mengimplementasikannya.
Peserta lain tidak menyampaikan pandangannya tentang arah pengembangan AI generatif di masa depan. Oleh karena itu, AI generatif selanjutnya akan tetap mempertahankan situasi di mana setiap perusahaan "melakukan urusannya sendiri", dan AI generatif yang disatukan secara global mungkin hanya berada dalam tahap laboratorium.
03. Prediksi AI generatif dalam negeri
Profesor Huang Tiejun, Presiden Zhiyuan Research Institute, mengatakan dalam sebuah wawancara dengan media setelah pertemuan tersebut bahwa masalah saat ini dengan model besar AI generatif dalam negeri adalah bahwa industri terlalu panas, tetapi data pelatihannya terlalu kecil, dan puluhan miliar model baru saja muncul. Meskipun terdapat beberapa kemampuan teknis di antara mereka, karena upaya yang berulang-ulang, sementara sumber daya industri menjadi lebih tersebar, masih terdapat kesenjangan tertentu antara tingkat kecerdasan mereka dan model AI generatif asing yang besar.
Seperti yang dikatakan Profesor Huang Tiejun, ambil contoh model besar "Tongyi Qianwen" yang dimiliki oleh Alibaba, karena data yang digunakan untuk melatih model besar ini adalah sejumlah besar percakapan berbahasa Mandarin dan percakapan yang diambil dari Taobao, Alipay, Tmall, dan industri lainnya di Alibaba. . Jumlah data pra-pelatihan untuk data teks, serta data teks dari beberapa sumber lainnya, adalah sekitar 200 miliar kata, setara dengan 14 TB data teks.
Volume data pelatihan Obrolan GPT adalah sekitar 4,5 miliar kata, yang setara dengan 300 GB data teks. Data pelatihannya relatif kecil, sehingga "Tongyi Qianwen" milik Alibaba juga kurang memiliki kemampuan multimodal, dalam hal teks, keduanya jauh tertinggal dari GPT-4.
Menurut data "Laporan Evaluasi Kemampuan Komprehensif Model Bahasa Besar 2023" yang dirilis oleh InfoQ Research Center, Chat GPT saat ini memimpin produsen model besar dalam negeri lainnya dengan skor komprehensif 77,13%.

Sumber: "Laporan Evaluasi Kemampuan Komprehensif Model Bahasa Besar 2023"
Pada saat yang sama, Profesor Huang Tiejun juga menunjukkan bahwa model besar saat ini merupakan produk perantara dari iterasi teknologi. Dengan perkembangan selanjutnya dari industri model besar dalam negeri, jumlah ekosistem model besar yang dapat bertahan di masa depan adalah sekitar tiga .
Seperti yang dikatakan Profesor Huang Tiejun, Ma Huateng menunjukkan pada pertemuan tingkat tinggi di Tencent bahwa dividen dari pasar C-end akan hilang dalam sepuluh tahun ke depan. Seluruh harapan terletak pada pasar ToB-end, dan paruh kedua Internet milik Internet industri. Ali Business Research Institute sebelumnya menyatakan bahwa sepuluh tahun ke depan akan menjadi peluang emas bagi transformasi perusahaan tradisional.
Namun, dari perspektif pasar ToB, dengan mengambil referensi pasar SaaS yang telah berkembang selama bertahun-tahun, jika model besar ingin benar-benar membuka pasar ToB, intinya harus membawa nilai "pengurangan biaya dan peningkatan efisiensi" kepada pelanggan, terutama di era ketidakpastian saat ini. Hal ini terutama berlaku ketika beberapa industri masih mengesampingkan model-model besar. Terutama berbasis pada industri manufaktur tradisional, masalah umum yang saat ini dihadapi oleh industri manufaktur tradisional skala kecil dan menengah adalah berkurangnya pesanan, industri ini sedang berperang dalam perang harga, dan siklus pengumpulan pembayaran hilir menjadi lebih panjang industri saat ini sedang berjuang untuk menghidupi diri mereka sendiri. Untuk menghindari biaya trial and error yang tinggi, banyak perusahaan manufaktur kecil dan menengah tentu saja tidak berani mencoba penggunaan model besar dengan mudah.
Dan dilihat dari sejarah perkembangan industri SaaS, industri SaaS dalam negeri mengantarkan puncak pertumbuhan pada tahun 2015 setelah mengalami 10 tahun masa tenang sejak awal tahun 2004. Sejak merebaknya epidemi pada tahun 2020, epidemi ini telah mempercepat transformasi digital perusahaan, dan pasar SaaS dalam negeri telah memasuki periode pertumbuhan yang kritis. Namun meski begitu, ekosistem industri SaaS dalam negeri saat ini belum lengkap dan pasarnya belum matang.
Sumber gambar: Flash Cloud
Jelasnya, pembukaan pasar TOB untuk model besar tidak terjadi dalam semalam, namun merupakan proses yang sangat lambat. Selain itu, biaya yang dikeluarkan oleh algoritme, daya komputasi, dan data selama iterasi model, termasuk peluncuran berbagai fungsi berikutnya, mengharuskan perusahaan model besar untuk terus menginvestasikan dana dalam jumlah besar.
Komersialisasi membutuhkan waktu lama, investasi modal tinggi, dan sulit memperoleh keuntungan dalam jangka pendek. Di masa depan, perusahaan yang kekurangan arus kas tidak punya pilihan selain menutup model besar mereka sendiri karena menghadapi tekanan finansial , dan sumber daya industri akan menjadi lebih sulit. Berkonsentrasi pada produsen model kepala besar.
Dilihat dari pengalaman banyak industri seperti layanan pemesanan kendaraan online dan pengiriman makanan, setelah bertahun-tahun mengalami gejolak di industri yang sedang berkembang, hanya sekitar tiga perusahaan yang benar-benar dapat berkembang di masa depan, dan banyak perusahaan lain yang telah tenggelam dalam sejarah sungai yang panjang.
Secara keseluruhan, AI generatif sedang dalam tahap perkembangan pesat, dengan adanya peluang dan tantangan. Di masa depan, model dunia mungkin menjadi arah pembangunan yang penting, namun implementasinya masih menghadapi banyak masalah teknis dan komersial. Industri AI generatif dalam negeri juga perlu memecahkan masalah seperti skala data dan komersialisasi agar dapat menonjol dalam persaingan yang ketat. Editor Downcodes akan terus memperhatikan tren di bidang ini dan menghadirkan konten yang lebih menarik bagi pembaca.