Sebuah studi dari University of Reading di Inggris telah memunculkan kekhawatiran mengenai penerapan AI di bidang akademik. Studi ini menemukan bahwa dalam ujian perguruan tinggi yang sebenarnya, 94% jawaban yang dihasilkan oleh AI tidak dilihat oleh guru, dan skor AI secara signifikan lebih tinggi dibandingkan siswa manusia dalam 83,4% kasus. Penelitian ini tidak dilakukan di laboratorium, namun menggunakan lingkungan ujian di kehidupan nyata dan standar penilaian. Hasilnya mengejutkan dan menimbulkan tantangan serius terhadap integritas akademik dan sistem pendidikan. Studi ini menggunakan GPT-4 untuk menghasilkan jawaban tanpa modifikasi apa pun untuk memastikan "keaslian" AI dan menunjukkan sepenuhnya kekuatan AI dalam penulisan akademis.
Di ruang ujian ujian universitas, "invasi" AI diam-diam terjadi. Penelitian dari University of Reading di Inggris mengungkap fenomena menakjubkan: Dalam ujian universitas sebenarnya, 94% jawaban yang dihasilkan AI luput dari pandangan para guru dan tidak terlihat jelas. Yang lebih mengejutkan lagi adalah bahwa “teman sekelas” AI ini mendapat nilai jauh lebih tinggi dibandingkan siswa manusia dalam 83,4% kasus. Hal ini tampaknya menunjukkan bahwa AI tidak hanya menunjukkan potensi dalam menggantikan pekerjaan manusia, namun juga mulai mengungguli mahasiswa dalam tugas-tugas kognitif.
Penelitian ini tidak dilakukan di laboratorium tertutup, melainkan di lingkungan pemeriksaan nyata. Tim peneliti melakukan "tes Turing" di Fakultas Psikologi dan Ilmu Pidato Klinis Universitas Reading tanpa memberi tahu penilai. Ujian ini mencakup pertanyaan jawaban singkat dan pertanyaan esai, dengan campuran konten yang dihasilkan AI, terhitung sekitar 5%. Para peneliti menggunakan kata-kata cepat yang terstandarisasi agar GPT-4 menghasilkan jawaban, namun tidak melakukan modifikasi apa pun pada konten untuk memastikan "keaslian" AI.

Proses penandaan mengikuti standar ketat Universitas Reading dan mencakup penandaan awal, tinjauan independen, dan pertemuan kalibrasi dengan tim penandaan. Namun, meski dalam pengawasan seperti itu, tugas yang diserahkan oleh AI masih sulit untuk diselesaikan. Hasil penelitian menunjukkan bahwa tugas yang dihasilkan AI tidak ditemukan di banyak modul, dan skor sering kali terkonsentrasi di area dengan skor tinggi.
Penemuan ini mendorong refleksi mendalam terhadap integritas akademik dan tujuan pendidikan. Jika siswa dapat menggunakan AI untuk menghasilkan konten berkualitas tinggi yang sulit ditemukan, lalu bagaimana kita harus mereformasi sistem pendidikan untuk beradaptasi dengan teknologi baru ini? Tahun lalu, sebuah makalah di Nature juga menunjukkan bahwa AI lebih efektif dalam menyelesaikan kuliah tugas kuliah Telah menunjukkan kemampuan untuk mencari, mengintegrasikan dan menganalisis informasi secara kritis, yang bertepatan dengan tujuan pelatihan universitas.
Kesimpulan penelitian ini tentu saja memprihatinkan. Kemampuan GPT-4 menyulitkan siswa untuk mendeteksi kecurangan menggunakan AI, dan kemungkinan mencapai hasil yang lebih baik sangat besar. Hal ini tidak hanya memberikan tantangan terhadap integritas akademik, namun juga mendorong kita memikirkan arah pendidikan di masa depan. Meski beberapa netizen dengan bercanda mempertanyakan apakah penelitian ini juga diselesaikan oleh AI, penulis dengan sungguh-sungguh menyatakan bahwa konten penelitian tersebut sepenuhnya dilakukan oleh manusia.
Hasil penelitian ini memaksa kita untuk mengkaji kembali metode penilaian pendidikan dan mekanisme menjaga integritas akademik. Dalam menghadapi pesatnya perkembangan teknologi AI, bagaimana menumbuhkan pemikiran kritis dan kemampuan inovatif siswa, serta bagaimana menjamin keadilan dan ketidakberpihakan dalam ujian akan menjadi isu yang perlu menjadi fokus perhatian dalam bidang pendidikan di masa depan. Kita perlu secara aktif mengeksplorasi model pengajaran dan metode penilaian baru untuk beradaptasi dengan tantangan baru di era kecerdasan buatan.