Amazon Web Services (AWS) sedang menyelidiki startup pencarian kecerdasan buatan, Perplexity AI, karena diduga melanggar persyaratan layanan AWS dengan menghapus konten situs web sebagai upaya untuk mencegahnya. Perplexity AI bernilai $3 miliar dan didukung oleh Jeff Bezos Family Foundation dan Nvidia. Investigasi ini telah memicu kekhawatiran luas mengenai cara perusahaan AI memperoleh data, termasuk perselisihan mengenai perjanjian pengecualian Robot, masalah hak cipta, dan peran penyedia layanan pihak ketiga. Perkembangan selanjutnya dari insiden ini akan berdampak besar pada peraturan akuisisi data dan etika industri kecerdasan buatan.
Amazon Web Services (AWS) sedang menyelidiki startup pencarian kecerdasan buatan, Perplexity AI, karena diduga melanggar persyaratan layanan AWS dengan mengambil konten dari situs web yang mencoba mencegahnya, Wired melaporkan.
Perplexity AI, sebuah startup yang didukung oleh yayasan keluarga Jeff Bezos dan Nvidia, baru-baru ini bernilai $3 miliar. Wired menemukan bahwa perusahaan tersebut tampaknya mengandalkan pengumpulan konten dari situs web yang diblokir melalui perjanjian pengecualian Robots. Protokol Pengecualian Robot adalah standar web yang menunjukkan halaman mana yang tidak boleh diakses oleh robot dan crawler otomatis. Meskipun perjanjian tersebut tidak mengikat secara hukum, sebagian besar perusahaan secara tradisional mematuhinya.

Juru bicara AWS mengatakan persyaratan layanan perusahaan melarang pelanggan menggunakan layanannya untuk melakukan aktivitas ilegal, dan pelanggan bertanggung jawab untuk mematuhi persyaratan dan semua hukum yang berlaku. Pelanggan AWS harus mematuhi standar robots.txt saat merayapi situs web.
Investigasi menemukan bahwa Perplexity memiliki akses ke server menggunakan alamat IP yang dirahasiakan yang mengakses properti milik Condé Nast setidaknya ratusan kali selama tiga bulan terakhir, tampaknya untuk mengikis konten terlarang. Juru bicara The Guardian, Forbes dan The New York Times juga mengatakan kasus serupa telah terdeteksi.
CEO Perplexity Aravind Srinivas mengatakan scraping yang ditemukan dilakukan oleh perusahaan pihak ketiga yang menyediakan layanan web scraping dan pengindeksan, namun menolak menyebutkan nama perusahaan tersebut. Juru bicara Perplexity Sara Platnick mengatakan perusahaan menanggapi pertanyaan Amazon dan mengatakan PerplexityBot menghormati robots.txt tetapi mengabaikan protokol ketika pengguna memasukkan URL tertentu.
Jason Kint, kepala eksekutif Digital Content Next, asosiasi perdagangan industri konten digital, percaya bahwa jika tuduhan terhadap Perplexity benar, maka perusahaan tersebut telah melanggar sejumlah prinsip untuk mencegah potensi pelanggaran hak cipta. Dia menekankan bahwa secara default, perusahaan AI tidak boleh mengakses dan menggunakan konten penerbit tanpa izin.
Saat ini, kejadian ini telah memicu perhatian dan diskusi luas mengenai cara perusahaan AI memperoleh data. Industri ini menantikan rilis hasil investigasi AWS dan kemungkinan tindakan lebih lanjut terhadap Perplexity.
Insiden Perplexity AI menyoroti tantangan dan dilema etika yang dihadapi oleh perusahaan kecerdasan buatan dalam akuisisi data. Hal ini juga memperingatkan industri AI bahwa mereka perlu menetapkan spesifikasi data dan mekanisme manajemen yang lebih lengkap untuk memastikan legalitas dan kepatuhan akuisisi dan promosi data. kecerdasan buatan.