亞馬遜網路服務(AWS)正在調查人工智慧搜尋新創公司Perplexity AI,原因是該公司涉嫌違反AWS服務條款,抓取了試圖阻止其這樣做的網站內容。 Perplexity AI估值高達30億美元,由傑夫貝佐斯家族基金和Nvidia支持。這項調查引發了對AI公司資料取得方式的廣泛關注,涉及Robots排除協議、版權問題以及第三方服務商的角色等多方面爭議。事件的後續發展將對人工智慧產業的資料取得規範和道德準則產生深遠影響。
根據《連線》雜誌報道,亞馬遜網路服務(AWS)正在對人工智慧搜尋新創公司Perplexity AI進行調查,原因是該公司涉嫌違反AWS服務條款,抓取了試圖阻止其這樣做的網站內容。
Perplexity AI是一家由傑夫貝佐斯家族基金和Nvidia支持的新創公司,最近估值達30億美元。 《連線》雜誌發現,該公司似乎依賴抓取透過Robots排除協議禁止存取的網站內容。 Robots排除協議是網路標準,用於指示哪些頁面不應被自動機器人和爬蟲存取。雖然該協議不具法律約束力,但大多數公司傳統上都會遵守。

AWS發言人表示,本公司服務條款禁止客戶使用其服務進行任何非法活動,客戶有責任遵守條款和所有適用法律。 AWS客戶在爬取網站時必須遵守robots.txt標準。
調查發現,Perplexity可以使用未公開的IP位址存取伺服器,該伺服器在過去三個月內至少造訪了康泰納仕旗下的資產數百次,顯然是為了抓取被禁止存取的內容。 《衛報》、《富比士》和《紐約時報》的發言人也表示檢測到類似情況。
Perplexity執行長Aravind Srinivas稱,被發現的抓取行為是由一家提供網路抓取和索引服務的第三方公司進行的,但拒絕透露該公司名稱。 Perplexity發言人Sara Platnick表示,該公司已回應亞馬遜的詢問,並稱其PerplexityBot尊重robots.txt,但在用戶輸入特定URL時會忽略該協議。
數位內容產業貿易協會Digital Content Next的執行長Jason Kint認為,如果針對Perplexity的指控屬實,該公司就違反了防止潛在版權侵權的多項原則。他強調,人工智慧公司預設不應未經許可取得和使用出版商的內容。
目前,這起事件引發了對AI公司資料取得方式的廣泛關注和討論。業界期待AWS調查結果的公佈,以及可能對Perplexity採取的進一步行動。
Perplexity AI事件凸顯了人工智慧公司在資料取得方面面臨的挑戰和倫理困境,也警示AI產業需要建立更完善的資料規格和管理機制,以確保資料取得的合法性和合規性,促進人工智慧科技的健康發展。