アマゾン ウェブ サービス(AWS)は、人工知能検索のスタートアップであるPerplexity AIが、AWSの利用規約に違反してウェブサイトのコンテンツをスクレイピングして阻止しようとした疑いで捜査している。 Perplexity AI の価値は 30 億ドルで、ジェフ ベゾス ファミリー財団と Nvidia によって支援されています。この調査は、ロボット排除協定、著作権問題、サードパーティサービスプロバイダーの役割をめぐる紛争を伴い、AI企業がデータを取得する方法について広く懸念を引き起こした。その後の事件の進展は、人工知能業界のデータ取得規制と倫理に重大な影響を与えるでしょう。
アマゾン ウェブ サービス(AWS)は、AWS の利用規約に違反し、それを妨げようとした Web サイトからコンテンツをスクレイピングした疑いで、人工知能検索のスタートアップ企業 Perplexity AI を調査していると Wired が報じています。
ジェフ・ベゾス氏の家族財団とエヌビディアが支援する新興企業であるパープレクシティAIの評価額は最近30億ドルとされた。 Wired は、同社がロボット排除協定によってブロックされている Web サイトからコンテンツをスクレイピングすることに依存しているようであることを発見しました。 Robots Exclusion Protocol は、自動化されたロボットやクローラーがどのページにアクセスすべきかを示す Web 標準です。この協定には法的拘束力はありませんが、ほとんどの企業は伝統的にこの協定を遵守してきました。

AWSの広報担当者は、同社の利用規約は顧客が同社のサービスを利用して違法行為を行うことを禁じており、顧客は規約と適用されるすべての法律を遵守する責任があると述べた。 AWS のお客様は、Web サイトをクロールするときに robots.txt 標準に準拠する必要があります。
調査の結果、Perplexity が非公開の IP アドレスを使用してサーバーにアクセスし、過去 3 か月間でコンデナスト所有の施設に少なくとも数百回アクセスし、明らかに禁止されているコンテンツを収集していたことが判明しました。ガーディアン紙、フォーブス紙、ニューヨーク・タイムズ紙の広報担当者も、同様の事例が見つかったと述べた。
Perplexityの最高経営責任者(CEO)Aravind Srinivas氏は、発見されたスクレイピングはWebスクレイピングとインデックスサービスを提供するサードパーティ企業によって実行されたと述べたが、企業名は明らかにしなかった。 Perplexityの広報担当サラ・プラトニック氏は、同社がAmazonの調査に応じ、同社のPerplexityBotはrobots.txtを尊重しているが、ユーザーが特定のURLを入力するとプロトコルを無視すると述べた。
デジタルコンテンツ産業業界団体であるデジタルコンテンツネクストのジェイソン・キント最高経営責任者(CEO)は、パープレクシティに対する告発が事実であれば、同社は著作権侵害の可能性を防ぐための多くの原則に違反したことになると考えている。同氏は、デフォルトでは、AI企業は許可なくパブリッシャーのコンテンツにアクセスして使用すべきではないと強調した。
現在、この事件は AI 企業がデータを取得する方法について広く注目と議論を引き起こしています。業界は、AWS の調査結果の発表と、Perplexity に対するさらなる措置の可能性を期待しています。
Perplexity AI 事件は、データ取得の合法性とコンプライアンスを確保し、データ取得を促進するために、より完全なデータ仕様と管理メカニズムを確立する必要があると AI 業界に警告しています。人工知能の健全な発展。