Amazon Web Services(AWS)는 인공 지능 검색 스타트업 Perplexity AI가 웹 사이트 콘텐츠를 스크랩하여 AWS 서비스 약관을 위반한 혐의로 조사하고 있습니다. Perplexity AI의 가치는 30억 달러이며 Jeff Bezos Family Foundation과 Nvidia의 지원을 받습니다. 이번 조사는 로봇 배제 계약, 저작권 문제, 제3자 서비스 제공업체의 역할에 대한 분쟁을 포함해 AI 기업이 데이터를 획득하는 방식에 대한 광범위한 우려를 불러일으켰습니다. 사건의 후속 전개는 인공 지능 산업의 데이터 수집 규정 및 윤리에 심각한 영향을 미칠 것입니다.
아마존 웹 서비스(AWS)가 웹사이트의 콘텐츠를 스크랩해 AWS 서비스 약관을 위반한 혐의로 인공지능 검색 스타트업 Perplexity AI를 조사하고 있다고 Wired가 보도했습니다.
Jeff Bezos의 가족 재단과 Nvidia가 지원하는 스타트업인 Perplexity AI는 최근 가치가 30억 달러로 평가되었습니다. Wired는 이 회사가 로봇 배제 계약을 통해 차단된 웹사이트의 콘텐츠를 스크랩하는 데 의존하는 것으로 보인다는 사실을 발견했습니다. 로봇 배제 프로토콜은 자동화된 로봇과 크롤러가 어떤 페이지에 액세스해서는 안 되는지 나타내는 웹 표준입니다. 이 계약은 법적 구속력은 없지만 대부분의 기업은 전통적으로 이를 준수해 왔습니다.

AWS 대변인은 회사의 서비스 약관에 따라 고객이 서비스를 사용하여 불법적인 활동을 하는 것을 금지하고 있으며 고객은 약관과 모든 관련 법률을 준수할 책임이 있다고 말했습니다. AWS 고객은 웹사이트를 크롤링할 때 robots.txt 표준을 준수해야 합니다.
조사 결과, Perplexity는 금지된 콘텐츠를 스크랩하기 위해 지난 3개월 동안 최소 수백 번 Condé Nast 소유 자산에 액세스한 비공개 IP 주소를 사용하여 서버에 액세스한 것으로 나타났습니다. The Guardian, Forbes, The New York Times의 대변인도 비슷한 사례가 발견되었다고 말했습니다.
Perplexity의 CEO인 Aravind Srinivas는 발견된 스크래핑이 웹 스크래핑 및 인덱싱 서비스를 제공하는 제3자 회사에 의해 수행되었다고 말했지만 회사 이름은 밝히지 않았습니다. Perplexity 대변인 Sara Platnick은 회사가 Amazon의 문의에 응답했으며 PerplexityBot이 robots.txt를 존중하지만 사용자가 특정 URL을 입력하면 프로토콜을 무시한다고 말했습니다.
디지털 콘텐츠 산업 무역 협회인 Digital Content Next의 CEO인 Jason Kint는 Perplexity에 대한 주장이 사실이라면 회사는 잠재적인 저작권 침해를 방지하기 위해 여러 가지 원칙을 위반했다고 믿습니다. 그는 기본적으로 AI 기업은 퍼블리셔의 콘텐츠에 무단으로 접근, 사용해서는 안 된다고 강조했다.
현재 이 사건은 AI 기업이 데이터를 획득하는 방식에 대한 광범위한 관심과 논의를 불러일으켰습니다. 업계에서는 AWS 조사 결과가 공개되고 Perplexity에 대한 추가 조치가 취해지기를 기대하고 있습니다.
Perplexity AI 사건은 데이터 수집에서 인공지능 기업이 직면한 과제와 윤리적 딜레마를 강조합니다. 또한 데이터 수집의 적법성과 규정 준수를 보장하고 홍보하기 위해 보다 완전한 데이터 사양과 관리 메커니즘을 구축해야 함을 AI 업계에 경고합니다. 인공지능의 건강한 발전.