Amazon Web Services (AWS) расследует поисковый стартап Perplexity AI, занимающийся искусственным интеллектом, по подозрению в нарушении условий обслуживания AWS путем очистки содержимого веб-сайта в попытке помешать ему это сделать. Perplexity AI оценивается в 3 миллиарда долларов и поддерживается Фондом семьи Джеффа Безоса и Nvidia. Расследование вызвало широкую обеспокоенность по поводу того, как компании, занимающиеся искусственным интеллектом, получают данные, включая споры по поводу соглашений об исключении роботов, вопросов авторского права и роли сторонних поставщиков услуг. Последующее развитие инцидента окажет глубокое влияние на правила сбора данных и этику индустрии искусственного интеллекта.
Amazon Web Services (AWS) расследует поисковый стартап Perplexity AI, основанный на искусственном интеллекте, по обвинению в нарушении условий обслуживания AWS путем сбора контента с веб-сайтов, которые пытались помешать ему сделать это, сообщает Wired.
Perplexity AI, стартап, поддерживаемый семейным фондом Джеффа Безоса и Nvidia, недавно был оценен в 3 миллиарда долларов. Wired обнаружил, что компания, судя по всему, полагается на сбор контента с веб-сайтов, заблокированных соглашением об исключении роботов. Протокол исключения роботов — это веб-стандарт, который указывает, какие страницы не должны быть доступны автоматическим роботам и сканерам. Хотя соглашение не имеет юридической силы, большинство компаний традиционно его соблюдают.

Представитель AWS заявил, что условия обслуживания компании запрещают клиентам использовать ее сервисы для ведения какой-либо незаконной деятельности, и клиенты несут ответственность за соблюдение условий и всех применимых законов. Клиенты AWS должны соблюдать стандарт robots.txt при сканировании веб-сайтов.
Расследование показало, что Perplexity имела доступ к серверу с использованием нераскрытого IP-адреса, который обращался к объектам, принадлежащим Condé Nast, по крайней мере, сотни раз за последние три месяца, очевидно, для сбора запрещенного контента. Представители The Guardian, Forbes и The New York Times также заявили, что подобные случаи были выявлены.
Генеральный директор Perplexity Аравинд Сринивас заявил, что обнаруженный парсинг был выполнен сторонней компанией, предоставляющей услуги веб-скрапинга и индексирования, но отказался назвать название компании. Представитель Perplexity Сара Платник сообщила, что компания ответила на запрос Amazon и заявила, что ее PerplexityBot уважает robots.txt, но игнорирует протокол, когда пользователи вводят определенный URL-адрес.
Джейсон Кинт, исполнительный директор Digital Content Next, торговой ассоциации индустрии цифрового контента, считает, что, если обвинения против Perplexity верны, компания нарушила ряд принципов предотвращения потенциального нарушения авторских прав. Он подчеркнул, что по умолчанию компании, занимающиеся искусственным интеллектом, не должны получать доступ к контенту издателей и использовать его без разрешения.
В настоящее время этот инцидент вызвал широкое внимание и дискуссию о том, как компании, занимающиеся искусственным интеллектом, получают данные. Индустрия с нетерпением ждет публикации результатов расследования AWS и возможных дальнейших действий против Perplexity.
Инцидент с искусственным интеллектом Perplexity подчеркивает проблемы и этические дилеммы, с которыми сталкиваются компании, занимающиеся искусственным интеллектом, при сборе данных. Он также предупреждает индустрию искусственного интеллекта о том, что ей необходимо создать более полные спецификации данных и механизмы управления, чтобы обеспечить законность и соответствие сбора данных и способствовать их продвижению. искусственный интеллект. здоровое развитие технологий.