A Amazon Web Services (AWS) está investigando a startup de pesquisa de inteligência artificial Perplexity AI por supostamente violar os termos de serviço da AWS ao copiar o conteúdo do site na tentativa de impedir que isso acontecesse. A Perplexity AI está avaliada em US$ 3 bilhões e é apoiada pela Jeff Bezos Family Foundation e pela Nvidia. A investigação gerou preocupação generalizada sobre a forma como as empresas de IA obtêm dados, envolvendo disputas sobre acordos de exclusão de robôs, questões de direitos autorais e o papel de prestadores de serviços terceirizados. O desenvolvimento subsequente do incidente terá um impacto profundo nos regulamentos e na ética de aquisição de dados da indústria de inteligência artificial.
A Amazon Web Services (AWS) está investigando a startup de pesquisa de inteligência artificial Perplexity AI por supostamente violar os termos de serviço da AWS ao extrair conteúdo de sites que tentaram impedi-lo de fazê-lo, relata a Wired.
A Perplexity AI, uma startup apoiada pela fundação da família Jeff Bezos e pela Nvidia, foi recentemente avaliada em US$ 3 bilhões. A Wired descobriu que a empresa parece confiar na extração de conteúdo de sites bloqueados pelo acordo de exclusão de robôs. O Protocolo de Exclusão de Robôs é um padrão da web que indica quais páginas não devem ser acessadas por robôs e rastreadores automatizados. Embora o acordo não seja juridicamente vinculativo, a maioria das empresas tradicionalmente o respeita.

Um porta-voz da AWS disse que os termos de serviço da empresa proíbem os clientes de usar seus serviços para realizar quaisquer atividades ilegais, e os clientes são responsáveis por cumprir os termos e todas as leis aplicáveis. Os clientes da AWS devem aderir ao padrão robots.txt ao rastrear sites.
A investigação descobriu que a Perplexity teve acesso a um servidor usando um endereço IP não divulgado que acessou propriedades de propriedade da Condé Nast pelo menos centenas de vezes nos últimos três meses, aparentemente para extrair conteúdo proibido. Porta-vozes do The Guardian, Forbes e The New York Times também disseram que casos semelhantes foram detectados.
O CEO da Perplexity, Aravind Srinivas, disse que a raspagem descoberta foi realizada por uma empresa terceirizada que fornece serviços de indexação e raspagem na web, mas se recusou a nomear a empresa. A porta-voz da Perplexity, Sara Platnick, disse que a empresa respondeu à investigação da Amazon e disse que seu PerplexityBot respeita o robots.txt, mas ignora o protocolo quando os usuários inserem um URL específico.
Jason Kint, executivo-chefe da Digital Content Next, associação comercial da indústria de conteúdo digital, acredita que, se as alegações contra a Perplexity forem verdadeiras, a empresa violou uma série de princípios para evitar possíveis violações de direitos autorais. Ele enfatizou que, por padrão, as empresas de IA não deveriam acessar e usar o conteúdo dos editores sem permissão.
Atualmente, este incidente suscitou ampla atenção e discussão sobre a forma como as empresas de IA obtêm dados. A indústria está ansiosa pela divulgação dos resultados da investigação da AWS e por possíveis ações adicionais contra a Perplexity.
O incidente da Perplexity AI destaca os desafios e dilemas éticos enfrentados pelas empresas de inteligência artificial na aquisição de dados. Também alerta a indústria de IA que precisa estabelecer especificações de dados e mecanismos de gerenciamento mais completos para garantir a legalidade e conformidade da aquisição de dados e promover. inteligência artificial.