Amazon Web Services (AWS) enquête sur la startup de recherche d'intelligence artificielle Perplexity AI pour avoir prétendument violé les conditions de service d'AWS en supprimant le contenu du site Web dans le but de l'empêcher de le faire. Perplexity AI est évalué à 3 milliards de dollars et est soutenu par la Jeff Bezos Family Foundation et Nvidia. L'enquête a suscité de nombreuses inquiétudes quant à la manière dont les sociétés d'IA obtiennent les données, impliquant des différends sur les accords d'exclusion des robots, des questions de droits d'auteur et le rôle des fournisseurs de services tiers. L'évolution ultérieure de l'incident aura un impact profond sur les réglementations en matière d'acquisition de données et l'éthique du secteur de l'intelligence artificielle.
Amazon Web Services (AWS) enquête sur la startup de recherche d'intelligence artificielle Perplexity AI pour avoir prétendument violé les conditions de service d'AWS en supprimant le contenu des sites Web qui tentaient de l'empêcher de le faire, rapporte Wired.
Perplexity AI, une startup soutenue par la fondation familiale de Jeff Bezos et Nvidia, a récemment été valorisée à 3 milliards de dollars. Wired a découvert que la société semble s'appuyer sur la suppression du contenu des sites Web bloqués par l'accord d'exclusion des robots. Le Robots Exclusion Protocol est une norme Web qui indique quelles pages ne doivent pas être accessibles aux robots et robots d'exploration automatisés. Bien que l’accord ne soit pas juridiquement contraignant, la plupart des entreprises l’ont traditionnellement respecté.

Un porte-parole d'AWS a déclaré que les conditions de service de la société interdisent aux clients d'utiliser ses services pour mener des activités illégales, et que les clients sont responsables du respect des conditions et de toutes les lois applicables. Les clients AWS doivent respecter la norme robots.txt lors de l'exploration de sites Web.
L'enquête a révélé que Perplexity avait accès à un serveur utilisant une adresse IP non divulguée qui a accédé aux propriétés appartenant à Condé Nast au moins des centaines de fois au cours des trois derniers mois, apparemment pour récupérer du contenu interdit. Les porte-parole du Guardian, de Forbes et du New York Times ont également déclaré que des cas similaires avaient été détectés.
Le PDG de Perplexity, Aravind Srinivas, a déclaré que le grattage découvert avait été effectué par une société tierce qui fournit des services de grattage et d'indexation de sites Web, mais a refusé de nommer la société. La porte-parole de Perplexity, Sara Platnick, a déclaré que la société avait répondu à la demande d'Amazon et déclaré que son PerplexityBot respectait le fichier robots.txt mais ignorait le protocole lorsque les utilisateurs saisissaient une URL spécifique.
Jason Kint, directeur général de Digital Content Next, l'association professionnelle de l'industrie du contenu numérique, estime que si les allégations contre Perplexity sont vraies, la société a violé un certain nombre de principes visant à prévenir toute violation potentielle du droit d'auteur. Il a souligné que par défaut, les sociétés d’IA ne devraient pas accéder ni utiliser le contenu des éditeurs sans autorisation.
Actuellement, cet incident a suscité une large attention et un débat sur la manière dont les sociétés d’IA obtiennent les données. L'industrie attend avec impatience la publication des résultats de l'enquête AWS et d'éventuelles mesures supplémentaires contre Perplexity.
L'incident de Perplexity AI met en évidence les défis et les dilemmes éthiques auxquels sont confrontées les sociétés d'intelligence artificielle dans l'acquisition de données. Il avertit également l'industrie de l'IA qu'elle doit établir des spécifications de données et des mécanismes de gestion plus complets pour garantir la légalité et la conformité de l'acquisition de données et promouvoir. intelligence artificielle. développement sain de la technologie.