Tumblr se asocia con OpenAI para vender publicaciones de usuarios para capacitación en IA

Autor：Eve Cole Fecha de actualización：2025-02-05 11:00:03

Automattic, la empresa matriz de Tumblr, planea vender datos de publicaciones de usuarios a OpenAI y Midjourney para el entrenamiento de modelos de IA, una medida que genera preocupaciones sobre la privacidad del usuario y la seguridad de los datos. Esto es similar a casos anteriores de cooperación entre empresas como Reddit y Shutterstock y empresas de inteligencia artificial, ambas involucrando el uso comercial de datos de usuarios. Automattic promete proporcionar a los usuarios configuraciones para optar por no compartir datos, pero aún existen muchas ambigüedades sobre el alcance de los métodos de recopilación y procesamiento de datos, especialmente en lo que respecta al manejo de publicaciones no públicas recopiladas accidentalmente, lo que requiere mayor aclaración y explicación.

Automattic, la empresa matriz de Tumblr, está en conversaciones con OpenAI y Midjourney para vender publicaciones de usuarios para entrenar modelos de IA. Automattic se está preparando para lanzar una configuración que permitirá a los usuarios optar por no compartir datos con terceros. Rastrearon todas las publicaciones públicas en Tumblr desde 2014 hasta 2023. Aunque los errores incluyen algunas publicaciones no públicas, no está claro cómo se procesarán los datos y qué datos se utilizarán para entrenar el modelo. Anteriormente, Reddit firmó un acuerdo con Google para utilizar los datos de los usuarios para entrenar el modelo de IA de Google cada año; Shutterstock firmó un acuerdo con OpenAI para utilizar su biblioteca de fotografías para entrenar el modelo.

Esta medida resalta una vez más la realidad de que la capacitación en grandes modelos de lenguaje se basa en cantidades masivas de datos y también plantea preocupaciones continuas sobre la privacidad y la ética de los datos. Automattic necesita explicar de forma transparente sus procesos de procesamiento de datos y garantizar que los usuarios tengan opciones reales para mantener la confianza de los usuarios y el desarrollo sostenible de la plataforma. En el futuro, prácticas similares de intercambio de datos enfrentarán una regulación más estricta y un escrutinio público más amplio.