El director ejecutivo de Meta, Mark Zuckerberg, defendió recientemente en los tribunales el uso de datos protegidos por derechos de autor por parte de Meta para entrenar la IA, lo que atrajo una atención generalizada. Los demandantes en este caso incluyen autores conocidos que acusan a Meta de utilizar una gran cantidad de datos de libros pirateados en el entrenamiento de modelos de IA. La estrategia de defensa de Zuckerberg es bastante controvertida. Comparó el comportamiento de Meta con el contenido pirateado en YouTube, tratando de demostrar que el comportamiento de Meta no fue una infracción intencional. Queda por ver si los tribunales adoptarán esta estrategia de defensa. Este artículo analizará en detalle el testimonio de Zuckerberg y los últimos desarrollos en el caso, y explorará su impacto en el desarrollo futuro de la industria de la inteligencia artificial.
El director ejecutivo de Meta, Mark Zuckerberg, ha utilizado la lucha de YouTube contra el contenido pirateado para defender el uso que hace la empresa de datos protegidos por derechos de autor en la formación de IA en procedimientos legales recientes. El caso, llamado "Kadrey v. Meta", es una de las muchas demandas por derechos de autor contra empresas de inteligencia artificial en los tribunales de Estados Unidos. Entre los demandantes se encuentran los conocidos escritores Sarah Silverman y Ta-Nahisi Coates.

Según extractos del testimonio publicados recientemente, Zuckerberg señaló que si bien puede existir algo de contenido pirateado en YouTube, YouTube todavía está trabajando para eliminarlo. "La mayoría del contenido de YouTube debería ser legal y tener las licencias pertinentes", afirmó Zuckerberg. Los comentarios insinúan su postura sobre el uso por parte de Meta de un conjunto de datos de libros electrónicos con derechos de autor llamado LibGen para el entrenamiento de IA.
LibGen es un sitio web de agregación de enlaces que proporciona obras protegidas por derechos de autor de múltiples editoriales, incluidas Cengage Learning, McGraw-Hill y Pearson Education. El sitio ha sido demandado varias veces por infracción de derechos de autor y multado con decenas de millones de dólares. Los documentos judiciales muestran que a pesar de que el equipo de IA de Meta expresó su preocupación por los riesgos legales del uso de LibGen, Zuckerberg aprobó su uso como conjunto de datos de entrenamiento.
Durante el interrogatorio, Zuckerberg afirmó que no estaba familiarizado con LibGen, pero dijo que prohibir una plataforma como YouTube no sería razonable. "No, no me gustaría establecer políticas sobre las personas que usan YouTube porque algunos contenidos pueden tener derechos de autor", dijo. También reconoció que Meta debe tener cuidado al utilizar material protegido por derechos de autor para la capacitación.
Según la última acusación de los abogados de los demandantes, Meta cruzó ciertos libros pirateados en LibGen con libros con derechos de autor disponibles para licencia para determinar si debía llegar a un acuerdo de licencia con el editor. Además, el demandante también acusó a Meta de utilizar el conjunto de datos de LibGen al entrenar su último modelo Llama y de descargar libros electrónicos de otra fuente pirateada, Z-Library, para entrenar.
Z-Library también ha sido objeto de múltiples acciones legales debido a problemas de derechos de autor, y sus defensores fueron acusados de infracción de derechos de autor, fraude en línea y lavado de dinero en 2022.
Destacar:
Zuckerberg citó el caso de YouTube ante los tribunales para defender el uso de material protegido por derechos de autor por parte de Meta en el entrenamiento de IA.
El demandante acusó a Meta de utilizar el conjunto de datos de libros pirateados LibGen para entrenar el modelo Llama y ocultar información relevante.
Meta se ha enfrentado a múltiples demandas por derechos de autor y los riesgos legales relacionados han desencadenado discusiones e inquietudes internas.
La sentencia final de este caso tendrá un profundo impacto en la industria de la inteligencia artificial. Proporcionará una referencia legal importante sobre cómo las empresas de IA utilizan datos protegidos por derechos de autor para entrenar modelos en el futuro y puede impulsar a la industria a desarrollar medidas de protección de derechos de autor más estrictas.