A Meta foi apanhada em um processo de violação de direitos autorais altamente esperado, com o autor acusando seu CEO Mark Zuckerberg de aprovar pessoalmente o uso de e-books pirateados e conjuntos de dados de artigos para treinar seu modelo de IA de llama. Esse caso não apenas levou a Meta para a frente, mas também atraiu a atenção generalizada da indústria no uso de direitos autorais de gigantes da tecnologia no treinamento de modelos de IA. Vale a pena notar que este é um dos muitos processos de direitos autorais contra várias empresas de tecnologia que foram acusadas de treinar modelos de IA usando obras protegidas por direitos autorais sem autorização.
De acordo com os mais recentes registros apresentados ao Tribunal Distrital dos EUA para o Distrito Norte da Califórnia, o autor citou o testemunho de Meta no final do ano passado, que mencionou explicitamente que Zuckerberg aprovou o uso de um conjunto de dados chamado LibGen para treinar o modelo de llama. Como um "agregador de links", a Libgen fornece um grande número de publicações acadêmicas com direitos autorais. Embora o site tenha sido processado e fechado por violação de direitos autorais, ele continua a fornecer obras de grandes editores como Cengage Learning e McGraw Hill, que facilita a violação de Meta.

O documento divulgou ainda que os funcionários da Meta Interna reconheceram a Libgen como um "conjunto de dados pirateado conhecido" e percebeu que seu uso poderia afetar adversamente a posição negociada da empresa com os reguladores. O que é ainda mais chocante é que o engenheiro da Meta Nikolay Bashlykov foi acusado de escrever scripts especificamente para excluir informações de direitos autorais nos e-books da libgen, incluindo palavras como "direitos autorais" e "reconhecimento". Além disso, a Meta foi acusada de remover tags de direitos autorais e metadados de origem dos artigos da revista científica, ambos destinados a encobrir sua infração.
A alegação mais controversa do caso foi que a Meta baixou o conteúdo da LibGen através da torrent e ajudou a disseminar esses documentos protegidos por direitos autorais. A torrenting é um método de distribuição de arquivos de rede, e os downloaders também estão compartilhando conteúdo enquanto enviam arquivos. Os advogados do demandante apontaram que a Meta realmente realizou outra forma de violação de direitos autorais por meio de seu envolvimento na torrent. Embora os meta-engenheiros tenham oferecido reservas sobre isso, acreditando que esse comportamento era ilegal, a Meta continuou a realizar o comportamento com o apoio de Ahmad al-Dahle, o chefe do gerador da IA.
As alegações coincidem com um relatório do New York Times em abril passado, que sugeriu que a Meta havia cortado os cantos ao coletar dados de IA. A Meta supostamente contratou empreiteiros africanos para resumir o resumo do livro e considerar a aquisição do editor Simon Schuster. No entanto, os meta -executivos acreditam que a negociação do licenciamento de direitos autorais leva muito tempo e o princípio do uso razoável se tornou sua principal defesa, uma atitude que provocou dúvidas sobre a ética dos negócios das empresas de tecnologia.
Atualmente, o julgamento do caso ainda não foi concluído, e apenas o modelo de lhama do Meta está envolvido. Embora o Tribunal tenha denunciado vários processos de direitos autorais relacionados à IA em 2023, acreditando que o autor não conseguiu provar a infração, as alegações nesse caso ainda podem ter um impacto significativo na meta. Em uma ordem de quarta -feira, o juiz Presidente Vince Chabria apontou que ele rejeitou o pedido da Meta para excluir a maioria dos arquivos, dizendo que a exclusão desses arquivos era claramente destinada a evitar publicidade negativa, em vez de proteger informações comerciais sensíveis. sopro para meta.
O caso não apenas representa um sério desafio para a meta, mas também desencadeia extensas discussões sobre como as empresas de tecnologia podem usar trabalhos protegidos por direitos autorais para treinar modelos de IA. Especialmente na questão da fronteira entre uso razoável e proteção de direitos autorais, este caso pode se tornar uma referência importante para casos semelhantes no futuro. Com o rápido desenvolvimento da tecnologia de IA, como encontrar um equilíbrio entre inovação e proteção de direitos autorais se tornará uma questão importante que as empresas de tecnologia enfrentam e a comunidade jurídica.