近年、人工知能技術の急速な発展は広範囲にわたる注目を集めていますが、その後の法的および倫理的な問題はますます顕著になっています。最近、人工知能トレーニングにおけるメタの慣行は疑問視されており、モデルトレーニングのために大量の海賊版データを違法にダウンロードしたと非難されています。これは、著作権とデータの使用に関する深い議論を引き起こした事件です。
最近、人工知能トレーニングに対するメタのアプローチは、広範囲にわたる注目を集めています。訴訟によると、同社は、人工知能モデルのトレーニングを許可することなく、多数の海賊版の電子書籍や記事をダウンロードしたと非難されています。事件の中心には、メタの行動のさらなる証拠を提供するいくつかの漏れた電子メールがありました。

Metaは、数千万個の海賊版の本を含むLibgenと呼ばれる物議を醸す大規模なデータセットをダウンロードすることを認めたと、電子メールは示しています。原告が提出した裁判所の文書によると、Metaは、Anna's ArchiveというWebサイトを通じて、Z-LibraryおよびLibgenの少なくとも35.7TBのデータを含む、複数の影ライブラリから少なくとも81.7TBのデータをダウンロードしました。さらに、Metaは以前にLibgenから80.6TBのデータをダウンロードしました。これらの数字は、この違法行為におけるメタの規模が驚くべきことであることを示しています。原告は、他の小規模著作権侵害が法的訴追につながったが、メタの行動はより深刻になったと指摘した。
電子メールの内容では、Metaの従業員は、行動の法的リスクについて懸念を表明しました。 2023年4月、同社の研究エンジニアであるニコライ・バシュリコフは、「同社のラップトップを使用してBTを取得することは不適切だと感じています。彼は、「トレントを使用することはファイルを「シード」すること、つまり外部からコンテンツを共有することを意味します。これは法的に許可されていません。 「設定を編集することによる動作。
また、メタは、データセットを非メタサーバーにダウンロードすることにより、サーバーにトレースされるリスクを軽減しようとしたと言われています。この一連の動作により、Metaのデータ使用と著作権に関する深い反射が引き起こされました。
キーポイント:
メタは、AIトレーニングに使用されている疑いがある81.7TBの海賊版を違法にダウンロードしたと非難されています。
従業員は法的リスクについて懸念を表明し、ダウンロードが法律に違反する可能性があると警告していました。
メタは、非コンパニーサーバーを隠して使用することにより、法的責任を回避しようとします。
このインシデントは、METAのデータ使用量の問題を明らかにしただけでなく、AI業界全体のモーニングコールも聞こえました。技術開発と法的コンプライアンスのバランスを見つける方法は、将来解決する必要がある重要な問題です。