著者らは、NVIDIA が AI トレーニングのために Anna's Archive から数百万冊の海賊版書籍を入手したとして、最近提起された拡大集団訴訟で著作権侵害で NVIDIA を非難しました。訴状では、NVIDIA がシャドウ ライブラリのデータへの高速アクセスを求めていたことを示す内部文書が引用されています。チップメーカーである NVIDIA は、AI 学習チップとデータセンター サービスの需要により、人工知能部門からの収益が増加しました。同社は、ハードウェアと広範なテキスト ライブラリを使用してトレーニングされた NeMo、Retro-48B、InstructRetro、Megatron などの AI モデルを開発しています。この法的異議申し立ては、著作者らがハイテク企業を海賊版書籍でAIモデルを訓練したとして告発した以前の訴訟に続くものである。 2024 年初め、著者らは NVIDIA を訴え、同社の AI モデルが Books3 データセットでトレーニングされており、そのデータセットには Bibliotik サイトの著作権で保護された作品が許可なく含まれていたと主張しました。 NVIDIA は、書籍が同社の AI モデルの統計的相関関係として機能していると述べ、自社の行為をフェアユースであると擁護しました。証拠開示の過程で、原告は追加の証拠を発見した。金曜日、著者らは訴訟を拡大する修正訴状を提出した。このアップデートには、新しい「シャドウ ライブラリ」の主張に加えて、より多くの書籍、著者、AI モデルが含まれています。 Abdi Nazemian を含む著者らは、NVIDIA の社内電子メールと文書を引用し、同社が何百万冊もの著作権で保護された書籍を喜んでダウンロードしたと主張しました。告訴状では、Anna's Archive との協力とされる行為を含む「競争圧力が NVIDIA を著作権侵害に駆り立てた」と主張している。修正された訴状によると、NVIDIA データ戦略チームのメンバーが、データ提供を評価するために Anna's Archive に連絡しました。訴状にはこのやり取りの詳細が記されている。「本が欲しくて、NVIDIA は、残っているシャドウ ライブラリの中で最大かつ最も厚かましい Anna's Archive に、数百万の海賊版資料を入手し、『LLM の事前トレーニング データに Anna's Archive を含める』ことについて連絡を取った。」アンナズ・アーカイブは、海賊版コレクションへの「高速アクセス」に数万ドルを請求した。 NVIDIA は、このアクセスの詳細を調査しました。訴状には、Anna's Archive が NVIDIA にライブラリの違法性を通知したと記載されています。その後、海賊版ライブラリは NVIDIA 幹部に、続行するための内部許可が与えられたかどうかを尋ねました。許可は1週間以内に与えられ、その後アンナズ・アーカイブが海賊版書籍へのアクセスを提供したとされている。 「Anna's Archive に連絡してから 1 週間以内、また、Anna's Archive からコレクションの違法性について警告を受けてから数日以内に、NVIDIA 経営陣は著作権侵害の続行に『ゴーサイン』を出しました。Anna's Archive は数百万冊の著作権で保護された海賊版書籍を NVIDIA に提供しました」と訴状には記載されています。 Anna's Archive は、通常、Internet Archive のデジタル貸与システムを通じて入手できる数百万冊の書籍を含む約 500 テラバイトのデータへのアクセスを NVIDIA に約束しましたが、このシステム自体が法的調査に直面しています。訴状には、NVIDIA がこのアクセスに対して Anna's Archive に支払ったかどうかは明記されていません。訴状では、Books3 データベースに加えて、NVIDIA が LibGen、Sci-Hub、Z-Library からも書籍をダウンロードしたと主張しています。著者らはまた、NVIDIA が配布したスクリプトとツールにより、企業顧客が Books3 の海賊版データセットを含む「The Pile」を自動的にダウンロードできるようになっていると主張しています。これらの主張は、NVIDIA がこれらのデータセットへのアクセスを容易にすることで顧客から収益を上げたと主張し、代理侵害および寄与侵害の罪を提起します。著者らは損害賠償を求め、名前を挙げた著者とおそらくその他数百人を対象に集団訴訟を起こしている。これは、米国の大手テクノロジー企業とアンナズ・アーカイブとの間のやり取りが初めて公開されたもので、最近のドメイン名の喪失を受けて、海賊図書館の知名度が高まる可能性がある。カリフォルニア北部地区連邦地方裁判所に提出された最初の統合および修正された訴状のコピーは、PDF 形式で入手できます。著者としては、アブディ ナゼミアン、ブライアン キーン、スチュワート オーナン、アンドレ デュブス 3 世、スーザン オーリアンなどが挙げられます。
著者らが NVIDIA を大規模な AI トレーニング著作権侵害で非難
Related Stories
ブルー・オリジンとNASAがニュー・グレン発射台の修理スケジュールをめぐり衝突
この異常は、アマゾンのインターネット衛星48機を地球低軌道に運ぶ定期便の定期的なホットファイアテスト中に、発射施設36で発生した。
ASUS、Computex で新しい Zenbook および ExpertBook ラップトップを発表
刷新された 14 インチ モデルは、Windows 11 の各バージョンにわたって、Intel Core Ultra 9、AMD Ryzen AI 9、Snapdragon X1 構成から選択できるのが特徴です。
未発表のPixel Watch 5がカリブ海でダイバーによって発見されたと報じられている
ランディ・ピッチフォードさんは、友人がカリブ海でスキューバダイビング中に未発表の Google Pixel Watch 5 を発見したと主張し、オンラインでの好奇心を刺激しました。
Spotifyはユーザーにユーザー名の編集とプロフィールのプロフィールの追加を許可する可能性がある
Spotifyはまもなくユーザーがユーザー名を編集したり、プロフィールのプロフィールを追加したりできるようになる可能性があり、音楽ストリーミングプラットフォームの待望の社会的見直しを示唆している。



