Redditはデータに料金を請求する

Reddit は今週、コンテンツが無断で取得されるのを防ぐために大きな変更を加えました。robots.txt ファイルと呼ばれるものが更新されました。これは、コンピュータープログラム (検索エンジンで使用されるプログラムなど) に Web サイトを閲覧できるかどうかを指示するものです。このファイルは、何かを検索したときに検索エンジンが Web サイトを表示できるようにするために重要です。

しかし現在、人工知能の台頭により、一部の企業はRedditのようなウェブサイトからコンテンツを取得し、元の制作者に問い合わせたり、クレジットを表示したりすることなく、自社のAIシステムをトレーニングしています。これは、コンテンツを作成した人々やそれをホストするウェブサイトを尊重していないため、大きな問題となっています。

Redditは何をやっているのでしょうか?

Reddit の robots.txt ファイルの更新は、コンテンツの使用方法を制御することを目的としています。また、Reddit のルールに従わない、またはコンテンツの使用許可を得ていない未知のコンピュータプログラムやボットがサイトにアクセスすることを制限およびブロックする予定です。

Reddit によると、これらの変更はほとんどの人や、研究者やインターネットの履歴を保存するグループ (インターネットアーカイブなど) などの善良な組織には影響しないという。代わりに、AI 企業が Reddit のコンテンツを許可なく使用することを阻止しようとしている。ただし、これらの AI プログラムは依然として Reddit のルールを無視する可能性があります。

Redditのデータは今のところGoogleの所有物である

Reddit の新しい規則は、すでに同社と契約を結んでいる企業には影響しません。たとえば、Reddit は Google と 6,000 万ドルの契約を結んでおり、Google は Reddit のデータを AI プロジェクトに利用することができます。これは、Reddit が自社のデータを誰が利用できるか慎重に検討し、信頼できるパートナーであることを確認したいと考えていることを示しています。

「Redditのコンテンツを使用するすべての人は、Redditユーザーを保護するために当社の規則に従わなければなりません」とRedditはブログ投稿で述べた。「私たちは、Redditコンテンツへのアクセスを誰と協力し、誰を信頼するかを慎重に選んでいます。」