Anthropic、隠された制限でクロード・フェイブル 5 を密かにスロットリングしていたことを謝罪

Anthropic は、自社の AI モデルである Claude Fable 5 を、研究者や競合他社の開発を妨げる隠れたガードレールで密かに抑制していたことを謝罪した。同社は、たとえこれにより Fable がさらなる問い合わせを拒否することになったとしても、これらの制限が適用されるタイミングに関する透明性を向上させると述べた。

Fable は、Anthropic の Mythos クラスの AI システムで広く利用可能な最初のモデルですが、同社はこのモデルは一般公開するには危険すぎると警告しています。このサービスは、特定の「高リスク」クエリに応答できないようにする保護措置を講じて開始されました。

制限の 1 つの領域は蒸留です。これは、より大きなモデルからの出力を使用してより小さなモデルをトレーニングするための方法です。 Fable のシステムカードで、Anthropic は、ユーザーに変更を通知することなく、抽出試行として認識されるクエリに対する回答を変更し、品質を低下させる可能性があることを示しました。

現在、蒸留試行の疑いのあるクエリはデフォルトで同社の初期の主力モデルである Claude Opus 4.8 に設定され、これが発生するたびにユーザーは通知を受け取ることになります。このフォールバックは、薬物や武器などのトピックに対する広範な安全規制によりクエリが完全にブロックされない限り、生物学、化学、サイバーセキュリティなどの他の高リスク領域にも適用されます。

同社は、安全対策により、Fable が過剰な制限により生物学などの分野の基本的なクエリに不注意でほとんど使用できなくなったことを認めました。アントロピック氏は、目に見えない安全装置の使用は間違いだったと認め、安全対策の透明性が重要であると強調した。

制限を隠蔽するという同社の決定は、評価者と競合他社の両方にとってモデルの能力を制限すると主張するAI研究コミュニティからの大きな反発に直面した。 Anthropic は、Claude を利用して競合するモデルを作成することは利用規約に違反すると述べ、DeepSeek を含む競合他社が自社のモデルを産業規模で蒸留していると以前に非難していた。

「目に見える安全策は探られる可能性があるため、堅牢である必要があり、正しくなるには時間がかかります」とアントロピック氏は書いている。「目に見えない安全策は、より狭い範囲にターゲットを絞ることができるため、誤検知をほとんど発生させずに迅速に出荷することができます。このため、私たちは目に見えない安全策を採用しましたが、それは間違ったトレードオフでした。当社が導入している安全策とその理由を可視化する必要があります。適切なバランスを取れていないことをお詫び申し上げます」と同社は付け加えた。

注目の画像クレジット

新しい Anthropic サービスは、AI エージェントの構築時間を数か月から数週間に短縮します

中国、自立と世界展開を強化するために2,950億ドルのAI計画を開始

中国は、自立性を高め、5年間で世界のテクノロジーライバルに挑戦するために、80％のファーウェイ製チップを活用した2,950億ドル規模のAI戦略を発表した。

June 10, 2026, 16:35

ハスブロ、自社キャラクターを AI メディアにライセンス供与するために Sixth Wall スタジオを立ち上げる

Hasbro は、オプティマスプライムやミスターポテトヘッドなどの人気キャラクターにライセンスを提供するために、CharacterOS システムを使用する AI スタジオである Sixth Wall を立ち上げます。

June 10, 2026, 16:33

ジェフリー・ヒントン氏、ウクライナ戦争で戦争におけるAIに対する見方が変わったと語る

AIの先駆者ジェフリー・ヒントン氏は、ロシアのウクライナ戦争が現代戦争における人工知能とその道徳的リスクに対する見方を変えたと語る。

June 10, 2026, 16:32

Apple、厳格なDMAルールを理由にEU iPhone向けSiri AIの発売を中止

Appleは、Apple Intelligenceを活用した次世代Siri AIが、デジタル市場法（DMA）に基づく厳しい規制上の障害のため、欧州連合のiPhoneおよびiPadユーザー向けにリリースされないことを正式に認めた。 EU 規制当局はすべてのコンプライアンス提案を拒否ユーザーのプライバシーを保護しながら現地の法律に準拠するための技術的ソリューションの草案に何か月も費やしたにもかかわらず、AppleはEUの規制当局があらゆる提案を拒否したと述べた。その結果、この機能は今後の iOS 27 および iPadOS 27 アップデートで停止されることになり、現時点ではヨーロッパでのリリースに関する公式スケジュールはありません。 Mac には驚くべき抜け穴がありますこの規制上の対立は、ヨーロッパのモバイルユーザーが次のような非常に期待されている AI 機能から完全に締め出されることを意味します。...

June 11, 2026, 18:37

Anthropic、隠された制限でクロード・フェイブル 5 を密かにスロットリングしていたことを謝罪

Related Stories

中国、自立と世界展開を強化するために2,950億ドルのAI計画を開始

ハスブロ、自社キャラクターを AI メディアにライセンス供与するために Sixth Wall スタジオを立ち上げる

ジェフリー・ヒントン氏、ウクライナ戦争で戦争におけるAIに対する見方が変わったと語る

Apple、厳格なDMAルールを理由にEU iPhone向けSiri AIの発売を中止