Googleは、チケットの予約やショッピングなどの自動アクションを可能にし、潜在的なデータや財務リスクに対処するChromeのエージェント機能に対するセキュリティアプローチを詳しく説明した。 Google では、エージェント アクションを管理するためにいくつかのモデルを採用しています。 Gemini で構築された User Alignment Critic は、プランナー モデルによって生成されたアクション アイテムを精査します。批評家モデルが、計画されたタスクがユーザーの目標と一致していないと判断した場合、プランナーに戦略を再評価するよう促します。批評家モデルは、実際の Web コンテンツではなく、提案されたアクションのメタデータのみにアクセスします。許可されていないサイトまたは信頼できないサイトへのエージェントのアクセスを制限するために、Google はエージェント オリジン セットを利用します。これらのセットは、モデルを特定の読み取り専用および読み取り/書き込み可能なオリジンに制限します。読み取り専用のオリジンは、Gemini が消費できるコンテンツを定義します。たとえば、ショッピング サイトの商品リストは関連性がありますが、バナー広告は関連性がありません。エージェントは、ページ上の指定された iframe とのみ対話できます。同社はブログ投稿で、「この境界線により、限られたオリジンセットからのデータのみがエージェントに利用可能となり、このデータは書き込み可能なオリジンにのみ渡されることが強制される。これにより、クロスオリジンデータ漏洩の脅威ベクトルが制限される。これにより、ブラウザは、読み取り可能なセットの外にあるモデルデータさえも送信しないなど、分離の一部を強制する機能も得られる。」と述べた。 Google は、別のオブザーバー モデルを介してページ ナビゲーションを監視し、モデルによって生成された有害な URL へのアクセスを防ぎます。機密性の高いタスクについては、Google はユーザーの同意を必要とします。エージェントが銀行や医療プラットフォームなどの機密性の高いサイトにアクセスしようとすると、ユーザーの許可を要求します。サイトでサインインが必要な場合、Chrome はユーザーにパスワード マネージャーを使用する許可を求めるメッセージを表示します。エージェントのモデルはパスワード データにアクセスしません。エージェントが購入やメッセージの送信などのアクションを開始する前に、ユーザーは質問されます。 Google はまた、望ましくないアクションを防ぐためにプロンプト インジェクション分類子を採用しており、研究者が開発した攻撃に対するエージェント機能を評価しています。今月初め、 困惑 エージェントに対するプロンプト インジェクション攻撃に対抗するために、オープンソースのコンテンツ検出モデルをリリースしました。
注目の画像クレジット




