Microsoft、AI チャットボットによる悪用に対するプロンプトシールドを開発

AI チャットボットは便利ですが、悪意のある人物による操作に対して脆弱です
Microsoft の Prompt Shields は、チャットボットを不正な攻撃から積極的に防御するように設計されたテクノロジーです。
Prompt Shields は、潜在的に危険なプロンプトを特定し、それらがチャットボットの動作に影響を与えるのを防ぐことによって機能します。

人工知能チャットボットは私たちの生活にますます溶け込んでいます。顧客サービスから教育、エンターテイメントに至るまで、チャットボットは多くの利点をもたらしますが、いくつかのリスクももたらします。問題は、悪意のある人々がこれらのチャットボットを邪悪な目的に使用しようとしていることです。それで、これに対してどういう措置が講じられているのか、対策は講じられているのか。

マイクロソフトは「」と呼ばれる新技術を発表しました。プロンプトシールド」は、悪意のあるハッカーがチャットボットを邪悪な目的で使用するのを防ぎ、解決策を見つけることを目的としています。 Prompt Shields は、AI チャットボットを 2 種類の攻撃から保護するように設計されています。では、プロンプト・シールズとは何でしょうか？詳しく見てみましょう。

Microsoft、AI チャットボットによる悪用に対するプロンプトシールドを開発 — AI チャットボットは私たちの生活のさまざまな側面にますます統合されており、メリットとリスクをもたらしています (画像クレジット)

Microsoft の Prompt Shields とは何ですか?また、どのような利点がありますか?

Microsoft の Prompt Shields テクノロジーは、慎重に作成されたユーザー入力による悪意のある操作から AI アプリケーションを保護するように設計されています。

上で述べたように、このテクノロジーは AI チャットボットを 2 種類の攻撃から保護します。

直接攻撃: これらの攻撃では、特別なコマンドを使用して、チャットボットに通常のルールや制限に反する動作を強制します。たとえば、「」などのコマンドを含むプロンプトを入力することで、チャットボットに悪意のあるアクションを実行させることができます。セキュリティ対策をバイパスする” または “オーバーライドシステム”。
間接攻撃: これらの攻撃では、ハッカーはチャットボットユーザーに情報を送信して騙そうとします。この情報は、チャットボットを悪用するように設計された指示を含む電子メールまたは文書である可能性があります。ユーザーがこれらの指示に従うと、チャットボットが無意識のうちに悪意のあるアクションを実行する可能性があります。

Prompt Shields はまた、機械学習と自然言語処理を使用して、ユーザープロンプトやサードパーティデータ内の潜在的な脅威を検出して排除します。