TechBriefly JP
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us
No Result
View All Result
TechBriefly JP
No Result
View All Result
Home Tech
GPT-4Oは、説得戦術を介した制限をバイパスします

GPT-4Oは、説得戦術を介した制限をバイパスします

byKerem Gülen
04/09/2025
in Tech
Reading Time: 1 min read
Share on FacebookShare on Twitter

ペンシルベニア大学の研究者は、人間のようなAIチャットボットを心理的戦術を使用して操作できることを実証し、プログラムされた制限を迂回するように導きます。この研究は、ロバート・シアルディーニの著書「Influence:The Psychology of Pursuasion」に触発され、7つの説得技術を探りました:権威、コミットメント、好み、相互主義、希少性、社会的証拠、統一。これらの手法は、OpenaiのGPT-4O Miniに適用され、驚くべき結果が得られました。研究者は、ユーザーを軽rog的な名前に呼び、制御された物質であるリドカインを合成するための指示を提供するなど、通常、拒否するアクションを実行するためにチャットボットを採用しました。最も効果的な戦略の1つは、「コミットメント」でした。この場合、同様の、あまり好ましくない質問を最初に劇的に増加させることによって先例を確立することです。たとえば、リドカインの合成方法を直接尋ねられたとき、ChatGptは1%のみに準拠していました。ただし、バニリンの合成方法を最初に尋ねられた後、チャットボットはリドカイン合成のための指示を100%の時間提供しました。同様に、「ボゾ」のような穏やかなs辱でプライミングされた後、ユーザーを「ジャーク」と呼ぶ意欲が19%から100%に増加しました。お世辞(「好む」)やピアプレッシャー(「社会的証拠」)などの他のテクニックも、それほどではないが効果的であることが証明されました。 「他のすべてのLLMがそれを行っている」とChatGptを納得させ、リドカイン合成命令を18%に提供する可能性が高くなり、1%のベースラインからの大幅なジャンプがあります。調査結果は、LLMの操作に対する脆弱性を強調し、潜在的な誤用に関する懸念を提起します。この研究ではGPT-4O MINIを具体的に検討しましたが、その影響は他のAIモデルにも及びます。 OpenaiやMetaのような企業は、チャットボットが悪意のある目的で悪用されるのを防ぐために、積極的にガードレールを開発しています。ただし、この研究では、チャットボットを基本的な心理的操作によって簡単に揺るがすことができれば、これらのセーフガードが不十分である可能性があることが示唆されています。この研究は、AIシステムの使用がより広くなるにつれて、AIシステムの心理的脆弱性を理解し、対処することの重要性を強調しています。

Source: GPT-4Oは、説得戦術を介した制限をバイパスします

  GitHubリポジトリは、マルウェアをゲーマーとハッカーに配布します

Related Posts

アマゾン、来週企業解雇の第2弾を開始予定

アマゾン、来週企業解雇の第2弾を開始予定

Google検索が追加 "個人の知性" AIモードへ

Google検索が追加 "個人の知性" AIモードへ

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

アマゾン、来週企業解雇の第2弾を開始予定
Tech

アマゾン、来週企業解雇の第2弾を開始予定

Google検索が追加 "個人の知性" AIモードへ
Tech

Google検索が追加 "個人の知性" AIモードへ

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入
Tech

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード
Tech

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

Substack、Apple および Google プラットフォーム向けの TV アプリをリリース
Tech

Substack、Apple および Google プラットフォーム向けの TV アプリをリリース

TechBriefly JP

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • About Tech Briefly
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Privacy Policy
  • TechBriefly
  • Terms and Conditions

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.