TechBriefly JP
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us
No Result
View All Result
TechBriefly JP
No Result
View All Result
Home Tech
Openai、人類共有AIモデルの安全評価の結果

Openai、人類共有AIモデルの安全評価の結果

byEmre Çıtak
28/08/2025
in Tech
Reading Time: 1 min read
Share on FacebookShare on Twitter

まれにコラボレーションの例では、AIはOpenaiとAnthropicのライバルで、互いのAIシステムの安全評価を実施し、詳細なレポートで分析の結果を共有しています。

「Sycophancy、Whisblowing、Self-Hearversation、Support Human誤用」などの特性について、O3、O4-MINI、GPT-4O、GPT-4.1を含むOpenAIモデルを評価しました。この評価では、OpenaiのO3およびO4-MINIモデルが人類自身のモデルと整合していることがわかりました。しかし、同社はGPT-4OおよびGPT-4.1の汎用モデルで潜在的な誤用について懸念を提起しました。人類はまた、O3を除くすべてのテストされたモデルがある程度の相乗効果を示したことを報告しました。

特に、Anthropicのテストには、潜在的に危険なクエリからユーザーを保護するために設計された「安全な完了」関数を特徴とするOpenaiの最新リリースGPT-5は含まれていません。この開発は、Openaiが自分の命を奪う前にChatGPTと自殺計画について議論した悲劇的な事件に続いて、最初の不法な死の訴訟に直面しているためです。

逆に、Openaiは、指導階層、脱獄、幻覚、および計画のための人類モデルを評価しました。 Claudeモデルは一般に、命令階層テストでうまく機能し、幻覚テストで高い拒否率を実証し、不確実な状況で潜在的に誤った回答を提供する可能性が低いことを示しています。

Openaiは、新しいGPTモデルの開発でClaudeを使用して人類のサービス条件に違反したと言われていることを考えると、このコラボレーションは特に注目に値します。批評家と法律専門家は、ユーザー、特に未成年者を潜在的な危害から保護するためのガイドラインを提唱しているため、この事件はAIの安全性の重要性の増加を強調しています。

完全なレポートは、AI開発に密接に従った人々の技術的な詳細を提供します。

Source: Openai、人類共有AIモデルの安全評価の結果

  Realme 8 Proは、108MPカメラを搭載して3月24日に発売されます

Related Posts

アマゾン、来週企業解雇の第2弾を開始予定

アマゾン、来週企業解雇の第2弾を開始予定

Google検索が追加 "個人の知性" AIモードへ

Google検索が追加 "個人の知性" AIモードへ

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

アマゾン、来週企業解雇の第2弾を開始予定
Tech

アマゾン、来週企業解雇の第2弾を開始予定

Google検索が追加 "個人の知性" AIモードへ
Tech

Google検索が追加 "個人の知性" AIモードへ

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入
Tech

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード
Tech

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

Substack、Apple および Google プラットフォーム向けの TV アプリをリリース
Tech

Substack、Apple および Google プラットフォーム向けの TV アプリをリリース

TechBriefly JP

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • About Tech Briefly
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Privacy Policy
  • TechBriefly
  • Terms and Conditions

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.