TechBriefly JP
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us
No Result
View All Result
TechBriefly JP
No Result
View All Result
Home Tech
Openai ChatGPT-5は、研究で25%のエラー率を示しています

Openai ChatGPT-5は、研究で25%のエラー率を示しています

byKerem Gülen
25/09/2025
in Tech
Reading Time: 1 min read
Share on FacebookShare on Twitter

Tom’s Guideの記事によると、OpenaiのChatGPT-5モデルに関する調査では、症例の約25%で誤った回答を生成すると判断されました。これは永続的なエラー率を強調していますが、モデルは前任者のGPT-4と比較して精度の大幅な改善を示しています。具体的には、CHATGPT-5は事実上のエラーを約45%少なくし、GPT-4の6倍少ない幻覚または完全に構成された回答を生成します。この進歩にもかかわらず、この研究は、モデルは依然として自信過剰に苦しんでおり、誤った情報を自信を持って提示できると報告しています。モデルのパフォーマンスと精度は、特定のタスクによって異なります。たとえば、2025年のAIME数学テストで94.6%を獲得し、実際のコーディングタスクのセットで74.9%の成功率を示しました。より挑戦的なMMLU Proベンチマークでは、科学、数学、歴史をカバーする学術テストで、ChatGPT-5は約87%の精度を達成しました。しかし、それは依然として一般的な知識と複雑な推論の質問に間違いを犯します。この研究は、これらのエラーをいくつかの根本的な要因に帰します。これらには、微妙な質問を完全に理解する際のモデルの制限が含まれ、時代遅れまたは不完全なトレーニングデータを使用し、確率的パターン予測に基づく基本的な設計が含まれます。このメカニズムは、もっともらしいと思われるが、事実上不正確であると思われる応答を生成することがあります。この記事は、ChatGPT-5からソースされた重要な情報を確認するようユーザーにアドバイスします。モデルが間違いないことを考えると、この注意は、モデルの文書化された信頼性の改善にさえ、専門的、学術的、または健康上の問題に関連する問い合わせに特に重要です。

Source: Openai ChatGPT-5は、研究で25%のエラー率を示しています

  OG ディアブロ ブラウザ復活: 今すぐ無料でプレイ

Related Posts

アマゾン、来週企業解雇の第2弾を開始予定

アマゾン、来週企業解雇の第2弾を開始予定

Google検索が追加 "個人の知性" AIモードへ

Google検索が追加 "個人の知性" AIモードへ

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

アマゾン、来週企業解雇の第2弾を開始予定
Tech

アマゾン、来週企業解雇の第2弾を開始予定

Google検索が追加 "個人の知性" AIモードへ
Tech

Google検索が追加 "個人の知性" AIモードへ

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入
Tech

JBL、AIを活用したステム分離技術で練習用アンプ市場に参入

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード
Tech

OracleとSilver Lakeが画期的なTikTok US契約でコンソーシアムをリード

Substack、Apple および Google プラットフォーム向けの TV アプリをリリース
Tech

Substack、Apple および Google プラットフォーム向けの TV アプリをリリース

TechBriefly JP

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • About Tech Briefly
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Privacy Policy
  • TechBriefly
  • Terms and Conditions

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.