国防総省は、Google、Openai、Anthropic、Xaiにそれぞれ最大2億ドル相当の契約を授与し、「さまざまなミッションエリアにわたってエージェントAIワークフロー」を開発し、「これらの企業が重要な国家安全保障のニーズを理解し、対処する能力を高める」ことを目指しています。チーフデジタルおよび人工知能局が発行したこれらの契約は、イデオロギーの憲法と関係する一部のAIモデルの整合に関する懸念を提起しました。

OpenaiとGoogleは、それぞれ大規模な言語モデルであるChatGptとGeminiの人間のフィードバックから強化学習を採用しています。この方法では、報酬モデルと人間の入力を利用して、「不誠実で有毒な、 [and] 有害な感情。」 IBMは、このアプローチは「存在しない」単純な数学的または論理的な式に依存していないため、有益であると指摘しています。 [to] 主観的な人間の価値を定義します。」

対照的に、AnthropicのモデルであるClaudeは、2023年5月に公開された「憲法」を使用しています。これは、「大規模な人間のフィードバックを介して暗黙的に決定される価値ではなく、明示的な値」を提供します。人類は、この憲法上の整合性は、請負業者を不穏な出力にさらすなど、人間のフィードバックモデルに関連する問題を回避すると述べています。クロードの原則は、一部は国連の普遍的な人権宣言に基づいています。これには、「社会保護」(第22条)、「給与との定期的な休日」(第24条)、「住宅と医療25条」(第25条)、「等しくアクセス可能」の高等教育などの基本的権利を超えた規定が含まれます。

クロードの憲法の顕著な側面は、「非西洋の視点の考慮」を組み込むように設計された一連の原則です。「産業化されていない、豊かな、または資本的または文化からのものに有害または攻撃的であると見なされる可能性が最も低い」と見なされる可能性が最も低い」という指令を含む。米国は工業化され、裕福で、資本主義国家であるため、これは疑問を促し、国防総省内で展開したAIシステムが優先順位を付ける価値との潜在的な不整合を示唆しています。 Vergeは、政府のClaudeのモデルが「Looser Guardrailsを持っている」と報告していますが、これらのモデルの修正された憲法は公開されていません。

人類の価値は少なくとも公開されていますが、Cato Instituteの技術政策研究員であるMatthew Mittelsteadtは、Xaiがより大きな懸念を提起していると考えています。 Mittelsteadtは、Xaiがその価値と「「第一原則」アプローチについて「驚くほど小さなドキュメント」をリリースした」と述べています。 Xaiの商業的大手言語モデルであるGrokは、Xaiのアプローチは、「確立された物語や偏見に依存するよりも、第一原則、つまり基本的で自明の真実を通して宇宙を理解することを強調する」と述べました。しかし、Grokはまた、「Xaiは決定的な公開文書に「第一原則」のセットを明示的にリストしていない」と「原則第一のアプローチは、厳格なチェックリストではなく、基本的な真実からの推論の考え方に関するものである」と認めました。

Xaiの公式ウェブサイトは、第一原則からの推論を「課題と説明しています[ing] 論理に基づいた基本的な真実に問題を分解することにより、従来の思考。」しかし、Xaiモデルは、「特定の問題に関するElon Muskの判断に直接延期するようになっている」ことを示唆しています。これは、特に「メカヒトラー」と呼ばれ、7月8日に「Grok for Grok」の予想を削除したと伝えられていると伝えられています。ソーシャルメディアの投稿。

これらの懸念にもかかわらず、Abundance InstituteのAIポリシーの責任者であるNeil Chilsonは、「これらのツールが内部構成が国家安全保障に何らかのリスクをもたらす立場にある可能性は非常に低い」と考えています。チルソンは、すべての企業に同様の助成金を授与するという国防総省の決定は、異なるモデルで結果を比較する意図を示しており、劣等モデルが継続的に使用されないようにすることを示唆しています。政府の事業を大幅に強化できるAIに防衛予算の一部を割り当てることは賢明と見なされている一方で、政府はこれらのAIモデルの国家的価値と安全保障目標を綿密に監視するよう促されています。

Source: 五角形はAI、倫理TBDに賭けています

  OpenAI は、スケジュールされたアクションのために ChatGPT にタスク ベータ版を追加します