研究会社 Anthropic の最新 AI 言語モデルである Claude 3 がテクノロジー業界に波紋を巻き起こしています。

Anthropic は、Claude 3 が OpenAI の ChatGPT や Google の Gemini などの業界大手と比較して優れたパフォーマンスを誇ると大胆に主張しています。

しかし、新参者はその誇大宣伝に応えられるだろうか?

Claude 3 の機能を詳しく調べて、AI の分野での位置を見てみましょう。

クロード3とは何ですか?

Claude 3 は単なる単一の AI モデルではありません。 それは彼らの家族です。

Anthropic には 3 つのバージョンがあります。

  • クロード 3 オーパス: 深い理解と高度な言語生成を必要とするタスク向けに設計された、ファミリーの強力なツール
  • クロード 3 ソネット: 主流の使用をターゲットとしており、速度と汎用性が最適化されています。
  • クロード 3 俳句:コストパフォーマンスを追求した最もコンパクトなモデル

すべてのクロード モデルには、精度の向上、コンテキストの理解の向上、チャートやグラフなどの視覚形式の処理機能など​​、共通の強みがあります。

Calude 3 の機能と価格
クロード ファミリー スイートは、Opus、Sonnet、Haiku の各モデルで構成されています (画像クレジット)

クロード 3 対競争相手

Claude 3 は ChatGPT や Gemini のようなヘビー級にどのように対抗できるのでしょうか? Anthropic は、サイト上でモデルを厳格なベンチマークに通過させました。

それらをまとめると次のようになります。

理解力と流暢さ

Anthropic は、Opus について大胆な主張をし、次のように述べています。人間に近いレベル”という理解です。

これを裏付けるために、彼らは、難しい読解テストにおいて Opus が同等のモデルを上回るベンチマーク結果を発表しました。

たとえば、RACE データセット (AI 言語理解の標準テスト) では、Claude 3 Opus は 92% の精度スコアを達成し、同様のモデルのパフォーマンスを上回りました。

これは、複雑な命令や微妙な言語に対処できる能力を意味し、現実世界のアプリケーションで優位性をもたらす可能性があります。

マルチモダリティ

Claude 3 は、従来のテキストのみの AI モデルを超えて拡張します。 テキストと画像の両方を処理できる機能により、新たな可能性が広がります。 製品画像を分析して詳細な説明を生成できる AI や、研究論文の情報を図やグラフを含めて要約できる AI を想像してみてください。

このマルチモーダル機能により、Claude ファミリは、より幅広い潜在的なアプリケーションを備えた多用途ツールとして位置付けられます。

微妙な応答

Anthropic は、そのモデルをより大胆に対応するよう取り組んでいます。 古い AI モデルは、有害なコンテンツや偏ったコンテンツの生成を懸念して、「難しい」質問を避けることがよくありました。 Anthropic は、安全性を優先しながら、クロード家族に微妙な話題に取り組んでもらうことを目指しています。

これにより、より有益で魅力的で、複雑な議論を処理できる AI が実現する可能性があります。

Calude 3 の機能と価格
人間の主張によると、Claude ファミリーは OpenAI や Google の同様のモデルと比較して優れたパフォーマンスを備えています (画像クレジット)

偏見と幻覚

欠陥のない AI モデルはないということを認識することが重要です。 たとえ改善があったとしても、クロード家は依然として「幻覚」(情報でっち上げ)を受けやすく、大規模なトレーニング データセットに埋め込まれたバイアスを反映しています。

Anthropic はこの課題を認識しており、これらの問題を最小限に抑えるための継続的な取り組みを重視しています。 これらの制限に関する透明性は、責任ある AI 開発にとって非常に重要です。

イノベーションのコスト

開発者は、Opus と Sonnet をアプリケーションに統合できます。 俳句も近々公開予定です。

  Fortnite Star Wars 2023アップデートについて知っておくべきことすべて

Claude.ai では Sonnet を無料で試すことができます。Opus は Claude Pro サブスクリプションの一部として提供されています。

Sonnet と Haiku はどちらも間もなく、Amazon Bedrock と Google Cloud の Vertex AI Model Garden を含むように拡張される予定です。

以下の表は、3 つのモデルすべての機能と価格をまとめたものです。

モデル主な特徴潜在的な使用例入力コスト ($/100 万トークン) $出力コスト (/100 万トークン)
クロード 3 オーパストップレベルの知性と流暢な言語能力タスクの自動化(複雑なアクション、コーディング)15ドル75ドル
自由形式のプロンプト、複雑なシナリオを処理します研究開発(ブレインストーミング、創薬)
人間に近いレベルの理解戦略(データ分析、予測)
クロード 3 ソネットインテリジェンスとスピードのバランスをとるデータ処理(検索・取得)3ドル15ドル
耐久性を重視した強力なパフォーマンス販売(推奨、予測)
大規模な導入に最適時間の節約 (コード生成、品質管理)
クロード 3 俳句スピードとほぼ瞬時の応答を優先します顧客とのやり取り(ライブサポート、翻訳)$0.25$1.25
簡単なクエリとリクエストを処理しますコンテンツモデレーション
インテリジェンスカテゴリーの中で最も手頃な価格コスト削減タスク (物流、知識抽出)

Claude ファミリーが本当に AI 環境に革命を起こすかどうかを判断するのはまだ時期尚早ですが、その機能が素晴らしいことは間違いありません。 Anthropic がモデルの改良を続ければ、Claude 3 は会話型 AI に期待されるものの限界を押し広げ、この分野の既存プレーヤーの優位性に挑戦する可能性があります。

AI 競争は激化しています。Claude 3 の進化は興味深いものになるでしょう。


注目の画像クレジット:人間的。

Source: クロード 3 ファミリーが Anthropic の大胆な主張とともにここに登場