Google は、ユーザーのテクノロジーとの対話能力を強化する洗練された AI モデルである Gemini 2 を発表しました。プレスイベントで行われたこの発表は、タスク実行、会話能力、マルチモーダル理解における Gemini 2 の機能を強調しており、AI テクノロジーの大幅な進歩を表しています。
Google が Gemini 2 を発表: AI アシスタントの新時代
Google DeepMind の CEO、Demis Hassabis 氏は、Gemini 2 は「ユーザーのコンピュータと Web 上でタスクを計画および実行」できる仮想アシスタントとして機能すると述べました。このモデルは、ユーザーがさまざまなアクティビティをシームレスに管理できるようにすることを目的としており、人間のような認知機能を模倣することで汎用人工知能 (AGI) への道を開く可能性があります。 Googleの最高経営責任者(CEO)サンダー・ピチャイ氏は、世界をより効果的に理解し行動できる「エージェントモデル」の開発に同社が取り組んでいることを強調し、過去1年間に多大な投資が行われたことを示した。
Gemini 2 には、改良された「マルチモーダル」機能が含まれており、AI が高度な会話を行いながら音声とビデオをより効果的に解析できるようになります。これらの機能を実証することで、Gemini 2 はパーソナル コンピューティングの動作方法を再定義し、航空券の予約や文書の管理などの自動タスクを通じて時間を節約できる可能性があります。ただし、オープンエンドのコマンドをエラーなく処理するテクノロジーの能力に関しては課題が残されており、損害の大きいミスにつながる可能性があります。
コーディングとデータ サイエンスに特化した AI エージェントも Gemini 2 のツールボックスの一部であり、ユーザーは以前のモデルの機能を超えた複雑なプログラミング タスクに取り組むことができます。基本的なコード補完に焦点を当てた一般的な AI ツールとは異なり、これらのエージェントは、コードをリポジトリにチェックインしたり、データ分析を促進したりするなど、包括的なタスクを実行できます。
Project Mariner: Web ナビゲーションへの新しいアプローチ
Gemini 2 の機能を紹介するために、Google は、ユーザーの Web ナビゲーションを支援する実験的な Chrome 拡張機能である Project Mariner を導入しました。最近のデモンストレーションでは、AI エージェントは食事を計画する任務を負っており、自律的にスーパーマーケットのウェブサイトに移動してログインし、買い物かごに商品を追加し、特定の商品が入手できない場合には代替品を提案することもありました。ハサビス氏はマリナーについて、日常業務を対象としたユーザーとAIのインタラクションを再考する研究プロトタイプだと説明した。
Gemini は当初、AI 支援エクスペリエンスにおける有用性で高い評価を得た OpenAI の ChatGPT に対抗する Google の戦略の一環として 2023 年 12 月に発売されました。 Gemini 2 の導入により、Google は自社のモデルを OpenAI の製品と同等の機能を備えていると位置づけ、AI 主導の機能を通じて検索エクスペリエンスを強化することを目指しています。
Googleはまた、Gemini 2がスマートフォンのカメラを介してユーザーの周囲を解釈できるようにする実験的取り組みであるProject Astraの最新バージョンを明らかにした。テスト中、Gemini 2 はワインボトルを認識するスキルを発揮し、Web から取得した地理情報、価格、味の特徴を提供しました。 Hassabis 氏は、Astra がさまざまなドメイン間の関心を結び付けてユーザー エクスペリエンスを向上できる、究極のレコメンデーション システムに進化したいという願望を表明しました。
Gemini 2 内のメモリに重点を置くことで、AI がユーザーの好みに関する洞察を保持できるようになり、Google はユーザーが削除機能を含むデータを管理できることを保証します。 Astra でのテスト中、AI は中断に応答しながら会話のコンテキストを維持することで、優れた適応性を示しました。
AIエージェントの安全性と信頼性
Gemini 2の機能が拡張されるにつれ、Googleは安全性と信頼性を確保することの重要性を強調している。エージェントは期待を示していますが、潜在的なリスクは、ユーザーがシステムとエージェントが提供するデータをどのように操作するかに起因します。 Project Mariner には、機密性の高いアクションを実行する前にユーザーの確認を求めるプロンプトが組み込まれており、それによって不正なトランザクションから保護されます。
Google は、社内および社外の専門家と協力して AI の使用に関連するリスクを評価することで、安全性の懸念に積極的に取り組んできました。これには、悪意のあるプロンプトや指示によるプラットフォームの悪用を防止し、それによって詐欺やフィッシング攻撃などの潜在的な脅威からユーザーを保護するための対策を検討することが含まれます。
Google の Gemini 2 のリリースは、同社がユーザー エクスペリエンスとフィードバックを追跡し続けているため、AI の進歩において極めて重要な瞬間を迎えています。 AGI への取り組みは開発フェーズごとに徐々に展開され、将来のテクノロジーの反復に影響を与える可能性のある進行中の研究に焦点が当てられています。ユーザーのインタラクションと反応に関する調査が続く中、Gemini 2 とその関連プロジェクトの次のステップが注意深く監視されているようです。
画像クレジット: Google
Google の Gemini 2.0 の投稿はこちらです: マルチモーダルで強力な機能 最初に TechBriefly に登場しました。
Source: Google の Gemini 2.0 が登場: マルチモーダルで強力