Microsoft Copilot の新機能により、画面を解釈して質問に対する回答を共有できるようになります。簡単なタスクに加えて、Microsoft Copilot が処理できる複雑さには制限がありません。同時に、難しい方程式を解決したり、家庭用製品を閲覧したりすることで、日常のエクスペリエンスを向上させることができます。
Copilot Vision のリリースにより、AI が画面上のコンテンツをレビューできるようになります。この機能では、アクセスした Web サイトからの情報も分析できます。家を飾ったり、プロジェクト管理で新しいタスクに取り組んだりするとき、Copilot は信頼できるデジタル ヘルパーとして機能します。
Copilot Vision は画面を読み取る機能です
Microsoft の最新機能は Copilot Vision で、表示上の視覚要素を解釈して即座に操作します。以前の画面読み上げデバイスとは異なり、Copilot Vision は画像とテキストを操作して、Web の閲覧をよりスムーズにします。レシピを閲覧したり、写真の詳細を調べたりするときに、正しい質問をすればすぐに答えを得ることができます。
この機能は応答に限定されません。一般的に使用されているスクリーン リーダーよりも受動的ではないコミュニケーション エクスペリエンスを作成する方法を提案します。 Copilot Vision では、個人情報が今後使用されないように、各チャット後にデータをすぐに消去できるようになっており、マイクロソフトはプライバシーを確実に尊重します。これは、Copilot を安心して使用するための重要な開発です。
Copilot Vision を使用できるのは米国内のユーザーのみであり、一定の制限があります。ペイウォールやプライベート コンテンツのある特定の Web サイトでは動作できません。それにもかかわらず、公開データを解釈するスキルは関心を集めており、Microsoft はこの機能の拡張を期待しています。
より複雑な問題を解決する より深く考える
このアップデートには、より困難な質問の解決に焦点を当てた、もう 1 つの重要な機能である Think Deeper が含まれています。 Microsoft Copilot は、オプションを比較したり数学の問題を解決したりする際の視点に関係なく、包括的なアプローチを提供します。通常、迅速な回答を提供するツールとは異なり、Think Deeper は問題を注意深く調査します。
Microsoft によると、この機能は高度な推論モデルに依存して、より明確な応答を提供します。この機能は、 私たち、、 イギリス、、 カナダ、 そして ニュージーランド ユーザーはその進歩を体験できます。ただし、Microsoft はこれらの推論モデルの詳細についてはやや曖昧なままで、単に「OpenAI の最新モデル」と呼んでいます。
Microsoft が Copilot Voice で発言権を獲得
Microsoft は、問題解決能力と画面読み上げ能力に加えて、Copilot Voice による会話を導入しました。この機能を使用すると、Microsoft Copilot と対話して回答を得ることができます。 Copilot Voice は 4 つの合成音声を利用することで、ユーザーの会話の好みに合わせた方法で対話できます。
ニュージーランド、米国、英国、カナダ、オーストラリアの人々がこのサービスに申し込むことができます。ただし、利用できるかどうかは、所属するサブスクリプション カテゴリに関連付けられた時間制限の対象となります。 Copilot Pro ユーザーは、需要に応じて追加の時間を受け取ります。この音声ツールは効率を高めますが、制限を防ぐために時間の使用状況を監視する必要があります。
画像クレジット: マイクロソフト
Source: Microsoft Copilot は読み、考え、話すことができる AI になる