Apple は、最新の研究成果である ReaLM (Reference Resolution As Language Modeling) によって大きな進歩を遂げています。 このイノベーションは、Siri を単なる画像認識を超えた理解の領域に押し上げることを約束し、音声アシスタントとの対話方法に革命を起こす可能性があります。
ネタバレ注意: Apple のベンチマーク テストによると、すでに GPT-4 を上回っています。
| モデル | コンバージョン | シンセサイザー | 画面 | 見えない |
|---|---|---|---|---|
| マーズ | 92.1 | 99.4 | 83.5 | 84.5 |
| GPT-3.5 | 84.1 | 34.2 | 74.1 | 67.5 |
| GPT-4 | 97.0 | 58.7 | 90.1 | 98.4 |
| リアルム-80M | 96.7 | 99.5 | 88.9 | 99.3 |
| REALM-250M | 97.8 | 99.8 | 90.6 | 97.2 |
| ReALM-1B | 97.9 | 99.7 | 91.4 | 94.8 |
| ReALM-3B | 97.9 | 99.8 | 93.0 | 97.8 |
Apple の RealLM: Siri のインテリジェンスに革命を起こす
論文によると、Apple の RealLM は Siri にスーパー頭脳を与えたようなものです。 これにより、Siri はユーザーの発言をより賢明な方法で理解できるようになります。 それについての初期の印象は次のとおりです。
- 画面を見ると、次のようになります。 RealM は、テキストや画像などの画面上の内容をチェックして、サポートが必要な内容を理解します。

- あなたの会話を聞いてください: また、Siri との会話にも注目します。 したがって、あなたが以前に何かを話した場合、Siri はそれを覚えていて、より適切にサポートしてくれるでしょう。
- あなたの周りで何が起こっているかに注目してください: RealM は、どこにでも目と耳があるようなものです。 アラームが鳴っているか、音楽が再生されているかを判断し、それに応じて応答を調整します。 以下は論文からの対話の例です。
| スピーカー | 対話 |
|---|---|
| ユーザー | 近くの薬局を教えてください。 |
| エージェント | これが私が見つけたリストです。 |
| エージェント | … (リストを提示) |
| ユーザー | (例1) レインボーロードにあるお店に電話してください。 |
| ユーザー | (例2) 一番下の子を呼び出します。 |
| ユーザー | (例 3) この番号 (画面上に表示されます) に電話します。 |
- 自分の仕事を本当に上手にこなす: Apple は、他のスマート システムに対して RealLM をテストし、それが物事を理解するのに非常に優れており、他のいくつかのシステムよりもさらに優れていることを発見しました。
- デバイス上で正しく動作します: ReaLM は、これらすべてのスマートな機能を iPhone または他の Apple デバイス上で直接実行します。 つまり、情報は非公開のままであり、すべてが非常に高速に動作します。
簡単に言うと、RealM は、ユーザーが何をしているのか、何を言っているのかをより深く理解できるようにすることで、Siri をさらに賢くします。
Apple の RealLM のリリース日はまだ発表されていません。 ただし、ReaLM の要素が iOS や macOS などの Apple ソフトウェアの将来のアップデートに統合される可能性があります。 6 月に開催される Worldwide Developers Conference (WWDC) などのイベントでさらに詳しい情報が公開される可能性があります。 アップデートに注目してください!
注目の画像クレジット: Cottonbro Studio/Pexels
Source: Apple の AI を活用した RealLM が、ついに私たちにふさわしい Siri をもたらすことができる







