Googleは、ユーザーの携帯電話上でAIモデルを直接実行することでオフラインで動作する、「Google AI Edge Eloquent」と呼ばれる新しいAIディクテーションアプリをリリースした。このアプリは音声を文字に起こし、つなぎ言葉を削除し、データをクラウドに転送せずに書式設定されたテキストを生成します。

このアプリは現在 iOS でのみ利用可能ですが、Android バージョンもこれに続く可能性があります。 Google AI Edge Eloquent は、ユーザー データがデバイス上に残るようにしながら、洗練されていない音声をクリーン テキストに変換するように設計されています。

このアプリを使用すると、ユーザーはリアルタイムの音声文字起こしとエラー修正用の AI モデルをダウンロードできます。さらに、音声を「キーポイント」、「フォーマル」、「短い」、「長い」などのさまざまな形式に変換するオプションも提供します。

オンデバイス モードではすべてのデータがオフラインで処理されますが、クラウド オプションでは、Google の Gemini サービスを通じてテキスト クリーンアップを強化できます。ユーザーは、カスタム辞書を作成したり、Gmail から用語をインポートしたりして、アプリの語彙をカスタマイズして認識精度を向上させることができます。

機能には、単語数と速度の追跡、過去の録音の検索などがあります。 iOS のキーボード統合は間もなく実装され、ユーザー エクスペリエンスが向上する予定です。 Google AI Edge Eloquent は、オフライン AI 市場で Wispr Flow や SuperWhisper などのアプリと競合しています。

Apple App Store のアプリに関する以前の説明には、Android デバイスのサポートの可能性への言及が記載されており、そのプラットフォームでの今後のリリースへの期待が高まっています。

「このアプリにより、Google は Wispr Flow や SuperWhisper のようなアプリと直接対決することになる」と担当者は述べた。彼らは、オフライン処理とクラウドで強化されたテキスト クリーンアップの組み合わせがディクテーション テクノロジの大幅な進歩を表すことを強調しました。


注目の画像のクレジット

  Google 広告アドバイザーにプロアクティブなエージェントの安全機能が追加