によると Android Authority、Gemini Androidアプリケーションの最新のベータ版、特にGoogle App Betaのバージョン16.30.59.sa.arm64は、チャットでのオーディオファイル添付ファイルの今後のサポートを示しています。ユーザーは、MP3などのオーディオファイルをアプリ内での会話に添付するオプションを観察できるようになりました。
オーディオファイルを添付すると、新しいプロンプト、「これについてLive Live」が表示されます。ただし、この有望な提案にもかかわらず、オーディオ処理機能はまだ完全に動作していません。オーディオファイルがアップロードされると、Geminiは現在、意味のある方法でコンテンツを理解または応答するのに苦労しています。場合によっては、アプリケーションは添付のオーディオファイルを完全に無視しますが、他のものでは、自信を持っているが製造された情報を提供する場合があります。これは、オーディオファイルやgemini専用のチャットボット幻覚として知られる現象です。
現在の制限にもかかわらず、オーディオファイルサポートの統合は、開発者側のGeminiの既存の機能と一致しています。 Gemini APIはすでにオーディオ入力をサポートしており、開発者がオーディオをフィードし、コンテンツの説明、要約、または転写を要求できるようにしています。 APIは、「2:30から3:29」などのタイムスタンプ固有のリクエストを処理することもでき、MP3、WAV、FLACなどのさまざまなオーディオ形式と互換性があります。
これは、GoogleがAndroidアプリケーション用の同様の堅牢なオーディオ処理機能を開発している可能性が高いことを示唆しています。現在の実装は完成した製品ではなくプレースホルダーのように見えますが、特にGeminiアプリ内で画像のアップロードがすでに広く利用可能であることを考えると、オーディオサポートへの移行は論理的な進行と見なされます。この機能を完全に発売するための公式タイムラインはありません。
Source: Gemini Androidを使用すると、ユーザーがオーディオファイルをアップロードできるようになりました







