GoogleのGemini AIアシスタントは、オーディオファイルのアップロードをサポートし、ユーザーが録音から重要な情報を転写、要約、抽出できるようにするようになりました。この新機能は、最大10分間の音声メモ、会議、講義、インタビューを検索可能なドキュメントに変換します。オーディオアップロード機能は、Webとモバイルアプリの両方で利用でき、標準のファイルアプロードインターフェイスからアクセスできます。 GeminiのGoogleのVP、Josh Woodwardによると、オーディオファイルのアップロード機能はユーザーが最も要求していました。この機能は、リアルタイムの音声コマンドに焦点を当てたGemini Liveとは異なりますが、新機能はアップロードされたオーディオファイルからデータを処理するように設計されています。テスト中、Geminiはコメディアルバムや電話での会話からスケッチを正確に転写しました。名前の認識に関連するわずかなエラーのみがあります。また、AIは、To Doリストの作成に適した重要な要素とアイテムを効果的に特定しました。オーディオ処理の追加は、アプリの統合、カードベースの視覚インターフェイス、拡張されたパーソナライズオプションなど、最近のGeminiの改善と一致しています。この機能により、ユーザーは保存されたオーディオログとメモを検索可能なコンテンツに変換し、以前は外部転写ソフトウェアを必要としていたプロセスを合理化できます。 ChatGPT(Whisperを使用)、AnthropicのClaude、Prplexityなどの他のAIアシスタントもオーディオ処理機能を提供しますが、Geminiの実装は日常のユースケースに向けられています。ユーザーは、ジェミニを活用して、言語を簡素化し、スピーカー固有のコメントを分離し、質問を生成し、オーディオコンテンツから学習ガイドを作成できます。ただし、フリー層ユーザーの10分間のオーディオ制限と毎日の使用キャップは、使用頻度を制限する場合があります。 Googleは現在、通常のGeminiクォータに該当するため、大量のオーディオ処理の正式な価格設定をまだリリースしていません。広範なオーディオコンテンツの処理を計画しているユーザーは、それに応じて使用を管理する必要があります。本質的に、Geminiの新しいオーディオ機能は、オーディオファイルから貴重な情報を処理および抽出するための合理化された方法を提供し、さまざまな個人的および専門的なアプリケーションに役立つツールになります。

Google Geminiは、オーディオファイルのアップロードをサポートするようになりました
Written by
Starting with coding on Commodore 64 in elementary school moving to web programming in his teenage years, Aytun has been around technology for over 30 years, and he has been a tech journalist for over 20 years now. He worked in many major Turkish outlets (newspapers, magazines, TV channels and websites) and managed some. Besides journalism, he worked as a copywriter and PR manager (for Lenovo, HP and many international brands ) in agencies. He founded his agency, Linkmedya in 2019 to execute his way of producing content. He is recently interested in AI, automation and MarTech.
View all posts →Related Stories
ブルー・オリジンとNASAがニュー・グレン発射台の修理スケジュールをめぐり衝突
この異常は、アマゾンのインターネット衛星48機を地球低軌道に運ぶ定期便の定期的なホットファイアテスト中に、発射施設36で発生した。
ASUS、Computex で新しい Zenbook および ExpertBook ラップトップを発表
刷新された 14 インチ モデルは、Windows 11 の各バージョンにわたって、Intel Core Ultra 9、AMD Ryzen AI 9、Snapdragon X1 構成から選択できるのが特徴です。
未発表のPixel Watch 5がカリブ海でダイバーによって発見されたと報じられている
ランディ・ピッチフォードさんは、友人がカリブ海でスキューバダイビング中に未発表の Google Pixel Watch 5 を発見したと主張し、オンラインでの好奇心を刺激しました。
Spotifyはユーザーにユーザー名の編集とプロフィールのプロフィールの追加を許可する可能性がある
Spotifyはまもなくユーザーがユーザー名を編集したり、プロフィールのプロフィールを追加したりできるようになる可能性があり、音楽ストリーミングプラットフォームの待望の社会的見直しを示唆している。



