OpenAI は、ChatGPT アドバンスド ボイス モードにより、チャットボットとのリアルな会話への道を開きます。同社では、AI と人間のようにやり取りし、人間のように会話できるようにします。現在、限られた数の Plus メンバーのみが利用できる ChatGPT アドバンスド ボイス モードを見てみましょう。
AI とのやり取りに革命をもたらすこの最先端の機能は、テクノロジー自体と同じくらい興味深い議論を巻き起こしています。やあ、ジャービス、そこにいるかい?
ChatGPT Plus ユーザーの小グループに高度な音声モードの展開を開始しています。高度な音声モードでは、より自然なリアルタイムの会話が可能になり、いつでも中断でき、ユーザーの感情を感知して反応します。 pic.twitter.com/64O94EhhXK
— オープンAI (@OpenAI) 2024年7月30日
ChatGPT 高度な音声モード: 会話以上のもの
OpenAI の最新製品は、普通の音声アシスタントではありません。ChatGPT アドバンスト ボイス モードは、人間と AI の境界を曖昧にする超リアルな音声応答を備えていると言われています。音声入力を処理するために 3 つの個別のモデルに依存していた前身とは異なり、GPT-4o (この新機能の背後にあるエンジン) は、マルチモーダル タスクをすべて 1 つにまとめることができます。音声からテキストへの変換、プロンプト処理、テキストから音声への出力をすべて 1 回で処理できるマシンを想像してみてください。ロボットと会話していることを忘れてしまうような流暢な会話は、そう遠くない未来に実現します。
でも、待ってください。それだけではありません。この AI チャットボックスは、感情的なイントネーションを検出できると主張しています。悲しい気持ちなのか、興奮しているのかがわかります。カラオケ セッションに参加することもできますが、著作権で保護された曲を歌うことは期待しないでください。まず、ChatGPT の高度な音声モードの使い方を見てみましょう。

ChatGPT 高度な音声モードの使い方
指を休めて声帯を鍛える準備はできましたか?OpenAIの最新作でチャットを始める方法をご紹介します。ChatGPTアドバンスドボイスモードは現在、限られた人数で利用可能です。 ChatGPT Plus ユーザー (すべての Plus メンバーがアクセスできるわけではありません)ただし、あなたがその中にいる場合に限ります:
- アプリを更新する: まず、ChatGPT アプリの最新バージョンを実行していることを確認してください。Android ユーザーの場合、バージョン 1.2024.206 以上です。iOS ユーザーの場合、バージョン 1.2024.205 以上が必要で、デバイスは iOS 16.4 以上を実行している必要があります。この未来的なパーティーでは、古いテクノロジーは許可されません。
- 自分の声を見つける: すべて更新したら、画面の右下隅に隠れている音声アイコンを探します。タップするだけで準備完了です。
- 戦闘機を選択してください: 標準の音声モードと、新しい高度な音声モードのどちらかを選択できます。「高度」を選択すると、GPT-4o のパワーをフルに発揮できます。
- 声を上げて: マイクはデフォルトでオンになっていますが、サイレント状態になっている場合は、画面の左下にあるマイクのアイコンを確認してください。必要に応じてタップして切り替えてください。
- チャットで気軽に: 人間の友達と話すのと同じくらい自然に、AI の友達と話し始めましょう。AI はあなたの感情を理解できるので、あなたの個性を遠慮なく発揮してください。
- 急いでください新しい AI スピーカーに影響を与え終わったら(または影響を受け終わったら)、右下の赤いアイコンを押して会話を終了します。
プロのヒント: 最高の体験をするには、ヘッドフォンを装着してください。iPhoneユーザーは、 音声分離 不要な中断を避けるためにマイク モードをオンにしてください。結局のところ、AI アシスタントと心から話そうとするときに 3 人だと混雑してしまいます。
この機能はまだアルファ段階なので、多少の不具合があるかもしれないことを覚えておいてください。でも、人間だって 100% 完璧な会話ができるわけではありませんよね?

スカーレット・ヨハンソン: 物議を醸す声
OpenAIは新しい音声機能ChatGPT Advanced Voice Modeの高度な機能を自慢しているが、リリースまでの道のりは困難だった。5月に行われた驚愕のデモを覚えていますか?その音声の1つであるSkyは、 ハリウッドスター。
映画「her」のAIアシスタント役でも知られるスカーレット・ヨハンソンは、OpenAIのCEOサム・アルトマンから声の使用を何度も求められたが断ったと報じられている。ヨハンソンは、自分の声に疑わしいほど似ている声を使ったデモが公開されたとき、いわゆる「人工知能」をいち早く支持した。OpenAIは彼女の声の使用を否定したが、すぐに物議を醸したサンプルをプログラムから削除した。

安全第一、若手スターは二の次
OpenAI は論争を受けてリリースを中止し、時間をかけてセキュリティ対策を強化しました。同社は、45 の言語を話す 100 人以上の外部レッドチーム メンバーで GPT-4o をテストしたと主張しています。その結果、有料の声優と協力して、Juniper、Breeze、Cove、Ember の 4 つのプリセット音声を備えた、より安全なシステムが作られました。
OpenAI の広報担当者 Lindsay McCallum 氏は、ChatGPT は「個人や著名人などの他人の声を真似ることはできないし、プリセットされた声と異なる出力はブロックする」と断言している。つまり、仮想のスカーレット・ヨハンソンとチャットしたいと思っていたら、残念ながらそれは叶わない。
OpenAIはChatGPTアドバンスドボイスモードを徐々に展開し、 すべてプラスこの秋にユーザーテクノロジー業界は息を詰めて見守っています。これは私たち全員が待ち望んでいた会話型 AI になるのでしょうか、それとも AI 倫理と著作権問題に関する進行中の議論に新たな問題を引き起こすことになるのでしょうか。
注目の画像クレジット: X / OpenAI 編集: Furkan Demirkaya
Source: ChatGPT高度な音声モード:スカーレットに声を忘れさせる








