自然なサウンドの ChatGPT 出力を作成するにはどうすればよいでしょうか?

ChatGPT は強力な言語モデルであり、非常に人間らしいテキストを生成できます。

ただし、これらの応答が音声合成 (TTS) を使用して読み上げられると、人工的またはロボット的な性質が現れることがあります。

驚くほど自然な音声出力を目指すなら、ミックスにスパイスを加えましょう。本物のスピーチの雰囲気を得るテクニックを見てみましょう。

ChatGPT 出力を改善する方法

日常会話では、完璧に形成された文法的に正しい文で話す人はほとんどいません。私たちは「えーっと」「えーっと」「いいね」「あのね」などのつなぎ言葉を使います。これらは言葉の混乱のように見えるかもしれませんが、実際には自然な発話において重要な機能を果たします。

ChatGPT の音声機能にこれらのフィラーを戦略的に応答に含めるように指示できます。こうすることで、より会話的に聞こえるようになります。

以下に例を示します。

TTS システムは、これらのつなぎ言葉を休止やためらいに変換し、出力をより有機的に感じさせます。試してみて、希望のスタイルに適したレベルを見つけてください。

元の応答は次のとおりです。

調整されたプロンプトを含む応答は次のとおりです。

それに加えて、人々は日常会話で自然に短縮形を使用します。「できない」は「できない」、「ある」は「ある」などになります。これらにより、音声の流れがよりスムーズになり、会話しているように感じられます。 ChatGPT に短縮語を使用して「人間らしい」音声パターンを追加するように奨励できます。

実際の人間の音声にはトーンの変化があります。私たちはピッチ、音量、速度の変化を利用して言葉を強調したり、感情を加えたりします。ターゲットを絞った句読点が TTS をガイドできる場所は次のとおりです。

他のスキルと同様、ChatGPT の音声出力をより自然にするには練習が必要です。テクニックのさまざまな組み合わせを試してください。お気に入りのポッドキャストやオーディオブックに注目して、プロのスピーカーが声の抑揚やつなぎ言葉をどのように効果的に使用しているかを確認してください。

これを行う唯一の「正しい」方法はないことに注意してください。

TTS システムの品質も大きな役割を果たします。句読点を解釈して実際の発音に近づけるのが他の人よりも得意な人もいます。

一般的なオプションには次のようなものがあります。

自然な響きの ChatGPT 出力は多くの場合優れていますが、より正式な、または「ロボット的」配信が適切な場合もあります。次のシナリオについて考えてみましょう。

重要なのは、望む結果に最適なものを見つけることです。

注目の画像クレジット: ジェイソン・レオン/アンスプラッシュ

Source: 自然なサウンドの ChatGPT 出力を作成するにはどうすればよいでしょうか?