Google MusicLM AI が導入されました。これは、テキストの説明があれば、あらゆるジャンルの楽曲を作成できる画期的な AI システムです。 その印象的な機能にもかかわらず、同社は慎重に過ちを犯すことを選択しており、現在、公開する予定はありません. Riffusion や Dance Diffusion などの以前の音楽用生成 AI システムは、曲を作曲する試みを行ってきましたが、技術的な制約と不十分なトレーニング データによって制限されており、その結果、複雑さと忠実度に欠ける作曲が行われていました。 しかし、Google MusicLM AI は大きな飛躍を意味し、これらの課題を克服する最初のシステムになる可能性があります。
おっと、これは私にとってChatGPTよりも大きいです。
グーグルは音楽生成をほぼ解決したと思います。 https://t.co/s9PQaJ5R6A— チェ・クヌ (@keunwoochoi) 2023 年 1 月 27 日
最初の重要なテキストから音楽への変換ツールである Google MusicLM AI をご紹介します
最近の学術論文では、280,000 時間の音楽からなる膨大なデータセットでトレーニングされた AI システムである MusicLM の開発が強調されています。 このシステムの目的は、テキストの説明に基づいて「非常に複雑」な曲を生成することでした。たとえば、「記憶に残るサックス ソロとソロ シンガーがいる魅力的なジャズ ソング」や「低音が強くキックが強い 90 年代のベルリン テクノ」などです。 Google MusicLM AI によって生成された出力は、必ずしも人間のアーティストほど想像力や音楽的に統一されているわけではありませんが、人間が作曲した音楽に驚くほど似ています。
特に作成プロセスに人間のミュージシャンや楽器奏者がいないことを考えると、Google MusicLM AI によって生成された出力がどれほど印象的であるかを表現するのは控えめな表現です. 長くて複雑な説明が提供されることもありますが、MusicLM には、楽器のリフ、メロディー ライン、感情的なアンダートーンなどの複雑な要素を構成に組み込む驚くべき能力があります。
Google MusicLM AI の機能は、単なる短い音楽の断片を生成するだけではありません。 Google の研究チームは、ハミング、歌、口笛、楽器での演奏など、既存のメロディーに基づいてシステムを構築できることを実証しました。 さらに、MusicLM には、いくつかの連続した説明を取り、数分間にわたるメロディックな物語を作成する機能があり、映画のサウンドトラックに適しています。
Google MusicLM AI の多用途性は、画像とキャプションの組み合わせによる演出だけでなく、特定のジャンル内の特定の楽器の音を模倣するオーディオの生成にも及びます。 AI「ミュージシャン」の専門知識も調整できるため、システムはさまざまな場所、時間、または特定の目的に影響された音楽を生成できます。
Google MusicLM AI の GitHub ページにアクセスして、いくつかのサンプルを聞くことができます!
Google AI音楽作曲家は本当に優れていますか?
ただし、Google MusicLM AI に問題がないわけではないことに注意することが重要です。 システムによって生成される出力の一部は、トレーニング手順の自然な結果であるバラバラな品質を示すことがあります。 合唱ハーモニーを含むボーカルを生成するシステムの能力は、期待を下回っています。 生成された歌詞は、まとまりのない英語や意味のない意味不明な言葉で構成されており、理解できないことが多く、合成されたボーカルは、単一のアーティストの洗練されたものではなく、代わりにさまざまな声のハイブリッドのように聞こえます。
Google の新しい音楽モデル MusicLM は、今週のブレークスルーです。
ここでそれが実行されます。
音楽を説明するだけで、トラックが生成されます。 pic.twitter.com/xAhzHfGnMH
— ピート (@nonmayorpete) 2023 年 1 月 27 日
その優れた機能にもかかわらず、Google の研究者は、MusicLM のようなシステムがもたらす多くの倫理的ジレンマを認めています。これには、トレーニング データから生成された曲に著作権で保護された素材が組み込まれる可能性が含まれます。 実験中に、生成された音楽の約 1% がトレーニング データセットからの曲の正確なコピーであることを発見しました。 この重複の発生率が高いため、研究者は Google MusicLM AI を現在の形式でリリースしないことを決定しました。
「ユースケースに関連するクリエイティブコンテンツの潜在的な不正使用のリスクを認識しています。 私たちは、音楽生成に関連するこれらのリスクに取り組むために、今後さらに多くの作業が必要であることを強く強調します」と論文の共著者は述べています。
MusicLM や同様のシステムが将来リリースされた場合、システムがアーティストへの支援であるかどうかにかかわらず、システムがどのように販売または位置づけられているかに関係なく、重大な法的問題が発生する可能性があります。 これは、より単純な AI システムに関してすでに生じている懸念です。 2020 年、Jay-Z のレコード レーベルは、AI を使用して Jay-Z の曲のカバーを作成したとして、YouTube チャンネルの Vocal Synthesis に対して著作権侵害の申し立てを行いました。これには、Billy Joel の「We Did n’t Start the Fire」が含まれます。 最初に動画を削除した後、YouTube は削除要求が「不完全」であると判断して、動画を元に戻しました。 AI によって生成された音楽の合法性は、依然としてグレー ゾーンのままです。
Google が MusicLM を発表: テキストから音楽を生成するモデル。 これができるクレイジーなことは次のとおりです。
1. メロディーのオーディオが与えられると、プロンプトによってカスタマイズされたそのメロディーに触発された新しい音楽を生成できます! これは、アカペラ コーラスや EDM などに変わったベラ チャオをハミングしている人です。 pic.twitter.com/HKDnXI1C8U
—bleedingedge.ai(@bleedingedgeai) 2023 年 1 月 27 日
音楽生成のための AI 技術が進歩し続ける中、その合法性をめぐる疑問は依然として最前線にあります。 Music Publishers Association の法務インターンである Eric Sunray は、MusicLM などのシステムが、著作権で保護された素材から「一貫したオーディオのタペストリー」を作成することにより、米国著作権法の下で保護されている権利を侵害していると主張するホワイトペーパーを作成しました。トレーニング。
これらの懸念は、画像、コード、テキスト生成など、他の分野の AI システムに関しても繰り返されています。AI システムのトレーニング データは、多くの場合、作成者の同意なしに Web から供給されるためです。 フェアユースの問題は、OpenAI の Jukebox のリリース後にも議論されており、AI モデルのトレーニングにおける著作権で保護された素材の使用に疑問を呈する人もいます。
Waxy の Andy Baio が意見を述べたように、AI システムによって生成された音楽は、ユーザーの観点からは二次的著作物と見なされる可能性があると推測され、その結果、元のコンポーネントにのみ著作権保護が与えられます。 この文脈で何が「オリジナリティ」を構成するのかの定義は依然として不明確であり、そのような音楽の商業的利用は未知の領域です。 ただし、生成された音楽がパロディや解説などのフェアユースの範囲内にある場合、問題はそれほど複雑ではなくなります。 それにもかかわらず、Baio は、裁判所制度が判決に達するためにはケースバイケースのアプローチを取る必要があると予測しています。
法的な状況が進化し続けるにつれて、音楽を生成する AI を取り巻く問題の明確化が差し迫っている可能性があります。 進行中のいくつかの訴訟には、アーティストの許可や認識なしに AI システムのトレーニングに作品が利用されているアーティストの権利に対処するものも含まれており、業界に影響を与える可能性があります。 これらの法的手続きの結果は、時が経てば明らかになるでしょう。
AI によって生成されたテキストを検出するための OpenAI の新しい AI Text Classifier を聞いたことがありますか?