Laboro

Laboro.AIコラム

生成AIが作り出す音楽は「ファーストフード」で終わるのか

2024.5.5
監 修
株式会社Laboro.AI 執行役員 マーケティング部長 和田 崇

概 要

SunoやUdioといったAI音楽スタートアップが注目を集める中で、AIを用いて音楽を生成することへの逆風が強まっています。

今年6月24日、ソニーミュージック、ワーナーミュージック、ユニバーサル ミュージックは、SunoとUdioに対し、トレーニングデータを許可なく使用し、AIモデルが本物の人間の音声録音品質を模倣した曲を生成できるようにしたとして、著作権侵害の訴訟を起こしました。

一方で、この音楽生成AIの著作権問題に対策済みの、倫理的に訓練された音楽生成AIも新たに登場しています。倫理面に関しては、そもそも従来の音楽業界のあり方に懐疑的な声もあり、テクノロジーによって間口が広がる中で、ミュージシャンやクリエイターにとっての透明性を追求した著作権管理サービスも広まっています。

今回は、最新のテクノロジーが音楽業界に与えている影響に注目し、音楽制作の未来について考えていきたいと思います。

目 次

音楽生成AIに吹き荒れる逆風
 ・開発に使われたトレーニングデータ
 ・もはや生成ではなく、模倣である
倫理的な音楽生成AIの登場
 ・著作権にかからない、トレーニングデータ
 ・限られたトレーニングデータでできること
音楽テクノロジーとファン心理
 ・機械の歌声に感動する
反倫理的な面を持つ音楽業界
 ・終わりと始まり
 ・倫理と透明性が広まるインディーズ
 ・ロイヤルティを「死角」から露す
AI音楽でチャンスを増やすために
 ・「タップしてプレイする」のが人ではない
 ・環境問題のように音楽にも取り組む
 ・どんな音楽も「きれいさ」は普遍的

音楽生成AIに吹き荒れる逆風

開発に使われたトレーニングデータ

飛躍的な進歩を遂げた音楽生成AIが、激しい論争の的となっています。その渦中にある音楽生成AIの一つで、今年1億2,500万ドル(約200 億円)の資金を調達した音楽生成AIの「Suno」は、簡単なプロンプトだけで、歌詞付きの完成された曲を作成し、それを人間的な声で歌わせることができる音楽生成システムです。

いわば音楽版ChatGPTで、例えば「カピバラの歌を作って」と指示すれば、一瞬でカピバラの歌ができ上がります。ちなみに、カピバラの歌は実際にSunoで生成された人気ソングに挙げられていたものです。

こうした音楽生成AIに非難の声が高まっているのは、たとえミュージシャンの名前をそのまま入力することはできない仕様になっているとはいえ、プロンプトを一工夫するだけで過去のヒット曲を思い起こさせるような曲を作り出すことができるためです。

Sunoのトレーニングデータにはオンラインで公開されているさまざまな音楽や音声が含まれているそうですが、確認されている既存の楽曲との類似例を聞けば著作権がすでに所有されている楽曲がトレーニングデータに含まれていることはほぼ明らかです。Sunoの初期投資家の一人が語った次のような言葉はその深刻さを物語っています。

正直言うと、もしこの会社がスタートしたときにレーベルと契約を結んでいたら、おそらく投資しなかったでしょう。制約を設けずにこの製品を作る必要があったと思います。

もはや生成ではなく、模倣である

これを見過ごすことはできない音楽業界では、まずソニーミュージックが今年5月、700社以上のAI開発企業やストリーミングサービス企業に対してオプトアウト書簡を送り、自社の音楽をAI開発のトレーニングデータに使用しないよう警告しました

続いて今年6月、ソニーミュージック、ワーナーミュージック、ユニバーサル ミュージックは、SunoとUdioが、想像を絶する規模で著作権保護された音楽を許可なくトレーニングデータに使用し、AIモデルが本物の人間の音声録音品質を模倣した曲を出力できるようにしたとして訴訟を起こしました

さらにアメリカでは、多くのミュージシャンを輩出してきたテネシー州が「エルヴィス法」というAI 音楽に関する法律を制定し、AIによる音声や作品の類似物の制作・流通を禁止する初めての州となりました

こうした音楽生成AIに対する危機感や批判が高まる中で、ついに倫理的に訓練された人工知能を搭載した新しい音楽生成AIも発表されることとなります。

倫理的な音楽生成AIの登場

著作権にかからない、トレーニングデータ

透明性や倫理性を重視した音楽生成AI「Jen」は、テキストプロンプトから音楽を生成するAIシステムで、歌や歌詞をつけることは現時点ではできません。

初期トレーニング セットには完全にライセンスされた40以上のカタログが含まれており、すべての出力において、アーティストと業界の著作権基準の両方を尊重することが保証されているそうです

Jenでは、1億5,000 万ものトラックが含まれるデータベースを使用して、トレーニングデータも、生成された楽曲も、オーディオ認識と著作権識別に関して自動的にチェックされます。

さらに、生成されたトラックはルート・ネットワーク・ブロックチェーンに記録され、利用者が作成したトラックを所有し、録音して販売可能にすることができるよう準備されているそうです

Jen共同創業者のシャラ・センダーロフ氏はかつてブロックチェーンのベンチャーファンド兼スタジオを設立した経緯もあり、そうした経験がこの音楽生成AIのサービスに集約されているのかもしれません。

限られたトレーニングデータでできること

それでは、著作権が固く保護されている楽曲以外から学んだであろう ”倫理的な” この音楽生成AIがつくる曲は、一体どのような曲なのでしょうか。

実際にWiredに掲載されていたプロのミュージシャンの感想によると、システムのデータ不足なのか「シティ・ポップ」などの指示がうまく通じず、生成された曲をクールだと感じる瞬間はなく、サウンドがクリーンすぎる、というようなコメントが見受けられました。

おそらく現段階では、人を楽しませたり癒したりする域には及ばないものの、コスト重視の低予算の広告などにはすぐにでも使われるようなレベルなのでしょう。今後、トレーニングデータに関するライセンス取得が広範囲に進展すれば、人の心を揺さぶるような曲も徐々に生み出せるようになっていくのかもしれません。

音楽テクノロジーとファン心理

機械の歌声に感動する

音楽とAIに関しては音楽生成AIが広まる以前に、2023 年にもビートルズの新曲「ナウ・アンド・ゼン (Now And Then)」が議論を呼びました。古いデモ音源からジョン・レノンの声をAIで分離して楽曲が作成され、その完成度の高さからAIによる音声再現は人間の声にとって代わる脅威だとする見方が出てきたためです。

ところが蓋を開けてみれば、YouTubeで公開されたこの楽曲のミュージックビデオは今年7月時点で126万いいねを獲得し、コメント欄はファンからの熱いメッセージで埋め尽くされています

機械的な歌声、いわゆるボーカロイドについても、日本では初音ミクをはじめとするバーチャルシンガーがすでに広く受け入れられており、「感情のない声が深いことを歌うから面白い」というような若者の声も聞かれます。

さらに、デジタル化によってオートチューンの効果で完璧な音に聴こえるようにされてきましたし、人気アーティストがコンサートで事前録音され調整された自身のバッキングトラックに合わせて歌っていたりと、デジタル技術はだいぶ前から音楽に深く入り込んでいます。

反倫理的な面を持つ音楽業界

終わりと始まり

テクノロジーは私たちの想像をはるかに超えて音楽の中に溶け込んできたにもかかわらず、音楽生成AIの登場に「音楽はついに終わりだ」といったコメントを見かけます。しかしながら、人々が掲げるAI音楽への非難は、以前から苦境に立たされ続けてきた多くのミュージシャンやクリエイターにとって、音楽業界がどうあるべきかを再構築する上でも、音楽ビジネスに一石を投じたともいえそうです。

SunoとUdioを訴えた世界の三大メジャーレーベル、ソニーミュージック、ワーナーミュージック、ユニバーサルミュージックは音楽市場の70%近くのシェアを占めています。そして、これら企業が大きな力を持つようになったビジネスのあり方そのものが、反倫理的な面を持っているという意見があることも事実です。

従来の音楽業界では、大企業 VS 個人という図式で多くのミュージシャンが不利とも言える契約を結ばざるを得ないこともあったり、昨今のデジタル化による楽曲の流通の複雑さから、どこでどのように利益が生まれているのかが不透明だったりといった問題が指摘されています

倫理と透明性が広まるインディーズ

大企業的なビジネスモデルとは打って変わって、デジタル化はまた、音楽に携わる個人にとってSpotifyなどの自由な楽曲発表の場を設け、ソーシャルメディアによって楽曲制作はこれまで以上に共同作業が可能になり、1 つのトラックのクレジットに何十人ものライターが登場するという新たな流れを生み出してきました

SoundCloudなどのプラットフォームも人気を呼んでインディーズ市場は活気を帯び、ミュージシャンやクリエイターへの倫理的な著作権管理サービスを提供する企業が注目されています。

収益を最大化させることよりも透明性を選んだこうした企業の一つであるKobaltは、ミュージシャンやクリエイターに選ばれることによって黒字化を実現し、現在アメリカとイギリスでトップ100位以内の楽曲およびアルバムの40%に関わるほどに成長しているそうです

ロイヤルティを「死角」から露す

KobaltのCEO、ローラン・ユベール氏は、次のように語ります

ロイヤルティ徴収の流れは、ソングライターや権利者にとって大きな死角となっています。そのデータをアンロックすると、新進気鋭のソングライターから世界最大のアーティストにまで、衝撃を与える可能性があります。

新しいテクノロジーによって生まれた新たな動きが、メジャーレーベルの築き上げた立場さえも揺るがしつつあります。

AI音楽でチャンスを増やすために

「タップしてプレイする」のが人ではない

音楽生成AIは、その生成の速さや簡単さを揶揄して「ファーストフード」と例えられたりもします。しかし、バークリー音楽大学のベン・キャンプ教授はインタビューの中で、音楽生成AIを別物としたりなかったことにしたりするよりも、その倫理的使用について積極的に教えることの重要性を強調しています。

そして、テクノロジーがどれほど進化しようが人は人とつながり、音楽には人が集まり、そのような文化をつくれるのは人なのだとして、人はただ「タップしてプレイする」だけの存在ではないと述べます

人がAIで音楽を生成するとき、ただタップしてプレイするのではなく、AIと音楽を共同制作する体験になることをAI開発者も目指しています。前出の音楽生成AI、Jenの開発においても、開発したモデルがユーザーの芸術的想像力や嗜好を生成プロセスに組み込むのには柔軟性が欠けていることから、それを修正するためのアプローチの詳細が論文に発表されています。

その中では、ユーザーとAIが対話するようにして協力し合うことの重要性とともに、人とAIの音楽的な役割が次のように示されていました。

(人間の)自由な即興と( AIの)全体的な構造の一貫性のバランスをとり、両方の長所を組み合わせて音楽生成を次のレベルに引き上げる

環境問題のように音楽にも取り組む

AI音楽の市場規模は、今後5年間で10倍以上に成長し、2028年までに30億ドル(約 4,822 億円)の収益が見込まれていますが、同時に音楽クリエイターの27%が音楽生成AIによって収益を失うリスクにさらされ、このままいけばリスクが機会を上回ると予測されてもいます

それを覆し、チャンスがリスクを上回るようにするために必要なことは、法整備なども含めて倫理的で透明性あるシステムをつくり、音楽業界における変化を促進することはもちろん必要です。ただそれだけではなく、自然の価値を見直してプラスチック消費を減らすことと同じように、テクノロジーとの融合も含めた新たな音楽の在り方を、ファーストフードとしてではなく、その可能性や素晴らしさを再認識して守っていく意識を高める教育も必要になるのでしょう

どんな音楽も「きれいさ」は普遍的

例えば選挙演説と比較しても、いい音楽が呼び寄せる人の数は桁違いで、音楽が人を動かす力は偉大です。小澤征爾氏が、「沈む夕日のようにきれいさが違わないということが音楽じゃないか」という言葉を残したように、誰が見ても、どんなに疲れていても、よい音楽がよい音楽であることには変わりありません。テクノロジーが使われていてもいなくても、私たちの心はよい音楽に引き寄せられ続けていくものなのではないでしょうか。