谷歌推出音乐大模型 MusicLM,只需一段文字就能让你创作出优美的音乐作品
2023-06-27 16:00
DeFi之道
2023-06-27 16:00
订阅此专栏
收藏此文章

你想成为音乐创作者吗?想拥有自己的专属音乐吗?谷歌最近发布了一款 AI 音乐大模型产品 MusicLM。由文本生成音乐(text-to-music),你只需要提供自己的想法,剩下的交给 AI,然后你就可以得到自己的音乐歌曲。

我们引入了 MusicLM,这是一种根据文本描述生成高保真音乐的模型,例如“由扭曲的吉他连复段支持的平静的小提琴旋律”。 MusicLM 将条件音乐生成过程视为分层序列到序列建模任务,它可以生成 24 kHz 的音乐。 我们的实验表明,MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。 此外,我们证明 MusicLM 可以以文本和旋律为条件,因为它可以根据文本标题中描述的风格转换口哨和哼唱的旋律。 为了支持未来的研究,我们公开发布了 MusicCaps,这是一个由 5.5k 个音乐文本对组成的数据集,其中包含由人类专家提供的丰富文本描述。——谷歌


如果你想体验 MusicLM 的音乐创作过程,现在你需要加入候选名单,然后免费体验。


1. 进入 https://labs.withgoogle.com/


2. 下拉找到 MusicLM

3. 生成你的第一首歌曲


→ 在文本字段中描述您想要生成的内容

→ AI 负责剩下的工作并创建 2 条不同的轨道

→ 点击右边的三个点,可以将音乐下载到本地


样例 1:


输入 Prompt:


Rock melodic pop that is chill, slow tempo with a build at the end(摇滚旋律流行风格,节奏缓慢,结尾有节奏)



样例 02:


输入 Prompt:


London drill beat, strong kick(伦敦 drill 风格节拍,强力踢腿节奏)



样例 03:


输入 Prompt:A jazzy piece with a smooth saxophone solo. The sound is both sophisticated and playful with a slow tempo.(一首爵士乐作品,带有流畅的萨克斯管独奏。 声音既复杂又有趣,节奏缓慢)



根据字幕生成音乐


MusicLM 的强大之处不只是在于能够从你提供的 Prompt 生成音乐,甚至还能根据字幕来生成符合情景的音乐


样例 01:


The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.

(翻译:一种街机游戏的主要配乐。 节奏快、欢快,带有朗朗上口的电吉他即兴重复节奏。 音乐重复且易于记忆,但带有意想不到的声音,例如铙钹撞击声或鼓声。)


生成结果:

样例 02:


A fusion of reggaeton and electronic dance music, with a spacey, otherworldly sound. Induces the experience of being lost in space, and the music would be designed to evoke a sense of wonder and awe, while being danceable.

(翻译:雷鬼音乐和电子舞曲的融合,带有空间感、超凡脱俗的声音。 一种感觉像是迷失在太空中的体验,这种音乐的设计旨在唤起一种惊奇和敬畏的感觉,让人想起舞。)


生成结果:



生成不同风格的一段音乐


输入 Prompt:


jazz song (0:00-0:15)

pop song (0:15-0:30)

rock song(0:30-0:45)

death metal song (0:45-1:00)

rap song (1:00-1:15)

string quartet with violins (1:15-1:30)

epic movie soundtrack with drums (1:30-1:45)

scottish folk song with traditional instruments (1:45-2:00)


(爵士乐(0:00-0:15)

流行歌曲 (0:15-0:30)

摇滚歌曲 (0:30-0:45)

死亡金属歌曲 (0:45-1:00)

说唱歌曲(1:00-1:15)

小提琴弦乐四重奏 (1:15-1:30)

史诗电影配乐与鼓 (1:30-1:45)

传统乐器演奏的苏格兰民歌(1:45-2:00))


生成结果:



AI 大语言模型将对音乐创作者带来巨大影响,不只是创作,而且还促成了 AI 歌手的新角色。最近“AI 孙燕姿”的火热就是一个很好的例子。

音乐行业的很多工作都会被 AI 所取代,但是你认为未来还需要音乐创作者吗?还需要歌手吗?

参考资料:

https://google-research.github.io/seanet/musiclm/examples/

https://twitter.com/itsPaulAi/status/1671881978420006915

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

DeFi之道
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开