我们引入了 MusicLM,这是一种根据文本描述生成高保真音乐的模型,例如“由扭曲的吉他连复段支持的平静的小提琴旋律”。 MusicLM 将条件音乐生成过程视为分层序列到序列建模任务,它可以生成 24 kHz 的音乐。 我们的实验表明,MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。 此外,我们证明 MusicLM 可以以文本和旋律为条件,因为它可以根据文本标题中描述的风格转换口哨和哼唱的旋律。 为了支持未来的研究,我们公开发布了 MusicCaps,这是一个由 5.5k 个音乐文本对组成的数据集,其中包含由人类专家提供的丰富文本描述。——谷歌
如果你想体验 MusicLM 的音乐创作过程,现在你需要加入候选名单,然后免费体验。
1. 进入 https://labs.withgoogle.com/
2. 下拉找到 MusicLM
3. 生成你的第一首歌曲
→ 在文本字段中描述您想要生成的内容
→ AI 负责剩下的工作并创建 2 条不同的轨道
→ 点击右边的三个点,可以将音乐下载到本地
样例 1:
输入 Prompt:
Rock melodic pop that is chill, slow tempo with a build at the end(摇滚旋律流行风格,节奏缓慢,结尾有节奏)
样例 02:
输入 Prompt:
London drill beat, strong kick(伦敦 drill 风格节拍,强力踢腿节奏)
样例 03:
输入 Prompt:A jazzy piece with a smooth saxophone solo. The sound is both sophisticated and playful with a slow tempo.(一首爵士乐作品,带有流畅的萨克斯管独奏。 声音既复杂又有趣,节奏缓慢)
根据字幕生成音乐
MusicLM 的强大之处不只是在于能够从你提供的 Prompt 生成音乐,甚至还能根据字幕来生成符合情景的音乐
样例 01:
The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.
(翻译:一种街机游戏的主要配乐。 节奏快、欢快,带有朗朗上口的电吉他即兴重复节奏。 音乐重复且易于记忆,但带有意想不到的声音,例如铙钹撞击声或鼓声。)
生成结果:
样例 02:
A fusion of reggaeton and electronic dance music, with a spacey, otherworldly sound. Induces the experience of being lost in space, and the music would be designed to evoke a sense of wonder and awe, while being danceable.
(翻译:雷鬼音乐和电子舞曲的融合,带有空间感、超凡脱俗的声音。 一种感觉像是迷失在太空中的体验,这种音乐的设计旨在唤起一种惊奇和敬畏的感觉,让人想起舞。)
生成结果:
生成不同风格的一段音乐
输入 Prompt:
jazz song (0:00-0:15)
pop song (0:15-0:30)
rock song(0:30-0:45)
death metal song (0:45-1:00)
rap song (1:00-1:15)
string quartet with violins (1:15-1:30)
epic movie soundtrack with drums (1:30-1:45)
scottish folk song with traditional instruments (1:45-2:00)
(爵士乐(0:00-0:15)
流行歌曲 (0:15-0:30)
摇滚歌曲 (0:30-0:45)
死亡金属歌曲 (0:45-1:00)
说唱歌曲(1:00-1:15)
小提琴弦乐四重奏 (1:15-1:30)
史诗电影配乐与鼓 (1:30-1:45)
传统乐器演奏的苏格兰民歌(1:45-2:00))
生成结果: