人工智能的重要性日益增长,特别是在写作和图像创作方面的生成式人工智能。但是现在我们的生成式人工智能创作列表中又增加了一个成员,音乐。现在人们可以使用人工智能工具创建或生成音乐,而无需在录音室里花费数小时。
我们拥有OpenAI的音乐生成AI模型Jukebox,它开始进入AI音乐领域。虽然这个工具还远未完善,声音也不是很好,但它有潜力成为市场上的一种改变游戏规则的工具。
那么Jukebox到底是什么,以及如何使用它?这就是我们将在本文中回答的问题。
OpenAI Jukebox是什么:生成原始音频的人工智能
Jukebox是OpenAI的音乐生成器,如果提供了关于音乐流派、艺术家甚至歌词的信息,它可以创建音频。有了所有这些信息,这个人工智能工具将致力于为您创作一首独特的音乐作品。
音乐输出将以原始格式呈现,这是音乐家在创作音乐时使用的格式。我们在手机上听到的格式主要是经过严重压缩的mp3格式歌曲,文件大小和音质都受到了压缩。
而像aac这样的原始格式在任何方面都没有经过修改和压缩。因此,Jukebox生成的作品将是未经压缩的,音乐家可以按照自己的意愿进行编辑或更改。原始格式将确保更大的定制和编辑选项。
然而,与ChatGPT和Dall E不同,Jukebox并没有引起生成式人工智能方面太多关注。主要原因是它不太用户友好的Web应用程序和冗长的生成时间。
为了帮助您更好地理解,生成一个一分钟的音频文件在Jukebox中需要大约9个小时的渲染时间。
它不仅持续时间很长,您还可能需要调整一些代码以更好地与模型进行交互。
OpenAI Jukebox是如何工作的?
与其他人工智能工具不同,Jukebox无法从零开始生成一首歌曲。它需要组合预先录制的样本或MIDI信息,然后使用数字合成器进行处理。
数字合成器将分析输入数据,产生一个类似于提供数据的输出。
这个工具比我们在ChatGPT和Dall E等其他OpenAI工具中看到的工具更加复杂,但它只是音乐世界中人工智能的开始。
如何使用OpenAI Jukebox
与其他OpenAI工具相似,这里的过程也基本相似。您输入描述所需输出的提示,然后让工具发挥魔力。
此工具还允许您插入任何音乐样本作为参考。
首先,您需要前往OpenAI网站并下载Jukebox的压缩文件。一旦您有了压缩文件,解压它,然后运行openai-jukebox程序文件。
之后,为jukebox程序提供音乐文件数据集,并描述您期望从Jukebox获得的输出类型。然后让工具发挥作用,在经过数小时的等待后,您将获得按照您要求的生产。
Jukebox能做什么?
Jukebox只能作为一种工具,用于创建内容创作者可以用作背景音频的独特音乐内容。
在这个工具上创建一首完整的歌曲是不可能的。它更像是一个可以编辑或更正以获得所需独特音频输出的实验。
如果您计划使用Jukebox从头开始创建音乐,那是不可能的。
OpenAI Jukebox的局限性
OpenAI Jukebox的显著局限性可以归结为两个方面:
– 音乐渲染时间可能更快。
– 输出是最终的结果。您可以修改搜索以获得任何期望的音乐,但只能在最终输出上进行工作和编辑。与传统方式不同,您无法在音乐准备过程中进行编辑或更改。
OpenAI Jukebox的未来
OpenAi将逐步向Jukebox的训练数据中添加更多音乐,使其能够与世界上各种音乐一起工作。
随着更多数据进入训练阶段,Dall E 2取得了更好的效果。我们也可以从Jukebox中期待类似的结果。
音乐及其数据的世界在可测量的术语上是广阔而无法理解的。将更多的音乐数据纳入工具的训练中需要一段时间,但一旦发生,我们可能会看到一个可以仅通过单个文本提示来创作音乐的工具。
OpenAI Jukebox的替代选项是什么?
有许多人工智能音乐生成器:Amper Music,AIVA,Ecrett Music,Soundraw和Boomy。但最适合作为OpenAI Jukebox的完美替代品的是OpenAI自己的MuseNet。
Musenet易于使用,创建音乐所需的时间较短。
如果您想了解有关这些AI音乐生成器的其他选择的更多信息,请继续关注我们的其他文章。
Jukebox听起来怎么样?
Jukebox产生的结果与完美有很大差距。有人可能会认为这些音频对于大多数人来说更实用。
听音乐时,您可以了解音频的形状和所属的音乐流派,但声音质量非常低沉。就像在古老的音乐设备上听旧录制的音乐一样。
它的输出声音是低沉的。音频也可能与我们在收音机上听到的歌曲密切相关,当频率没有完美设置时。有些歌曲听起来像是现有歌曲的翻唱,而有些歌曲听起来像是现有歌曲的延续。
生成的音频的质量和输出在各个标准上都不达标,但能够创作出任何您想要的音乐的能力仍然令人惊讶。
随着时间的推移,我们将看到类似Jukebox的工具变得更加复杂,可能使其成为新内容创作者的默认选择。
OpenAI的Jukebox是如何训练的,有多少数据?
OpenAI的Jukebox使用超过120万首歌曲的数据集进行了训练,全部为英语。因此,模型的主要训练数据是旧歌曲,因此它们生成的输出主要听起来像是在收音机上播放的旧歌曲。
从数量上来看,120万首歌曲可能听起来很多,但就Dall E而言,使用了数亿张图像作为训练模型。
因此,在这种情况下,还有很多训练工作要做。除此之外,数据集中使用的数据只有在某些情况下与创建者达成一致。因此,在获取数据方面存在一些复杂性。
目前,大部分数据集都包括西方音乐,使其特定于某个地区。但人类音乐历史远远超过120万首歌曲可以涵盖的范围。随着更多数据的涌入,我们可能很快就会看到Jukebox的更好版本。
人工智能音乐是否会感动你?
不会,它不像音乐通常所能做到的那样动人。在某种程度上,由人工智能生成的音乐是真正的音乐,没有人可以否认这一点。但作品的质量可能会更好。
虽然音乐中的人工智能并不完全是一个全新的概念,但我们已经看到了一些实施,但没有像原始音频输出那样。
Jukebox是第一个推出原始作品的,但仍然缺乏足够的功能和复杂性,无法作为商业工具打包。
实际的人类音乐家仍然制作出最好的音乐来感动人,就像ChatGPT和Dall E无法创造出只有人类才能为内容带来的独特性一样。