绿色检查
链接复制到剪贴板

音乐中的人工智能:MusicBrainz Picard 等应用和工具

与我们一起深入探讨人工智能在音乐中的作用,从分析音频数据到生成新音乐。探索人工智能在音乐产业中的影响和应用。

人工智能(AI)就是要在机器中再现人类的智慧。人类的一个重要组成部分是我们与艺术,尤其是音乐的联系。音乐深深影响着我们的文化和情感。由于人工智能的进步,机器现在可以创造出听起来像人类创作的音乐。人工智能音乐为人类与人工智能之间的创新合作开辟了新的可能性,并改变了我们体验音乐和与音乐互动的方式。

本文将探讨人工智能如何用于音乐创作。我们还将讨论人工智能与 MusicBrainz Picard 等音乐标记工具之间的联系,以及它们对艺术家、制作人和整个娱乐产业的影响。

声音人工智能及其意义

人工智能可以处理各种类型的数据,包括声音。声音数据通常被称为音频数据,是不同强度的波频随时间变化的混合数据。与图像或时间序列数据一样,音频数据也可以转换成人工智能系统可以处理和分析的格式。声波可以转换成人工智能模型可以分析的数字数据。

另一种有趣的方法是使用傅立叶变换,将声波转换成频谱图。频谱图是一种可视化表示,显示不同频率的声音随时间的变化情况。人工智能模型可以应用图像识别技术来分析和解释音频数据,把频谱图当作图像来处理。人工智能可以识别声音中的模式和特征,就像识别视觉数据一样。

图 1.人工智能对声音进行分类的示例。

利用人工智能分析、处理和生成音频数据可以创造出一系列应用。下面是一些例子:

  • 音乐生成与创作:通过学习现有作品,协助音乐家创作旋律、和声和节奏,创作新音乐。
  • 音频增强和降噪: 呼叫中心、助听器和音频编辑减少背景噪音,从而提高音频质量。
  • 播客摘要:生成播客剧集的简明摘要,方便内容消费。
  • 从语音中检测情绪:为客户服务、心理健康监测和用户体验研究检测语音中的情绪。

了解人工智能歌曲生成器的工作原理

人工智能歌曲生成器通过分析和学习现有音乐来工作,这与图像生成类似。了解使用人工智能理解音乐与使用人工智能生成音乐之间的区别非常重要。理解音乐涉及分析和识别模式,而生成音乐则涉及根据学习到的模式创作新作品。

图 2.比较使用人工智能理解音乐和人工智能生成音乐。

人工智能音乐生成过程首先要收集大量音乐数据集,其中包括各种类型和风格的音乐。然后将数据集分解成音符、和弦和节奏等较小的组成部分,再将其转换成人工智能可以处理的数字数据。

有许多不同的人工智能生成模型可以训练生成音乐。例如,变形器和变异自动编码器(VAE)等人工智能模型可以共同生成音乐。变异自动编码器可将输入的声音压缩到一个潜在空间,将相似的音乐片段紧密地组合在一起,以捕捉音乐的多样性和丰富性。然后,变换器通过理解模式和关注序列中的重要音符,利用这一潜在空间生成新的音乐。

一旦根据这些数据训练出人工智能模型,人工智能就能根据所学知识预测下一个音符或和弦,从而生成新的音乐。通过将这些预测串联起来,它还能创作出整首乐曲。生成的音乐可以进行微调,以符合特定的风格或偏好。

我们开始看到越来越多的音乐生成器使用这种技术。下面是一些例子:

  • MusicLM 由Google 提供:根据文本提示生成音乐,允许用户指定音乐体裁、情绪、乐器和整体感觉。
  • Meta MusicGen使用名为 EnCodec 的工具处理音频数据,根据文本描述或现有旋律创建音乐。
  • Stable Audio 2.0 由Stability AI 提供:能根据提示创建完整音轨和转换音频样本。

人工智能对音乐产业的影响

人工智能创新为音乐家、听众和制作人带来了新的机遇和挑战,导致了他们可能从未经历过的情况。看看每个群体如何适应这些进步、如何使用新工具、如何应对对原创性和道德的担忧,是一件很有意思的事情。除了生成音乐,人工智能在音乐产业中还有其他令人兴奋的潜力,比如增强现场表演、改进音乐发现以及协助制作流程。让我们来看看人工智能如何影响音乐行业中的音乐家、听众和制作人。

图 3.生成式人工智能对音乐产业的影响。

对音乐家的影响

人工智能正在改变音乐家创作音乐的方式。集成了生成式人工智能的工具可以帮助生成新的旋律、和弦行进和歌词,使音乐家更容易克服创作障碍。人工智能还被用来完成未完成的作品,例如披头士乐队的新歌《Now And Then》,就是用约翰-列侬的歌声从一个旧的小样中创作出来的。然而,人工智能生成的音乐模仿知名艺术家的风格,这引起了人们对原创性的担忧。例如,Bad Bunny等艺术家担心人工智能会在未经同意的情况下复制他们的声音和风格。

除了音乐创作,人工智能和计算机视觉还能帮助音乐家制作出更好的表演和音乐视频。音乐视频由许多不同的元素组成,其中一个元素就是舞蹈。姿势估计模型,如 Ultralytics YOLOv8等姿态估计模型可以理解图像和视频中的人类姿态,并在创建与音乐同步的舞蹈编排序列中发挥作用。

NVIDIA 的"随音乐起舞"项目是人工智能用于舞蹈编排的另一个很好的例子。在这个项目中,他们使用人工智能和一个两步流程来生成新的舞蹈动作,这些舞蹈动作形式多样、风格一致,并且符合节拍。首先,利用姿势估计和运动节拍检测器,从大量舞蹈视频中学习各种符合节拍的舞蹈动作。然后,利用人工智能生成模型将这些舞蹈动作组织成符合音乐节奏和风格的舞蹈编排。人工智能编排的舞蹈动作为音乐视频增添了有趣的视觉元素,有助于艺术家发挥更大的创造力。

对听众的影响

对于听众来说,人工智能可以改善音乐发现和聆听体验。Spotify 和Apple Music平台正在利用人工智能来策划个性化播放列表,并根据用户的收听习惯推荐新音乐。当你在这些平台上发现新的艺术家和音乐类型时,这就是人工智能的神奇之处。 

人工智能驱动的虚拟现实(VR)也在改善现场音乐会的体验。例如,特拉维斯-斯科特(Travis Scott)利用 VR 创造了虚拟表演,全球观众都能欣赏到。然而,TikTok 等平台上大量的人工智能生成的音乐可能会让音乐发现变得不堪重负。这可能会让新艺术家难以脱颖而出。

图 4.人工智能让虚拟现实(VR)音乐会体验成为可能。

对生产者的影响

制片人可在多个方面受益于人工智能。人工智能工具可协助音高校正、混音和母带制作,从而简化制作流程。人工智能驱动的虚拟乐器和合成器,如 IBM 的 Watson Beat,可以创造出新的声音和纹理,拓展创作的可能性。 

流媒体平台上的人工智能不仅能为听众带来好处,还能为制作人创造更多听众。然而,正如音乐家们所担心的那样,人工智能模仿知名艺术家风格的能力引发了有关利用艺术家独特声音和风格的道德和法律问题。这导致了一些法律纠纷,例如环球、索尼和华纳等大型音乐公司对 Suno 和 Udio 等人工智能初创公司提起诉讼,指控它们未经许可使用受版权保护的作品来训练模型。

使用 MusicBrainz Picard 等人工智能集成工具管理音乐库

通过了解人工智能对音乐行业不同利益相关者的影响,我们简要探讨了人工智能在音乐领域的一些应用。现在,让我们来了解一下人工智能在音乐领域的更具体应用:人工智能增强型音乐管理工具,如MusicBrainz Picard。这些工具对于组织和管理数字音乐库非常有用。 

图 5.可以使用人工智能管理音乐库。

它们能自动识别音乐文件并为其标注准确的元数据,如艺术家姓名、专辑名称和曲目编号。MusicBrainz Picard 可以让音乐收藏更有条理。AcoustID 音频指纹是集成到 MusicBrainz Picard 中的关键技术之一。这些指纹可根据实际音频内容识别音乐文件,即使文件缺少元数据。

为何如此重要? 英国广播公司(BBC)、Google 、亚马逊、Spotify 和 Pandora 等大型机构都依赖 MusicBrainz 数据来增强其音乐相关服务。MusicBrainz Picard 等工具创建的元数据对于开发人员建立音乐数据库、标记应用程序或其他音乐相关软件至关重要。人工智能的支柱是数据,如果没有像 Picard 这样的工具,就很难获得分析和应用开发所需的干净、准确的数据。人工智能增强工具利用人工智能并帮助创建人工智能应用所需的数据,形成了一个有益的改进和创新循环,这一点非常吸引人。

关于音乐中的人工智能的最后说明

我们已经讨论过人工智能在音乐领域掀起的波澜。围绕人工智能生成音乐的法律环境也在不断演变。美国版权局等机构的现行法规规定,完全由人工智能生成的作品不能获得版权,因为它们缺少人类作者。不过,如果人类在创作过程中做出了重要贡献,作品就有可能获得版权保护。随着人工智能不断融入音乐产业,持续的法律和伦理讨论对于应对这些挑战至关重要。展望未来,人工智能在音乐领域有着巨大的潜力,它将技术与人类创造力相结合,拓展了音乐创作和制作的可能性。

访问我们的GitHub 存储库,加入我们充满活力的社区,探索人工智能。在我们的解决方案页面了解人工智能在制造业农业中的应用。

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅