Meta推出开源AI音乐生成器AudioCraft

Meta发布了开源AI音乐生成器AudioCraft

Meta的新AI音乐生成器是该技术公司最近发布的一系列AI产品中的最新品种。

在星期三，Meta宣布推出开源生成式AI工具AudioCraft，可根据文本提示创建音频和音乐。AudioCraft有三个模型，MusicGen用于作曲，AudioGen用于创建音效，EnCodec使用AI辅助音频压缩，优于MP3格式。

如果你想知道版权问题，MusicGen是通过Meta拥有和许可的音乐进行训练的。

Meta一直积极推动将AI工具推广给大众，与OpenAI、Google和Microsoft竞争。在7月份，它发布了开源的Llama 2，这是其LLM（大型语言模型）的最新版本。

与OpenAI的GPT-4和Google的PaLM 2不同，Llama 2是开源的，这在开发人员和伦理学家中赢得了Meta的赞誉，他们认为AI开发应该透明。还有传闻称Meta将在Instagram、Facebook和WhatsApp上推出AI“人物”，也就是聊天机器人。

AudioCraft是为音乐家和声音设计师设计的，旨在“提供灵感，帮助人们快速进行头脑风暴，并以新的方式改进他们的作品”，宣布中说道。

博客文章中的示例包括来自提示“吹着风的口哨声”和“流行舞曲，有着优美旋律、热带打击乐器和欢快节奏，非常适合沙滩”的音频样本，这些音频成功地听起来像这些描述。

最近的生成式AI发展主要集中在文本和图像生成上，这是一个更简单的过程。

文本转音频是一个更复杂的任务，Meta似乎已经突破了这一难题。AudioCraft使用专有的EnCodec神经音频编解码器从原始信号中学习音频令牌，以创建模型的新“词汇表”。

然后，它在这个音频词汇表上训练语言模型，使模型理解音频和文本之间的关联。由于AudioCraft也是开源的，用户可以在GitHub上获取代码进行探索和测试。