Meta推出开源AI音乐生成器AudioCraft

Meta发布了开源AI音乐生成器AudioCraft

Meta的新AI音乐生成器是该技术公司最近发布的一系列AI产品中的最新品种。

在星期三,Meta宣布推出开源生成式AI工具AudioCraft,可根据文本提示创建音频和音乐。AudioCraft有三个模型,MusicGen用于作曲,AudioGen用于创建音效,EnCodec使用AI辅助音频压缩,优于MP3格式。

如果你想知道版权问题,MusicGen是通过Meta拥有和许可的音乐进行训练的。

Meta一直积极推动将AI工具推广给大众,与OpenAI、Google和Microsoft竞争。在7月份,它发布了开源的Llama 2,这是其LLM(大型语言模型)的最新版本。

与OpenAI的GPT-4和Google的PaLM 2不同,Llama 2是开源的,这在开发人员和伦理学家中赢得了Meta的赞誉,他们认为AI开发应该透明。还有传闻称Meta将在Instagram、Facebook和WhatsApp上推出AI“人物”,也就是聊天机器人。

AudioCraft是为音乐家和声音设计师设计的,旨在“提供灵感,帮助人们快速进行头脑风暴,并以新的方式改进他们的作品”,宣布中说道。

博客文章中的示例包括来自提示“吹着风的口哨声”和“流行舞曲,有着优美旋律、热带打击乐器和欢快节奏,非常适合沙滩”的音频样本,这些音频成功地听起来像这些描述。

最近的生成式AI发展主要集中在文本和图像生成上,这是一个更简单的过程。

文本转音频是一个更复杂的任务,Meta似乎已经突破了这一难题。AudioCraft使用专有的EnCodec神经音频编解码器从原始信号中学习音频令牌,以创建模型的新“词汇表”。

然后,它在这个音频词汇表上训练语言模型,使模型理解音频和文本之间的关联。由于AudioCraft也是开源的,用户可以在GitHub上获取代码进行探索和测试。