文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

sxkk20082年前智能百科225
随着聊天机器人ChatGPT的兴起,人们早已尝试将生成式人工智能(AI)技术应用于包括音乐在内的多个领域。年初,谷歌曾推出音乐生成大模型 MusicLM,并于5月向上月向所有用户开放,其效果非常不错。 除了谷歌的MusicLM外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。而近日,Meta在Github上推出了允许商业使用的名为MusicGen的开源AI模型,引发了外界的广泛关注。

随着聊天机器人ChatGPT的兴起,人们早已尝试将生成式人工智能(AI)技术应用于包括音乐在内的多个领域。年初,谷歌曾推出音乐生成大模型 MusicLM,并于5月向上月向所有用户开放,其效果非常不错。


文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

除了谷歌的MusicLM外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。而近日,Meta在Github上推出了允许商业使用的名为MusicGen的开源AI模型,引发了外界的广泛关注。


这种开源的AI模型MusicGen,顾名思义其实就是一种深度学习语言模型,该模型基于谷歌2017年推出的Transformer模型,并采用Meta的EnCodec编译器将音频数据分解为小单元处理,让用户可直接根据文本提示和旋律提示创作音乐。


前段时间,Meta人工智能研究工程师Felix Kreuk还曾在Twitter上向大众展示了MusicGen的功能。


文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

据了解,Meta的介绍,由Synnaeve领导的团队曾使用了2万小时的授权音乐对MusicGen进行训练,其中包括来自内部数据集的来自媒体内容服务商ShutterStock和Pond5 10000首“高质量”授权音乐和390000首纯音乐。


与此同时,Meta自己还将MusicGen与市面上已有的音乐创作软件MusicLM(谷歌旗下)、Riffusion以及Mousai作了比较。


据Meta表示,无不管是在与文本的匹配度上,还是在作曲的可信度上,MusicGen的表现似乎更加惊艳,都更胜一筹。


目前,Meta尚未提供用于训练模型的代码,但提供了预训练模型。用户如果想要亲身感受,可以通过Hugging Face上的API体验MusicGen,除了文本提示外,还可搭配音频一同作为生成音乐的条件。


文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

在确定提示信息后,便可让MusicGen生成一段12秒的音频但生成音乐。不过可能需要一些时间,其具体等待时长将取决于同时在线的用户数量和用户所设置的提示信息。


从AI孙燕姿到MusicGen,从演唱到创作,AI已经全面入侵音乐领域。然而,MusicGen 能否能够成为一款优秀的音乐生成模型,可能还待更多用户的验证。

相关文章

九九重阳节,我们一起帮老人“防跌倒”

九九重阳节,我们一起帮老人“防跌倒”

你知道吗?“跌倒”这件看似平常的小意外,却是我国65岁以上老人伤害死亡的首位原因。 九九重阳节,浓浓敬老情,今年重阳节是我国第十二个法定老年节,贝壳公益杭州站携手...

汉威激光甲烷家用燃气报警器,守护家庭用气安全

汉威激光甲烷家用燃气报警器,守护家庭用气安全

 随着城市化和农村天然气改造进程加快,我国燃气用户、管道长度不断增长。据《2021年城乡建设统计年鉴》,2013年~2021年期间,我国城市、县城燃气(包括天然气和人工煤气)用气人...

大模型加速涌向移动端!ControlNet 手机出图只需 12 秒,高通 AI 掌门人:LLaMA 也只是时间问题

大模型加速涌向移动端!ControlNet 手机出图只需 12 秒,高通 AI 掌门人:LLaMA 也只是时间问题

大规模模型的革新浪潮正在迅猛地涌向移动应用领域。不久前,在 MWC 上,高通公司展示了一项引人瞩目的技术:仅用 15 秒的时间,通过手机运行稳定扩散算法,即可生成精美的图片。大规模模型的革新浪潮正在迅...

美的楼宇科技携手火山引擎,打造绿色智慧园区新生态

美的楼宇科技携手火山引擎,打造绿色智慧园区新生态

在2060碳中和战略目标背景下,我们建筑行业正加速迈入智慧化、绿色发展新阶段。当前建筑行业存在诸多难题,传统园区往往面临园区运行能耗高、设施运维难度大、日常运营人员成本高、空间利用...

Enhanced AIChat插件,增强Chrome浏览器AI聊天对话体验

Enhanced AIChat插件,增强Chrome浏览器AI聊天对话体验

Enhanced AIChat 插件是一款增强 Chrome 浏览器 AI 聊天对话体验的实用工具,该插件可直接访问增强 AIChat 体验的新功能,例如能够将当前聊天导出到 Markdown 文件,...

续写“敢为“新篇章,TCL实业即将重磅亮相CES 2024

续写“敢为“新篇章,TCL实业即将重磅亮相CES 2024

 2024年1月9日-12日,世界规模最大、水平最高、影响最广的消费类电子产品展览会之一 --美国拉斯维加斯国际消费类电子产品展览会(CES 2024)将盛大举行。 作为全球...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。