• 首页 > 云计算频道 > 大模型

    Music ControlNet可精确控制音乐中的时间变化

    2023年11月21日 15:28:53   来源:站长之家

      MusicControlNet是一款基于扩散(diffusion)技术的音乐生成模型,旨在为文本到音乐生成模型提供多个准确的、时变的音乐控制。虽然现代文本到音乐生成模型已经能够以广泛的风格生成高质量音乐,但文本控制主要适用于操纵全局的音乐属性,如流派、情绪和速度,对于精确控制音乐中时间变化的属性,比如节奏中的拍子位置或音乐动态的变化,则表现不佳。

      Music ControlNet通过提取训练音频中的控制信息,细调音乐的谱图生成模型,以给定旋律、动态和节奏控制的方式,实现对生成音频的多个准确时变控制。与已有的Uni-ControlNet方法相比,该模型引入了一种新的策略,允许创作者在时间上部分指定控制,从而为音乐创作提供更大的灵活性。

      核心功能:

      多时变控制: Music ControlNet为音乐生成提供多个时变的控制,包括旋律、动态和节奏,使创作者能够更精细地操控生成音乐的各个方面。

      扩散技术: 采用扩散技术,通过对训练音频中提取的控制信息进行微调,实现对音频谱图的条件生成,提高生成音乐的质量和逼真度。

      部分指定控制: 与传统模型相比,Music ControlNet引入了一种新的策略,允许创作者在时间上部分指定控制,为创作提供更大的自由度和创造性。

      性能优越性: 在与MusicGen等现有音乐生成模型的比较中,Music ControlNet表现出色,生成的音乐与输入旋律的吻合度高达49%,同时具有更少的参数、更短的训练时间,以及对两种额外形式的时变控制的支持。

      灵活的应用: 通过提供生成音乐的示例,包括旋律、动态和节奏的各种组合,以及对时间上部分指定控制的支持,Music ControlNet为创作者提供了丰富的工具,用于创作出具有多样性和创新性的音乐作品。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    TCL实业荣获IFA2024多项大奖,展示全球科技创新力量

    近日,德国柏林国际电子消费品展览会(IFA2024)隆重举办。凭借在核心技术、产品设计及应用方面的创新变革,全球领先的智能终端企业TCL实业成功斩获两项“IFA全球产品设计创新大奖”金奖,有力证明了其在全球市场的强大影响力。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。