当说到“AI音乐”时,你能想到什么画面?机器人唱歌?自动生成歌曲?
事实上,AI音乐已经不算新鲜事。用人工智能创作音乐,最早可以追溯到上个世纪50年代。1951年,“人工智能之父”阿兰·图灵就尝试过用电脑生成音乐并录制下来。2016 年,索尼计算机科学实验推出的大型歌曲和风格数据库 Flow Machines,创作出了“披头士”风格的旋律。
如果说早些年,AI音乐创作主要集中在纯乐曲和氛围音乐。那么近两年,AI在作词、编曲、伴奏、演唱方面一条龙的“音乐才华”无不让人大开眼界。
从国内第一代虚拟歌手“洛天依”开始,人工智能在音乐领域兴起了越来越多的浪潮:音乐家Taryn Southern与人工智能合作创作专辑、微软打造了会编曲、作词、唱歌的“智能少女”小冰、韩国SM公司推出含AI概念的女团aespa、网易发布AI原创单曲……“AI+音乐”的热度持续升温。
AI歌曲合成
随着AI音乐应用的不断突破,其背后歌声合成技术,也越来越受到关注。歌声合成与语音合成相比,既有相似性,也有其特殊性。
歌唱合成技术是将乐谱信息和歌词转换为歌唱语音的技术。相较于语音合成(TTS),音乐是流媒体,对作品的流畅度要求更高。因此,歌曲合成需要输入更多维度的音乐标注信息(音高、音符的时值),同时要求输出的歌声更有感情的起伏,声音展现还要有连续性,技术实现上来说更为复杂。
像人的学习一样,AI歌曲合成系统也需要通过语料库学习海量的歌曲内容,才能“创作”出新的音乐作品。普通学生学习一首曲子需要至少一周时间,但是有了AI技术的加持,将优质的歌曲数据输入到算法中进行模型训练,只需要很短时间即可完成一首歌的创作。
高质量数据库 化解AI歌曲合成难点
尽管技术在不断进步,但歌曲合成仍然存在两大难点。
一是音域的限制。由于每个歌手都有适合自己的音域范围,对于超出音域范围的歌曲,AI歌唱合成效果就会受到一定的影响。
其次,就是对高质量数据的需求。在对声音数据的处理上,歌声比语音所包含的专业因素更多。歌声的音高、音强、音长等变化组合繁复,需要标注人员对音乐有较深的理解,才能根据录制的人声演唱中所包含的音高、旋律节奏、演唱技巧、歌词等内容进行精细标注。
合成歌声的质量在很大程度上取决于数据库的质量。如何用更少的数据,让歌曲合成效果更真实、自然,获取更稳定的体验效果,是 AI歌曲合成技术突破的重点。
标贝科技深耕AI能数据服务领域多年,在语音数据生产方面沉淀了先进的技术能力以及大量音乐人才储备。面对复杂度更高的歌声合成需求,标贝科技设计了一套专业化的数据处理流程,能够实现快速产出高质量的不同音色、不同风格的歌声数据。
目前,标贝科技拥有近5000首不同风格类型的中文歌曲数据库。均由经过训练的专业歌手完成的整个数据的采集,并且标贝科技全程进行监督和指导,以确保数据质量。
在音频标注的标注格式方面,标贝科技采用了兼容性强、记录音乐信息精确性高的 MusicXML格式,对时值、升降号、节拍、谱号等乐谱属性进行记录。
同时,为了减少标注的错误率,标贝在重音、顿音、假声、连音等音符的相关信息的区分和记录上做了大量工作。甚至在对较难把握的颤音的处理上,也有专门的识别和标注记号。
如上图示意,标贝科技在标注过程中给出了旋律音符对应的音高节奏、转音、气口、休止符、歌词信息以及对应的拼音信息。
欢迎对以上歌曲合成数据感兴趣的行业伙伴联系我们~
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。