毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
首页 > 延展阅读 > 2016归档

97%之后 百度再寻语音突破口——Deep CNN

2016年11月03日 14:01:37 中文科技资讯

  近日,百度在语音识别技术方面再获突破,将图像识别技术成功“跨界”到语音领域,利用深层卷积神经网络(Deep CNN)应用于语音识别声学建模中,将其与基于长短时记忆单元(LSTM)和连接时序分类(CTC)的端对端语音识别技术相结合,错误率相对降低10%,大幅度提升语音识别产品性能,是继端对端语音识别后取得的另一次重大技术突破。

  Deep CNN语音识别的建模过程

  近年来,运用CNN技术的图像识别成果颇丰,越来越深的CNN不断刷新着图像识别的精准度,以人脸识别为例,识别准确率高达99.7%。但CNN的进展在语音识别方面没有得到充分的应用。作为一家在语音技术上有着深入研究的人工智能公司,百度将Deep CNN视为语音识别技术的下一个突破口。

  ImageNet竞赛中,越来越深的CNN不断刷新着其性能

  在商用领域的端对端语音识别技术中,百度首次尝试引入更深层的CNN神经网络,使错误率相对降低10%。端对端技术则使用一个单独的学习算法来完成从任务输入端到输出端的所有过程,减少了中间单元以及人为干预,在海量数据的支持下模型效果提升明显。目前,百度的端对端技术处于业界领先水平。值得一提的是,语音识别都是基于时频分析后的语音谱完成的,将整个语音信号分析得到的时频谱当作一张图像,就可以采用图像中已广泛应用的CNN进行识别,克服了语音信号多样性的问题,且通过引入更深层的CNN,使语音识别性能得到显著提升,正如百度语音技术部识别技术负责人李先刚博士所言:‘The Deeper,The Better’。

  与学术研究不同,百度语音的研发立足点,聚焦于技术的实际应用,技术难度和实现程度更高。针对语音识别产品而言,必须具备在大规模语音数据库上体现性能提升以及具有适合语音在线识别产品运行的模型。百度采用数千小时进行实验的研究,并在近十万小时的产品语音数据库中进行验证,且充足的语音数据资源,使基于端对端技术的语音识别系统明显优于以往的框架性能。

  百度语音识别技术每年迭代算法模型

  除此之外,百度语音技术在数据、计算能力、算法等三方面优势显著。百度拥有约10万小时的精准标注语音数据,以及基于数百个GPU的高性能计算平台。在算法方面,百度每年都在不断优化、迭代模型算法,语音识别效果显著提升,领先业界。

  此前,百度便利用端对端技术研发了Deep Speech 2深度语音识别技术,用于提高在嘈杂环境下语音识别的准确率。在噪音环境下,其错误率低于谷歌、微软以及苹果的语音系统。目前,百度语音识别准确率高达97%,并被美国权威科技杂志《麻省理工评论》列为2016年十大突破技术之一。另据李先刚博士透露,目前的确正在加紧Deep Speech 3 的研发工作,而本次公布的Deep CNN不排除将会是Deep Speech 3的核心组成部分。

  除了技术突破,百度还积极推动用户使用语音交互的普及,手机百度、百度输入法、百度地图、度秘等产品都已支持语音输入功能,而此次“跨界”的Deep CNN相信很快会应用到拥有庞大用户体量的百度产品中。

  来源:XXX(非中文科技资讯)的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。有事发邮件至news#citnews.com.cn(发送时将#替换为@)。

[信息来源:中国网]

[上传用户: ]

[转载标题:]
分享到微信

即时

新闻

明火炊具市场:三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

企业IT

重庆创新公积金应用,“区块链+政务服务”显成效

“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

研究

中国信通院罗松:深度解读《工业互联网标识解析体系

9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。