国家安全部:警惕深度伪造技术带来的安全风险一键生成 AI 广告短视频:Tiktok 上线 Symphony Creative Studio 平台参数量仅 0.25B,成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型我国新一代地基红外天文望远镜发布首批观测图像东芝将与日本筑波大学合作,利用基因信息展开睡眠研究日企“山业”推出磁吸式网线:可减少端口损坏,传输速度 10GbpsAI投毒第一案!GPT写的代码竟有后门 程序员被骗1.8万元苹果 iPhone 16 获 DxOMark 147 分超三星 Galaxy S24 Ultra:HDR 照片明亮有活力、肤色自然准确赵明回应荣耀 GT 系列独立,或将肩负再造荣耀目标微软公布 Zero Day Quest 白帽安全竞赛:提交指定类型漏洞奖金至高可翻倍、前 45 名可受邀线下活动印度将鼓励企业本土生产手机等产品零部件:总额 40-50 亿美元我国牵头的首个工业化建造自动标识与数据采集应用国际标准发布京东 11 月 27 日起下线京享值 6000 以上“运费双免”服务,PLUS 会员“免费退换货”不受影响美团刘硕:美团无人机运营规模位列全球第一梯队谷歌“隐瞒文化”曝光:在掌握所有事实之前,不要发表评论英伟达股价大涨,黄仁勋慈善基金会今年至少要再捐 1.2 亿美元消息称莱迪思半导体正考虑收购英特尔 Altera滴滴“12 年老将”张博卸任 CTO,未来将专注自动驾驶业务毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%
  • 首页 > 延展阅读 > 2016归档

    百度语音开放平台三周年 每日在线语音识别调用1亿4千万

    2016年11月22日 17:53:34   来源:中国网

      11月22日,百度宣布在其语音开放平台上线三周年之际,向公众开放四项全新语音技术的接口,以使用户在使用语音与机器进行交流时,享受到更奇妙的交互体验。

      百度公司首席科学家吴恩达在演讲中对百度最新的语音技术进展表示满意,他简单介绍了这四项深具革命性的语音技术,即情感合成、远场方案、唤醒二期技术和长语音方案,并宣布即日起百度将这几项技术免费开放给用户和开发者共享。

    5065f32cc251199e55b236.jpg

    (百度公司首席科学家吴恩达进行现场演讲)

      “这些技术有很大的潜力,去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大的改变。”吴恩达表示。

      这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果,百度今年早些时候曾利用此技术,复原已逝明星张国荣的声音。

      类似地,开发者还可以利用新的接口,使语音识别距离增加到3-5米,将设备的语音唤醒率提升到95%以上同时更省电误报更少,或提升长时间语音识别的准确率问题。这将为语音技术带来远比现在更多的想象空间,而不只是遥控电视或解锁手机。

      例如,前两者的代表是百度的“小度机器人人机语音交互点餐”,已在上海肯德基旗舰店投入应用,可远距离随时应答点餐。后者则已经在诸多内容记录、智能客服、视频转写等应用场景表现出巨大的想象空间。



      (“极智开放·共语未来——百度语音开放平台3周年庆”现场)

      在这场名为“极智开放·共语未来”的庆典上,来自斯坦福大学的人工智能专家James Landay,也分享了一项与百度合作的最新研究成果,该研究发现智能手机在语音输入时,输入速度比键盘输入快3倍。他表示,“近两年,受益于大数据和深度学习技术的不断发展,语音识别技术突飞猛进,速度及准确性都有了长足进步。”

      吴桂林打开视频应用“爱奇艺”的手机客户端,说“VIP续费”,系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出,借助百度语音开放平台,每天有百万以上的爱奇艺用户使用语音搜索,其中80%以上转化为有效点击。

      读者甘肃数码科技有限公司总经理金大时认为,语音开放平台的价值并不止于商业。“读者数字农家书屋”已在甘肃庆阳市试点成功,完成了65个新农村“数字农家书屋”。他表示,“很多不识字的老年人和留守儿童,语音合成让他们也享受到了阅读的乐趣。”

      

    5065f32cc251199e55fa40.jpg

    (百度语音开放平台宣布四大语音新技术开放)

      目前,百度语音开放平台的合作伙伴已涵盖多个领域和场景,包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。

      “语音是人类交流最自然的方式,通过开放语音技术,百度希望可以引领语音功能产品的繁荣发展。”吴恩达表示。

      作为国内最为开放的领先语音技术开放平台,百度语音开放平台自2013年10月上线以来,每日在线语音识别要求从2013年的500万上升到今天的1亿4千万,在线语音合成每日请求达2亿,开发者数量超过14万。

      在技术指标方面,百度语音识别准确率目前已高达97%,居于全球领先。今年2月,百度深度语音识别系统Deep Speech 2入选MIT 2016十大突破技术。包括语音技术在内的百度大脑,入选2016第三届乌镇世界互联网大会15大领先科技成果,成为国内唯一入选的综合型人工智能技术。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [编号: ]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。