• 首页 > 延展阅读 > 2016归档

    深度学习助力OCR技术获重大突破 识别率超过99.9%

    2016年12月21日 14:29:01   来源:中文科技资讯

       随着深度学习越来越多地被用于人工智能技术的研究。近期,捷通华声与清华科研团队应用最新机器学习算法和深度学习训练集群,实现灵云OCR技术重大突破。该技术颠覆了传统方法,使文字识别正确率实现跨越式提升,全面超越国内OCR厂商及代表国际最高水平的某俄罗斯公司,推动国内OCR技术达到国际领先水平。

    1.jpg

      OCR即光学字符识别(Optical Character Recognition),是将印刷体字符识别为电子文本的一项技术。目前主流的OCR识别技术,先要对图像进行清晰度判断、版面分析、直方图均衡、灰度化、二值化、倾斜校正、字符切割等预处理,得到端正、清晰的字符图像;再用字符识别和语言模型,对文字进行识别;最后通过后处理,输出文本结果。

      由于这种方法过于依赖图像处理算法以便在不同场景下对图像进行适应性调整和处理,对纸张的摆放位置、拍照的光线环境、扫描仪的精度等有较高要求,很大程度上限制了文字识别正确率的提升。

      对此,清华实验室与捷通华声科研团队基于最新的机器学习算法和深度学习训练集群,在充分研究拍照、扫描图像的特性后,收集和整理了海量的图像数据,从文本的定位到识别,采用了一体化的End-to-end模型结构和训练方法,推出了最新灵云文本引擎iRead 7.0 Text——新一代灵云OCR技术。

      该技术的推出,让机器不再只能识别“清晰、端正的文字”,还能识别“倾斜、相对模糊的文字”,并且支持更多的字体。这不但省去了主流方法繁杂的预处理和后处理工作,将模型训练时间从以月为单位降低到几天,更是将OCR技术的字正确率提高到99.9%,行正确率(一行字全部识别正确)从80%提高到98%,实现跨越式进步。

      清华大学早在上世纪90年代就推出了代表行业最高水平的中文OCR技术,是国内最早从事中文OCR技术研究与应用的高校。清华OCR技术已广泛服务于各行业、各领域,为中文OCR技术的发展做出了重大贡献。

      此次清华大学与捷通华声科研团队的合作,再次展现了清华大学在OCR领域强大的科研实力,以及捷通华声十多年在OCR市场应用中的产业积累,是捷通华声与清华大学“灵云科技 源自清华”战略合作、“产学研”相结合的最新科研成果。

      灵云OCR 提供文档、证照、票据、名片等全方位文字识别服务

      OCR作为最早实用化的人工智能技术之一,已在产业中得到广泛应用。捷通华声灵云OCR技术经过多年的市场应用和技术积累,已推出文档识别、证照识别、票据识别、名片识别等全方位文字识别产品与服务,广泛服务于各行业:

      l 金融办公:实现海量银行业务凭单、统一对账单、托管资料等表单的批量识别,助力金融企业建立电子资料档案库;

      l 物流货运:物流货运单的批量识别,助力物流企业优化货运流程和管理供应链;

      l 海关边检&旅游:实现护照、港澳通行证、回乡证、台胞证、大陆证、户口簿、居住证等证照的精准快速识别,缩短旅客排队时间。

      l 金融开户:身份证、银行卡、名片自动识别,让银行、证券、保险的线下开户更快捷。

      l 移动警务:身份证、驾驶证、行驶证识别,让交警能更高效地录入司机信息。

      l 财务办公:发票、文档识别,打造OA办公系统。

    2.jpg

      相比传统人工录入,OCR技术不但为企业节省了大量人工成本,提高了信息录入效率和准确度,还能助力企业建立可以即时搜索、便于管理和调用的电子资料档案库,为企业的发展提供强有力的数据服务。

      新一代灵云OCR技术即将上线灵云平台(www.AIcloud.com),面向广大个人开发者和企业开发商全面开放。捷通华声将继续巩固与清华大学“灵云科技 源自清华”的战略合作,专注全方位人工智能技术研究与产业化应用,为产业提供更为优质的技术与服务。

      来源:XXX(非中文科技资讯)的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

      如发现本站文章存在问题,提供版权疑问、身份证明、版权证明、联系方式等发邮件至news@citnews.com.cn。

    [编辑: admin ]
    分享到微信

    即时探行数字人注册免费试用

    第三代骁龙8s平台,“恰逢其时”的“新生代旗舰”之选

    日前,高通举办新品发布会,推出了骁龙8旗舰移动平台诞生以来的第一款新生代旗舰平台:第三代骁龙8s,这是高通对骁龙旗舰移动平台的一次层级扩展,同时意味着广大消费者未来在旗舰手机市场也将会有更多丰富的选择。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。