RA战队勇夺上海Major晋级资格 ROG外设助力电竞征途国家安全部:警惕深度伪造技术带来的安全风险一键生成 AI 广告短视频:Tiktok 上线 Symphony Creative Studio 平台参数量仅 0.25B,成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型我国新一代地基红外天文望远镜发布首批观测图像东芝将与日本筑波大学合作,利用基因信息展开睡眠研究日企“山业”推出磁吸式网线:可减少端口损坏,传输速度 10GbpsAI投毒第一案!GPT写的代码竟有后门 程序员被骗1.8万元苹果 iPhone 16 获 DxOMark 147 分超三星 Galaxy S24 Ultra:HDR 照片明亮有活力、肤色自然准确赵明回应荣耀 GT 系列独立,或将肩负再造荣耀目标微软公布 Zero Day Quest 白帽安全竞赛:提交指定类型漏洞奖金至高可翻倍、前 45 名可受邀线下活动印度将鼓励企业本土生产手机等产品零部件:总额 40-50 亿美元我国牵头的首个工业化建造自动标识与数据采集应用国际标准发布京东 11 月 27 日起下线京享值 6000 以上“运费双免”服务,PLUS 会员“免费退换货”不受影响美团刘硕:美团无人机运营规模位列全球第一梯队谷歌“隐瞒文化”曝光:在掌握所有事实之前,不要发表评论英伟达股价大涨,黄仁勋慈善基金会今年至少要再捐 1.2 亿美元消息称莱迪思半导体正考虑收购英特尔 Altera滴滴“12 年老将”张博卸任 CTO,未来将专注自动驾驶业务毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战
  • 首页 > 延展阅读 > 2016归档

    腾讯优图在OCR文本检测领域再获佳绩

    2017年03月06日 19:47:25   来源:中国网

      自去年始,人工智能在60周年之际迎来了第三次浪潮,消费级爆发的征兆也开始逐渐显现。在无人驾驶、人机大战这些热门词之外,一些更加贴近消费端的技术已经实现了突破并逐渐走进实际应用场景,智能OCR技术就是值得关注的一个。近日,腾讯优图团队在国际权威的ICDAR 2015“Robust Reading Competition”的自然场景文本检测项目中,以优越的表现超越众多竞争对手,取得了排名第一的佳绩。与此同时,腾讯优图团队的OCR技术已经在越来越多地应用到实际的场景中,推动整个文本检测领域的消费应用升级。

      关于ICDAR:即国际文档分析与识别大会(International Conference on Document Analysis and Recognition),是国际模式识别协会(IAPR)举办的文档分析与识别、模式识别领域世界上最权威的国际学术会议之一,每两年举办一次。

      自然场景文本检测技术升级优图团队优化OCR技术应用

      作为ICDAR 2015“Robust Reading Competition”比赛的重要组成部分,自然场景文本检测任务是将自然场景图像中的文本区域定位出来,为OCR技术的关键步骤。与传统OCR相比,自然场景文本检测更为复杂也更具有挑战性,如文本的多样性会受到不同的语言、字体、颜色、字形畸变、模糊断裂等现象的影响,还需要面临各种不确定性问题,如自然场景中与文字相似度极高的树叶纹理、窗格和复杂背景等。

      腾讯优图能够在自然场景文本检测项目中取得第一名的佳绩,在于优图团队使用深度学习技术来构建OCR的文本检测和文本识别模型。一方面,分析和抽象出中英文文本的共性特征,在现有前沿CNN(卷积神经网络)技术基础上,设计更适合于文本检测和识别的网络模型,提升模型学习能力和泛化能力;另一方面,腾讯海量数据优势保证了训练样本的高质量和多样性。

      图示:自然场景文本检测示例

      OCR技术场景应用可观初现人工智能消费级拐点

      与引发众议的人机大战、无人驾驶等人工智能热词相比,OCR技术在当前更贴近消费端需求,也已经实现了越来越多真实场景中的应用落地。

      目前,优图团队的OCR技术已成功在名片识别、身份证识别、营业执照识别等项目中落地应用。另悉,优图全新版本的名片识别已完成内测即将上线,名片字段识别准确率达到90%以上,大幅领先其它竞品。此外,优图OCR技术还将广泛应用在广告图片文字识别、文档图片自动识别、各种单据证件识别等业务场景上,通过精准的自动文字识别来帮助各产品和业务提升效率、创造价值。

      图示:名片识别示意图

      随着人工智能时代的到来,智能文字识别也会是其中不可或缺的一环。据优图团队透露,未来团队将在OCR技术领域将持续投入,文本检测和识别技术会拓展更多语言支持、更复杂场景的支持、不断提升识别精度,还会结合的NLP语义分析来提升OCR的识别纠错能力。这些都将推动整个OCR技术在消费端的应用升级。除此之外,腾讯优图在人脸识别、图像理解和语音技术等多方面也都取得了领先的研究成果,并在QQ、QQ空间、微众银行、天天P图等产品中成功落地。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [编号: ]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。