突破叙事尺度 刻画极致人物 迷雾剧场《漂白》1月17日上线爱奇艺1月20日手机数码国补落地京东 超千万国补商品等你挑选超千万货品已备足 1月20日来京东购手机享国家补贴每件最高500元拥抱创新科技,探寻体育变革之路—— 第二届LALIGA EXTRATIME体育行业论坛在京成功举办斑马技术《2025全球消费者调查报告》:注重防损管理,增强顾客体验终端创企Nothing拟募资1亿美元 一加联合创始人创立恩智浦获欧洲投资银行 10 亿欧元贷款,用于在欧多国研发创新工作入手松下ZS99相机新品首选京东 售价2998元可先人一步入手1月20日打开京东搜索「1」 3C数码“疯狂星期一”爆款低至1元当代年轻人用上AI,从夸克开始消息称iPhone SE 4将有白色和黑色 预计3月份推出全球PC市场迎来温和复苏:2024年出货量增长1.3%,联想和苹果表现亮眼比亚迪已在韩国推出Atto 3 预计2月中旬开始交付发展新质生产力 赋能健康产品力 ——劲牌有限公司2024年度科技责任(成果)报告美光减产后 SK海力士也计划将上半年NAND闪存产量削减一成赵明离职信曝光:离开荣耀是人生中最艰难的决定消息称京东服饰换帅,阿里前高管担任负责人这年头,谁在互联网上学这么“硬核”的AI?开战2025,本地生活商家「另辟蹊径」年底Mini LED电视到底怎么选?认准这些新技术不踩雷!
  • 首页 > 云计算频道 > 大模型

    扫描全能王“智能高清滤镜”上线!AI自动“美颜”文档图片

    2023年08月15日 16:21:43   来源:中国网科学

      现阶段,手机扫描正越来越多地进入到人们的生活中。随着扫描应用场景的不断拓宽,诸多细节的问题逐渐显露,比如使用者在拍照扫描文档时,手指不小心“入镜”了,只能重拍;拍电脑屏幕时,画面上有一些彩色条纹,既不美观也影响内容识别;拍完照片后发现文档很杂乱,扫描时需要手动叠加好几种图片处理方案,才能获得理想的效果……这些“糟心事”,如今被一个滤镜轻松解决了。

      近期,合合信息旗下扫描全能王“智能高清滤镜”正式上线。该功能基于AI技术及智能扫描引擎,可自动检测图像中存在的问题并判定图像的优化方式,实现模糊、阴影、手指、屏幕纹等干扰因素一键全处理。使用者无需思考拍摄角度、光源、背景,只要点击单拍、多拍、扫描等任意拍摄按钮,便可得到一张如原稿打印般清晰、平整的图片。

      扫描“一键到位”的背后,AI在帮人“思考”图像问题

      与传统的手机扫描流程相比,扫描全能王“智能高清滤镜”的亮点之一,便是让AI代替人去“思考”图片中需要解决的问题,并为用户自动选择出最优处理方案,通过算法上的智能研判,达成多个问题一键解决的效果。

      据合合信息扫描全能王事业部负责人曹超阳介绍,“智能高清滤镜”的智能研判主要基于精准的图像感知,来达成场景化的决策效果。在图像感知阶段,AI通过深度学习模型进行图像特征获取,感知到图像中的光照、阴影、颜色和倾斜角度等特征并对应进行图像处理,例如去除手指产生的遮挡、感知到图像是过暗还是过亮,然后针对性地调整图像的亮度和对比度等。

    image.png

      扫描全能王“智能高清滤镜”的去摩尔纹处理效果展示

      场景化决策即根据图像感知的结果,判定图像属于何种场景,并进行个性化的处理。例如,试卷、发票的图像特点不尽相同,“智能高清滤镜”能够迅速判定文档种类并进行处理方法决策,在办公文档电子化、教育资料处理、商务资料留存等涉及文档处理的场景中具有广阔的应用前景。

      智能扫描引擎,让AI读懂图像与文字

      “智能高清滤镜”多项“黑科技”功能的实现,离不开智能扫描引擎AI-Scan(简称“AI-Scan引擎”)的支持。AI-Scan引擎基于合合信息智能文字识别、智能图像处理技术,对图像处理、文字识别及版面还原进行全面优化,综合提升扫描效果。

      图像处理对于文档处理中所涉及的文字识别等后续流程非常关键,目前还存在着许多典型的痛点,最常见的就是“图像视觉矫正”。现实生活中,书本等文档并不总是平面的,AI在处理相关图片时需要进行“矫正”。此外,由于拍摄角度和镜头畸变的问题,即使是平面的文档,拍摄后也可能出现透视扭曲。扫描全能王采用了基于深度学习的曲面检测和矫正技术来进行处理,能够应对各种复杂的曲面文档。

    image.png

      扫描全能王“智能高清滤镜”书本曲面矫正处理效果展示

    image.png

      扫描全能王“智能高清滤镜”手指、阴影叠加处理效果展示

      完成图像处理之后,如何从图片中正确提取所需信息,与文字识别能力息息相关。全球化进程的深化,让多语种识别成为一项高频需求,也为文字识别领域带来了巨大的挑战。多语种识别的困难点主要来源于不同语种之间的独特字符集、书写规则和语法结构间的差异,以及复杂的文本形态和排版方式的影响。

      例如,阿拉伯语的书写方向是从右到左,而且同一字母在单词的不同位置有着不同的形态。对于这种语言,传统的文字识别方法往往难以应对;其他小语种如泰语和印地语,其书写系统相对复杂,有时一个字符可能会出现在另一个字符的上方或下方,是文字识别必须解决的问题。

      为了克服这些挑战,扫描全能王在AI-Scan引擎的支持下,采用了一种结合深度学习和自然语言处理的全新方法,能够有效地处理不同语种的字符关联和顺序问题。在服务全球亿级别用户的过程中,扫描全能王对大量的多语种文本进行预训练,能够对全球41个语种的文档进行识别,满足了全球超过100个国家和地区用户的办公、生活需求。

      “华盛顿邮报等媒体曾将扫描全能王称作‘手掌扫描仪’,因为这款产品实现了在低资源、性能低的移动设备下高准确率、高效率、高稳定性的识别体验。‘做小、做轻’是上一个阶段的任务,未来扫描会更多地与前沿技术的结合,进入智能化的时代。”曹超阳表示,在过去的十年里,扫描全能王是最早将图像处理、OCR、深度学习等AI技术综合运用的APP之一。未来团队将持续保持对AI底层技术的关注,用科技为全球用户提供有价值的文档智能服务。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。