诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购京东“先人一步”预约OPPO Reno13系列 1元锁定腾讯视频VIP会员季卡万兆光网中国行:以应用为牵引,上海万兆加速启航消息称芯片制造商铠侠12月18日上市,将通过IPO筹资总计700亿日元谷歌安卓16打造端侧AI智能体:Gemini将成管家,代用户掌控应用交互
  • 首页 > 企业IT频道 > 人工智能

    人工智能未来十年走向何方? “CSIG企业行”合合信息专场联合专家学者开启“头脑风暴”

    2023年03月27日 17:00:26   来源:中文科技资讯

      3月18日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动成功举办。此次活动以“图文智能处理与多场景应用技术展望”为主题,特邀来自上海交大、厦门大学、复旦大学、中科大的知名学府的学者与合合信息技术团队一道,面向行内研究者分享图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等研究及实践成果。

      研讨会嘉宾合影

      “CSIG企业行”活动旨在汇集产学研各界资源,探讨图文智能信息技术领域的最新发展动态和未来趋势,共同推动图像图形领域的发展。会上,合合信息科技股份有限公司董事长、总经理镇立新博士发表致辞,并提到希望通过这次活动,创造产学研合作机会,为推动图像图形及人工智能行业的发展和进步贡献智慧和力量;CSIG文档图像分析与识别专业委员会主任金连文教授向与会代表介绍了中国图象图形学学会的组织架构、开展的学术会议、成果鉴定等服务,鼓励参会者积极参加学会的学术活动。

      合合信息董事长、总经理镇立新博士致辞

      CSIG文档图像分析与识别专委会主任金连文教授致辞

      理论探索:生成式人工智能将成为未来十年的研究重心

      据国际IT研究机构Gartner预测,到2025年,生成式人工智能产生的数据将占据人类全部数据的10%。生成式人工智能技术正加速数字经济的发展。“企业行”活动中,上海交通大学人工智能研究院常务副院长、长江学者杨小康分享了团队在生成式人工智能领域的工作,并表示,目前的生成式人工智能还存在解空间巨大、宏观一致性差、微观清晰度受限等问题,需要通过数学、物理、信息论、脑认知、计算机等学科交叉研究,进一步夯实生成式人工智能的基础理论,通过“物理+数据”联合驱动, “虚拟+现实”深度融合,助力科学发现的加速。

      上海交通大学人工智能研究院常务副院长、国家杰青、IEEEFellow杨小康教授进行《生成式人工智能与元宇宙》主题分享

      杨小康认为,以“识别——分析”为代表的判别式人工智能推动了人工智能前十年的发展,接下来十年,以“合成——重建”为代表的生成式人工智能将成为主流。

      近期频频上“热搜”的ChatGPT是生成式人工智能的典型代表。复旦大学计算机学院教授、上海市计算机学会自然语言处理专委会主任邱锡鹏提到,强大的情景学习能力、思维链能力和自然指令学习能力是以ChatGPT为代表的对话式大型语言模型的主要特点,将加速通用人工智能的实现。

      复旦大学计算机学院教授、国家优青、上海市计算机学会自然语言处理专委会主任邱锡鹏进行《对话式大型语言模型》主题分享

      据悉,今年2月,复旦大学自然语言处理实验室发布了国内第一个对话式大型语言模型“MOSS”,引发业内广泛关注,邱锡鹏是主要作者之一。“文本所承载的知识只是冰山一角,还有很多‘暗知识’并不是以文本形式记录的。在未来的发展里,人工智能还有‘具身学习、跨模态学习’等更多知识领域需要学习。”邱锡鹏说。

      学术前沿:复杂场景多模态数据分析与理解进展迅速

      人工智能要实现多场景“通用”,需要解决多源数据的问题。“文本、图像、视频是互联网上存量最大的数据,需研发相关算法对其进行有效管理。”厦门大学科技处处长、人工智能研究院负责人纪荣嵘教授认为,社交媒体等信息渠道包含了海量非合作、异构化、跨模态的数据,既蕴藏了大量的人类知识与高价值信息,也包含了各种自然与人为的噪声,对其分析与处理需要融合类脑计算、计算机视觉、自然语言处理等多个维度的智能技术。

      厦门大学人工智能研究院负责人、国家杰青纪荣嵘教授进行《复杂跨媒体数据协同分析与应用》主题分享

      纪荣嵘指出,连接视觉与自然语言的“视觉描述”领域,是最受关注且最具潜力的人工智能研究任务之一 。视觉和语言的研究应是双向的,各自的新发现、新方法可以互相迭代促进。跨空间、跨领域、跨任务知识迁移方面有较大探索空间,易于发现新的科学问题 。

      落地实践:图像文档结构分析、底层视觉技术发展受关注

      语言文字和视觉研究的融合也为技术落地创造出新的发展空间。近年来,人工智能与OCR(光学字符识别)技术的结合愈发紧密,图像文档中涉及的复杂结构如汉字结构、表格结构、文档总体结构的建模问题,逐渐成为研究热点。中国科学技术大学语音及语言信息处理国家工程研究中心副教授杜俊就团队在文档结构层次化重建领域的最新进展进行分享。

      中国科学技术大学语音及语言信息处理国家工程研究中心副教授杜俊进行《面向图像文档的复杂结构建模研究》主题分享

      “现阶段文档分析任务中,大多数研究是针对单页内的文章要素的解析,但从内容角度看,许多文档页与页之间内容有关联。”杜俊表示,图像文档处理能力要达到“篇章级”,突破手写、自然场景下的汉字建模难点,做好跨页文档的要素分类、文档结构恢复是团队的主要研究目标。

      底层视觉是智能文档处理的重要研究方向之一,主要研究如何提高或恢复各类场景下的图像、视频内容,如清晰度提升,低质量及破损图像恢复等,相关理论和方法在手机图像采集与处理,医疗图像分析等领域发挥着至关重要的作用。合合信息图像算法研发总监郭丰俊博士针对目前底层视觉技术在处理形变、模糊、阴影遮盖、背景杂乱的文档时遇到的典型问题,就公司技术团队在智能图像处理技术模块、融合技术典型应用、图像安全领域等领域的研究成果进行了分享。

      合合信息图像算法研发总监郭丰俊进行《文档图像处理中的底层视觉技术》进行分享

      郭丰俊提到,合合信息智能文档处理技术基于对图像目标区域的精准裁剪,对弯曲、倾斜透视的页面进行形变矫正,在去除阴影、摩尔纹后,通过人工智能技术对文档图像进行增强锐化和清晰度提升,达到“图像质量增强”的效果,在改善阅读体验的同时,也提升了识别转换、图像分析等文档处理下游任务的质效,相关技术已通过“扫描全能王”等智能文字识别产品,服务全球上百个国家和地区的上亿用户。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H001]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。