“我们正处在第四次工业革命的阶段,每一次产业变革的核心驱动力都是科技创新。当下,人工智能技术日趋成熟,像以往每一次工业革命的核心驱动技术一样,呈现出很强的通用性,并且已经具备了标准化、自动化和模块化的工业大生产特征,成为第四次工业革命的核心驱动力量。”百度集团副总裁吴甜在9月13日的“AI面对面”媒体沟通会上如是说。
作为百度人工智能多年技术积累和产业实践的集大成,百度大脑已然具备了上述特征,并构建了包括基础层、感知层、认知层、平台层和AI安全的全面技术布局。基础层包含算力、数据和飞桨深度学习平台,是支撑新一代人工智能快速发展的核心基础;感知层包括语音、视觉、虚拟现实和增强现实技术,使机器像人一样拥有视觉、听觉等能力,对世界有感知和感应;认知层包括语言与知识技术,是让机器像人一样,掌握知识、理解和运用语言,具备认知能力;通过平台层,百度大脑和千行百业有非常重要的联系,通过开放平台支持到整个行业智能化升级;安全体系则纵贯百度大脑各层,为AI技术及应用保驾护航。
在前不久的百度世界2021上,百度大脑宣布升级到7.0,具备“融合创新”和“降低门槛”两大显著特点,这背后是基于对趋势的深刻洞察。“目前以人工智能为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革,在新的发展阶段,人工智能技术越来越复杂,融合创新正在成为新常态;同时,随着人工智能技术在各行业的渗透,面向不同应用场景,降低门槛也变得越来越重要。”吴甜表示。
融合创新,让AI能力更强大
百度大脑的“融合创新”主要体现在“知识与深度学习融合创新、跨模态多技术融合创新、技术与场景融合创新、软硬一体融合创新”四个方面。融合创新使百度大脑的AI能力越来越强,更能满足“工业大生产”的需求。
1、知识与深度学习融合创新
在知识与深度学习融合创新方面,百度打造了拥有5500亿知识的多元异构超大规模的知识图谱,发布“知识增强大模型”——ERNIE(文心)3.0,将大规模知识和海量的数据进行联合训练,从而让百度大脑具有更丰富的知识,将语言理解和语言生成统一训练,从而使百度大脑具备更强大的语言理解、推理、文学创作等能力。文心曾一举刷新54个中文 NLP任务基准,其英文模型在国际权威的复杂语言理解任务评测SuperGLUE上,登顶全球榜首,首次突破90分大关,刷新榜单历史,超越人类得分。
百度的另一大规模隐变量端到端对话模型PLATO,同样也是知识与深度学习融合创新的成果,它可就开放域话题进行有内容、有逻辑、连贯的深度畅聊,在中英文效果上已全面超越微软DialoGPT、Google Meena、Facebook Blender等先进模型。小度人工智能产品凭借与用户多轮对话的能力而广受认可,而这正得益于PLATO模型的支持。
2、知识增强的跨模态深度语义理解
在跨模态多技术融合创新方面,通过融合了语言、语音、视觉等不同模态的技术,百度大脑得以像人类一样,实现对复杂真实场景的跨模态深度语义理解,进而获得对真实世界的统一认知。比如,针对一张球赛图片,机器过去只能识别出人员数量,如今机器可以推理出谁是教练,谁是运动员,以及各自的行为。这背后,正是基于跨模态深度语义理解模型的推理。基于这一技术能力,百度在视觉常识推理、视觉问答、引用表达式理解、跨模态图像检索、跨模态文本检索等5项典型多模态任务中刷新了世界最好效果,并在多模态领域权威榜单视觉常识推理任务(VCR)上超越微软、谷歌、Facebook 等机构,登顶榜首。
百度大脑在图像语言一体化理解上,通过知识增强的多模态特征融合与结构化关系图分析,提升OCR应用的准确率;基于语音语言一体化理解的技术,使得语音识别及图像识别准确率大幅提升;跨模态多技术融合创新的代表性成果之一便是“数字人”,亮相央视五四晚会的AI虚拟主持人晓央,全球首个火星车数字人“祝融号”,都给大众留下深刻印象。在百度世界2021上,百度CTO王海峰用短短两句话,就让百度大脑生成了数字人,并为他“换”上了航天服,背后正是跨模态多技术的融合创新。
3、技术与场景的融合创新
从应用角度,不同领域都有各自的特点和难题,AI 技术深入到实际应用场景中,与场景融合创新。
比如AI与搜索场景融合创新的智能搜索引擎,已具备图谱问答、推理计算、智能推荐、语义理解、智能排序、深度问答等能力,可深刻理解用户意图,并结合语音、图像、AR等感知技术能力,更便捷地与用户交互,为用户提供更精准、更便捷的信息服务。
在翻译场景下,高质量、多语言的产业需求,遭遇计算复杂度高、漏译等问题突出,以及资源稀缺、部署复杂等技术挑战。而百度的AI同声传译技术,通过机器翻译、语音技术与同声传译场景融合,攻克以上挑战,成功实现了高质量、低延迟的同传效果,翻译准确率超过80%,时延3秒,与人类水平相当,已经服务了2020全球人工智能技术大会、2020全球人工智能产品应用博览会,以及连续两年的中国国际服务贸易交易会,总观看量接近500万次。
而在办公会议场景下,智能工作平台“如流”可以实时记录参会者的对话发言,并基于自然语言处理技术自动提取对话内容的关键要点,从而快速生成会议纪要,在此前的百度世界2021上,已经一显身手。
产业则是技术与场景融合创新的广阔用武之地。比如在工业场景中,百度用AI打造安全可控的工业智能基础设施,赋能设计研发、生产制造、供应物流、销售经营、客户服务、综合保障等环节,助力企业降本增效、绿色双碳、智能升级。
借助百度大脑的AI能力,化纤行业部署AI质检设备,较既有检测设备能力提升50%;能源领域部署AI中台,实现变电站人工巡视工作量下降40%,输电线路缺陷人工图像复查量下降60%;区域工业互联网实现了6类产业的广泛覆盖,可监测300亿工业产值。
在金融业务场景中,数字员工、远程银行、智能营销、产业金融平台等智慧金融应用正在加速落地,助力营销、审核、风控、客服等环节提质增效,辅之以百度AI自主创新、安全可控的特点,助力中国金融基础设施与服务升级。
基于百度大脑技术的智慧城市解决方案,正在雄安洞察城市发展,在丽江实现城市大脑精准治理,在上海张江为产业赋能,在成都落地智能无感停车应用。
有百度大脑技术加持的循证AI赋能基层医疗,联合爱尔眼科医院打造眼底筛查机,让眼疾筛查更便捷;在湖北省基层医院落地辅助诊疗,让优质诊疗更可及;落子国家级糖尿病医防融合试点,让慢病管理更规范。
基于百度大脑技术的智慧媒体解决方案,正通过全链条生产、全方位安全、全渠道分发、全场景应用等特征,赋能媒体创作全链条,助力媒体行业数智化转型升级。
由百度大脑技术打造的智慧体育应用,通过AI助力打造冠军模型,推进体育训练的数字化、科学化,为中国跳水队定制的3D+AI跳水系统,实现了20%的训练效率提升。
4、软硬一体融合创新
在软硬一体融合创新方面,硬件设计与软件算法融合,会产生1+1>2的应用效果。百度自主研发的云端通用AI 芯片——百度昆仑,针对语音、自然语言处理、图像等AI技术优化,可支持飞桨等深度学习框架,灵活支持训练和预测,使得AI模型计算效率更高、应用效果更好。百度世界2021上正式官宣量产的昆仑2芯片,采用7nm制程,搭载第二代XPU架构,相比一代性能提升2-3倍,年底前可实现推理卡的交付。
针对远场语音交互研制的芯片——百度鸿鹄,由软件定义,更契合深度学习模型计算,可实时处理远场阵列信号,360度唤醒和识别,让人与汽车、智能家居等设备的语音交互更便捷、更流畅。
同时,百度也与合作伙伴一起构建软硬一体的生态,比如飞桨平台目前已经适配30多款芯片。
降低门槛,让AI应用更容易
百度大脑的“降低门槛”,让开发者更容易获得AI能力。降低门槛主要通过百度大脑的核心基座——飞桨深度学习平台来实现。
飞桨是百度自主研发、国内最早开源开放、功能丰富的产业级深度学习平台。在IDC 2021年上半年深度学习框架平台市场份额调研中,百度位列中国深度学习平台市场综合份额第一。
作为源于产业实践的深度学习开源开放平台,飞桨一直致力于满足不同行业、不同阶段、不同类型开发者的需求。
吴甜分享了飞桨与企业伙伴广泛合作中观察总结的AI工业大生产路径。她认为,企业应用AI的过程分三个阶段,第一阶段是AI先行者探路阶段,即企业中有少数先行人员尝试引入AI进行原型验证;当进行了验证产生效益后,会从个人实践转变成建设团队来学习和应用AI,这便进入第二阶段——AI工作坊应用阶段;当企业进行大量的AI应用,几百、几千人一起工作,多人多任务协同生产,就进入了AI工业大生产阶段,更长期看,还会实现社会化协同大生产。
飞桨以全面而丰富的技术、功能、产品和服务,支持着合作伙伴应对各个阶段的困难,实现阶段的跃迁,将AI越来越多且深入地引入到自身业务中。譬如,在AI先行者阶段,源于产业实践的模型库可支持高效原型验证,全面且灵活的硬件适配和生态基础可保障AI落地应用;在AI工作坊阶段,丰富且多层次的产品结构可助力团队应用AI创新;在AI工业大生产阶段,企业级AI开发平台可实现支撑多人多任务协同全流程开发效能的提升。
除了提供丰富工具,帮助开发者快速、高效地使用AI技术。百度还意识到,加速AI工业大生产,还需要会算法、懂业务、知工程的复合型AI人才。为此,百度以飞桨为创新基座,联合学术界和产业界,共同培养AI人才,目前已构建起涵盖学习、实践、比赛、认证、就业在内的全周期服务体系。
面向企业,飞桨设立了AICA、AI私享会、AI快车道等培训项目,培养CTO、架构师、技术负责人、算法工程师等不同层级的AI人才;面向高校,飞桨为学生提供教学资源和工具、实践平台与算力支持等,同时设立深度学习师资培训班,已培训690多所高校的超2900余名专业AI教师,支持270余所高校基于飞桨开设开设人工智能课程。据统计,百度已培养AI人才超过100万。未来5年百度还将继续培养500万AI人才。
截至目前,飞桨已有来自于各行各业的360多万开发者,开发了40万个AI模型,累计服务13万企事业单位。在工业、农业、医疗、城市管理、交通、金融等各行各业都有飞桨在发挥作用,人工智能应用的多样化和规模化随之加快。
十年布局,枝繁叶茂,百度大脑7.0正呈现勃发英姿。凭借日益强大的AI能力,以及飞桨平台与人才培养构建的AI落地沃土,百度大脑正在为千行百业亟待变革的产业肌体注入转型升级的关键助力,为建设数字中国、发展智能经济贡献力量。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。