• 百度的开放 不仅仅是种姿态

    2025年03月03日 10:58:02   来源:银杏科技

      对大企业来说,保守不单单是因循守旧,更多时候,则是无法与昨日成功的自己,奋力作别。

      可面对未来,百度还在持续张开怀抱。

      2月28日,百度官方公众号宣布,将于3月16日发布文心大模型4.5,继续自身开放的战略转轨,并且,一些更加明朗且积极的信号,也在该事件中悄然传出。

      按照百度的说法,即将全面开放的文心大模型4.5,将是百度最强的下一代大模型。尤其在基础模型能力上,文心大模型4.5将迎来大幅提升,且具备原生多模态、深度思考等能力。

      到了今年的6月30日,该模型还将正式开源,这或将带给用户更好的体验,以及对GPT-4.5发起全面挑战。

      不仅如此,算上此次文心大模型4.5推出,以及DeepSeek横空出世后,百度接连宣布文心一言免费和上线深度搜索功能,加上旗下搜索、地图、小度等相继接入了 DeepSeek,可以说,百度近期打出了系列“开放”的组合拳,无疑正以一种开放的姿态,直面行业的剧烈变化。

      而这一切,看似是战略的转变,实则,更是一种技术积淀的必然回响。

      百度让Open Ai脸红心跳?

      在DeepSeek掀起行业开放浪潮之时,百度,无疑是国内响应最为迅捷的企业之一。

      这一次,即将在3月16日发布的文心大模型4.5,或也将为行业聚光灯下,对百度“大模型”的期中大考。

      不过,据百度方面透露,文心大模型4.5在基础模型能力上已经有了大幅提升,且具备原生多模态、深度思考等能力,号称百度最强大模型。

      具体而言,此次文心大模型4.5,具有当前行业内几乎最强的RAG(检索增强生成)能力,而该能力,也是衡量大模型优劣的重要标准之一。

      为此,百度的RAG,可在大模型理解用户需求阶段,不断对知识点进行拆解,细化问题。到了检索阶段,又可向大模型展开搜索排序优化,并将搜索返回的异构信息统一表示,送给大模型。

      到了最终的生成阶段,百度RAG还可综合不同来源的信息独自判断,尤其加上百度实时和全面的搜索生态后,基于大模型逻辑推理能力,就可一举解决信息冲突等问题,从而生成准确率高、时效性好的答案。

      事实上,自文心一言发布初,百度便一直强调检索增强,随后经过近两年技术沉淀,百度的检索增强能力不断提升的同时,也让该能力的价值,受到业界一致认可。

      并且,百度即将推出的文心大模型4.5,更在百度自研的iRAG等技术加持下,可将百度搜索的亿级图片资源与自身强大的基础模型能力相结合,从而生成种类繁多的真实图片。甚至,iRAG可以做到在生成特定物品、特定人物以及特定人物与任意背景结合的图像时,在准确率、真实性上都有显著突破,极大减少幻觉。

      其呈现的整体效果,将会远远超过文生图原生系统,不仅能够去掉了Ai味儿,而且成本很低,在使用场景上,不论是影视作品、漫画作品,还是连续画本、海报制作等领域,无疑带给用户留有大量施展才华的空间。

      一个可以预见的例子是,在文心大模型4.5正式上线后,用户如果有品牌宣传的需求,则可以借助iRAG技术下,在几乎0成本操作中,像素极复刻以往大片宣传海报动辄需要一二十万,甚至大几十万成本的图片。

      此外,文心一言还将上线的深度搜索功能,可为用户提供专家级内容回复,实现多模态输入与输出。不仅如此,深度搜索功能下,还能提供多项工具调用,包含了高级联网、文档问答、图片理解等功能,在用户处理多场景任务中,效能无疑将得到极大提升。

      值得注意的是,先前的2月27日,百度准备发布文心大模型4.5消息一经公布,2月28日的凌晨,OpenAi则迅速发布了GPT-4.5模型。似乎,双方正在暗自较劲。

      不过,OpenAi的发布或许略显仓促。据报道,OpenAi前员工安德烈·卡帕西,曾提前体验了GPT-4.5后,认为GPT-4.5主要提升在非推理密集型任务上的改进,这些任务多与情商有关,而在数学、代码等领域,GPT-4.5并不拥有最强的能力。

      当然,GPT-4.5与文心大模型4.5双方具体表现如何,仍有待进一步验证。

      不过,从先前文心一言和ChatGPT对比来看,文心一言在中文语境与本土化上,往往有着GPT难以比拟的优势:尤其在问答准确性、实时性上,文心一言的幻觉较少,对时事的反应也更加迅捷。

      从这点上说,百度的文心大模型4.5的深度思考能力,加上自身极强的多模态功能,对中国用户而言,或许在未来能有更好的体验。

      例如,从RAG能力实测来看,在国内外主流大模型中,百度文心一言综合表现一直属于第一梯队。即使是春节档电影细节、春晚节目等内容,文心一言都可以准确回答,做到文能对题,相比之下,OpenAi虽能检索到信源,却无法生成准确回答。

      更重要的是,文心一言将于4月1日全面免费,PC端和App端用户均可体验。与之相对的是,GPT-4.5虽接入API,但OpenAi计划逐步转向GPT-5的免费基础版(额度受限),付费用户需升级至Plus/Pro版本。

      从这点上说,免费且开源的文心大模型4.5,起码在普惠性上,将带给用户更多的诚意。

      开放,不仅仅是一种姿态

      DeepSeek横空出世后,浪潮风波席卷全球。

      对此,百度却没有故步自封,反而动作频频,持续以一种开放的姿态,直面变化。

      此前的2月13日,文心一言就正式宣布,将于4月1日起全面免费,所有PC端和App端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级Ai绘画等功能,一举引起社会广泛讨论。

      一天后的2月14日,百度接着宣布,将在未来几个月陆续推出文心大模型4.5系列,以及在6月30日起正式开源。

      两天的2月16日,百度的开放,也延续到了对DeepSeek态度上:彼时,百度将全面接入DeepSeek和文心大模型最新的深度搜索功能。并且,搜索用户可免费使用DeepSeek和文心大模型深度搜索功能。

      在百度全面转向开源、开放的战略转轨下,百度旗下的搜索、地图、小度等也相继接入 DeepSeek,由此,Ai浪潮引发产品升级的红利,也不断分享到了更多百度系的用户。

      从大模型到搜索,百度的开源、免费,共同打出了一套开放“组合拳”。

      从这点上说,在李彦宏带领下的百度,无疑正展开了一场自我变革,此时,决心和勇气缺一不可。

      更重要的是,在这场开放过程中,又将会带给用户、公司、乃至整个行业哪些真正的价值?

      对此,先前李彦宏曾谈到,开源4.5系列的决策,源自于对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力:“我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。”

      可以说,大模型烈火烹油的两周后,以OpenAi、百度等为首的头部玩家,已将这场大模型的竞争,步步进逼,终于向应用层面全面进击。此时,百度也在用一种更加开放的策略,试图去占据大模型第二场的主动权。

      而在这场竞争中,更多应用层面的创新,无疑将惠及全球范围内,越来越多的用户。

      “技术”如何打败“故事”?

      “过去,我们谈论摩尔定律时,每18个月,性能水平或价格都会减半。但是今天,当我们谈论大语言模型时,增加的成本基本上降低了,可以在12个月内降低90%以上”

      百度CEO李彦宏在世界政府峰会上,曾如此说道。

      事实上,能够在DeepSeek冲击中迅速调整船头,而不一味固守“闭源”,这既是百度战略转折的勇气,也离不开百度长年以来技术沉淀的支撑。

      李彦宏曾谈到:“不仅在Ai领域或IT行业,回顾过去几百年的历史,大多数创新都与降低成本有关。如果成本降低一定比例,生产力也随之提高同样比例,这就是创新的本质。在今天,创新速度比以往都快得多。”

      事实上,Ai行业发展至今,“技术实力”正在取代“故事性”,逐渐成为该行业的核心竞争力。

      从这点上说,当下,能够撑起百度文心大模型强功能、快更迭、免费开源的根本,则源于百度在技术上的底气。其中,百度在大模型上训练成本的持续降低,也离不开百度昆仑芯和百舸平台的助力。

      近期,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮三万卡集群。

      值得注意的是, 昆仑芯万卡集群具有极强的规模效应,大规模集群可以通过任务并行调度、弹性算力管理等方式,提高计算资源利用率,避免算力闲置,提高单任务的计算效率,降低整体算力成本,最终实心可大幅提高资源利用率。

      这也意味着,在昆仑芯万卡集群规模效应的作用下,百度大模型的推理和训练所需的计算量一直在持续减少,从而直接降低算力成本。

      不仅如此,百度的百舸平台,还能对大规模集群进行高效的部署管理。

      例如,为解决大模型训练时高通信带宽的需求,百度不仅建设了超大规模HPN高性能网络,还可通过优化的拥塞控制算法、集合通信算法策略,提升了通信效率,将带宽有效性提升到90%以上。

      同时,由于万卡集群的能耗极高,常规的散热方案能耗可达十兆瓦或更高,这将提升企业进行模型训练的电力成本,为此,百舸还采用了创新性散热方案,可以有效降低能耗,进一步降低模型训练成本。

      此外,为提升GPU 的有效利用率(通常用MFU来表示GPU的有效利用率),百舸还在持续优化并完善模型的分布式训练策略,通过高效并行化任务切分策略,将训练主流开源模型的集群MFU提升至58%。

      以及,为了保证大规模集群执行训练任务的稳定性,百舸提供全面的故障诊断手段,可快速自动侦测到导致训练任务异常的节点故障。加上百度自研的BCCL,目前已经将故障恢复时间从小时级降低到分钟级,保障集群有效训练率达到98%。

      于是,当以上技术形成源源不断的合力后,到了24年初的财报电话会上,李彦宏则表示,文心大模型的推理成本,已经已降低至一年前的1%。

      此次文心大模型4.5能够迅速推出,最大的原因之一,或许源于推理成本不断降低。

      对此,有观点指出,百度在模型推理部署上的优势,尤其是在飞桨深度学习框架的支持下,其中并行推理、量化推理等都是飞桨在大模型推理上的自研技术。受此影响,飞桨和文心的联合优化,则可以实现推理性能提升,推理成本降低。

      而面对机遇与风险并存的未来,人们可以预见的是,文心大模型4.5的推出以及近期百度频频开放的动作,远远不是终点——

      “我们仍需对芯片、数据中心和云基础设施进行持续投入,来训练更好、更智能的下一代模型。”李彦宏曾谈到。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。