• 首页 > 云计算频道 > 大模型

    行业大模型到了必须下场的时刻

    2024年04月08日 10:46:26   来源:数智前线

      如果说2023年是通用大模型的元年,2024年将是行业大模型落地元年。

      从去年底到今年初,各行各业正迎来大模型落地潮。“大家都马不停蹄的。”

      就在这样的热潮之中,政企市场的资深玩家浪潮云,在青岛发布海若大模型业务战略,定位行业大模型市场,首批面向政府、交通、应急、制造、医疗、农业六大行业,通过培育“三位一体”的数字生态创新共同体,加速行业大模型在百城落地。

      01

      大模型落地热开始了

      “大模型的行业落地需求来的又快又猛。”一位赶到青岛参加浪潮云数字创新生态大会的大模型落地服务商说。“从去年底到今年初,这样的氛围特别浓,大家都马不停蹄的,这个潮流来的太快了。”另一位现场人士说。

      一位正在与医院合作大模型落地的浪潮云人士说,原来每家医院都有自己的一个小生态,其他人想进入都有壁垒。“但我们现在用大模型去聊,医院都很开放。双方在一起碰撞的思路特别多,大家都愿意做出一些创新的东西。”

      在医院,一位科室主任告诉浪潮云人士,自己手下那么多博士,80%的时间都花在文书上了。“一点都不夸张。”另一位参观的服务商说,现在实习生就是在办公室写病历,根本接触不到患者。“所以他们就想解决这个问题。”目前,浪潮云与一家三甲医院合作,采用大模型的即时病例生成,准确率已达90%。

      在经历了近一年的市场培育和摸索后,各行各业正迎来大模型落地潮。背后根本的原因是,传统技术已不能解决企业当下面临的问题,而大模型在降本增效上确实效果明显。正是在这样的形势下,浪潮云正式发布海若大模型业务战略。

      “如果说2023年是通用大模型的元年,2024年从浪潮云的角度来看,是行业大模型落地的元年。”浪潮云首席技术官孙思清说,浪潮云正在与生态伙伴,跑通行业大模型商业闭环。

      02

      行业大模型必须下场

      去年,全国掀起了百模大战。“前期的同质化比较严重,大家尤其关注通用大模型的基础能力。”颜亮说,“但在后续的裂变中,我们意识到,大模型要能快速展现场景价值、快速落地,行业大模型必须下场。”

      现在各个城市已意识到这个趋势,都在加大行业大模型投入力度。

      那么,一个行业大模型是怎么炼成的?孙思清告诉数智前线,在每个行业,浪潮云都有“灯塔客户”,合作去训练行业模型。

      在数据方面,大模型的训练使用了公开数据、授权数据和私有数据。其中,公开数据集完全能对外,是浪潮云经过治理形成的;如果用到了行业授权数据,要保障不出域;而针对私有数据则是本地化的。“每个行业的数据安全分级不同,要根据不同的法规解决这件事。”孙思清说。

      “有些数据不容易确权怎么办?就在域内做模型训练,训练后模型能不能出域,就涉及到安全审查或安全评估。”颜亮进一步分析,“因为模型可以加噪,如果技术能证明原始数据是不可复原的,模型就可以出域,这是下一个课题,业内还在探讨。”

      在训练行业大模型时,浪潮云会沉淀每个行业的通用智能体,这是一些共性应用,发布在智能体商店。每个行业智能体商店将覆盖200多个典型应用场景,加快复制推广。行业大模型在进入企业或政府内部,可以再结合专有数据、专有场景调优。

      “行业大模型落地的一个特点,是必须有一个对专有数据的精调过程。”颜亮说。

      “从浪潮云来讲,我们必须跟别人不一样,会考虑标准化、规模化,同时一定会考虑定制化。”孙思清说。

      有趣的是,通用大模型参数已经从上千亿走到万亿级,但在浪潮云在行业落地中发现,参数不是越多越好。“在行业中,我们认为7B-70B性价比最佳。”孙思清说,因为国民经济共有97个行业,每个行业采用的数据集通常是2T、3T,不会很大。这一实践得到不少服务商的认同。

      对于大模型落地路径,业界有不同观点。“大家现在有一个很大的概念,叫做大模型的原生,但我不这么认为。”颜亮告诉数智前线,“我们的想法是针对原有的生产系统或管理系统,植入大模型能力,这既能快速体现行业价值,也能对原有架构挑战最小。”

      现场一位资深服务商表示赞同。他们从去年开始与一些地市合作,将行业大模型植入到原有的投诉举报系统,实现了效果提升,目前已在几个地市推广复制。

      当下大模型处于场景点的挖掘,颜亮认为,要真正让行业产生质变,大模型需要全流程植入。这可能需要1-2年,其中关键是大模型要经过周期性迭代,才能达到可用。“最多两年时间。竞争会促成大家的互相学习和投入,我们感知到,2024年用户在大模型上的投入,是2023年水平的3-4倍以上。”

      03

      行业落地关卡和三个解法

      在这一年的实践中,浪潮云观察,政企用户在接纳、落地行业大模型上,要过四大关卡:

      首先是数据隐私的保护和合规,这是客户的底线,这个问题不解决,很多行业客户就不会进场;其次是复杂的定制化需求,这是政企行业的基本要求;再次是人工与智能的协作,这是当下每个人都面临的新变化;最后是持续的学习和优化,大模型落地不是一个项目,而是服务与运营。

      浪潮云也摸索出三个解法,将其提炼为可信赖、易落地和可持续。

      首先是可信赖,核心要解决的问题是本地化部署。政府有明确的“数据不出域”的边界,行业和企业也有“模糊的”数据不出域的边界。本地部署是行业大模型的必备条件,满足用户的底线要求。

      其次是易落地。大模型企业要提供完整的产品矩阵。“算力一定是大模型厂商带着入场的。”颜亮说。数据治理能力是必不可少的。而大模型引擎是最基本的要求。要在行业里实现价值,要靠智能体工厂,这是一个面向行业的人工智能低代码开发平台。最终,做出的智能体要发布到商店里。

      最后是可持续。“如果不可持续,得不偿失,因为我们去做一个大模型验证的试验环境,投入量级都是几百万元。”颜亮在大会上介绍说,我们建议“平台+服务”模式,购买MaaS服务。从持续性上看,核心问题是数据的持续供给,现在95%的政企客户,数据质量不高,要做数据治理。

      浪潮云在这三方面已有明确布局。浪潮云已在120个城市部署了云中心。预计今年6月,基于浪潮政务云,会在90个城市部署大模型引擎和智能体平台,提供从底层分布式算力,到上层治理好的数据集,再到上面的海若大模型、智能体工厂和智能体商店,以及安全卫士的整个体系。

      在这样的体系下,云上的政务客户,在一天内可以接入大模型,开箱即用。在云中心覆盖的城市,不能直接用政务云的非政务客户,浪潮云一周可以在云中心内为企业和行业做部署;如果是基于客户自有云中心或第三方云中心,部署周期为一个月。

      04

      大模型的“三位一体”创新生态

      大模型带来了新的生态结构。颜亮告诉数智前线,这是一个“三位一体”的创新共同体,分别是算力层生态伙伴、行业数据层生态伙伴,以及智能体运用生态伙伴。

      从算力角度讲,浪潮云自身有一定算力,但因为大模型下场会带来很大的算力消耗,所以各地建设的算力中心,包括政府平台公司建设的算力平台,都在浪潮云的生态伙伴范畴。

      在智能体开发商伙伴方面,大模型也改变了传统的开发形态。软硬件厂商、端厂商会融合起来一同创新。比如在医院病历生成应用中,医生会挂采集端。“我们甚至有个想法,是把模型小型化之后,植入到采集端,突破效率、环境的局限性。这在发展之中。”颜亮说。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。