华兴资本集团严正声明HTX DAO x 路遥LOYAL慈善纪录片正式上线:以去中心化理念书写Web3慈善新篇章Valve官方否认重启Steam Machine项目,与AMD合作仅为驱动程序改进电动车退潮:保时捷战略转向燃油、混动,力挽销量颓势三星 Galaxy F16 5G 手机被曝 6000mAh 大电池、天玑 6300 芯片1月全国新能源乘用车销量增长31%,小米汽车销量首次超越问界大数据助力青年创业就业,启信宝获中国青年创业就业基金会感谢信高端化趋势不断!2024年智能手机均价创历史新高告别E3,ESA打造全新游戏盛会“iicon”,索尼、任天堂、微软确认参会Take-Two确认继续支持任天堂平台, GTA6登陆Switch 2可期英伟达RTX 5090和RTX 5080显卡供不应求,华硕和微星美国官网悄然提价销量减少,市场份额下降,日媒称iPhone在中国市场神话破灭腾讯云:在国内率先上线 DeepSeek 模型 API 接口 + 联网搜索功能松下、京东大动作震惊业内!中国家电企业全球并购成2025年关键词?2025春节“冰雪热” 家电行业开年大搞“冰雪营销”2024年中国智能投影销量同比上涨3%,预计2025年同比上涨4.8%5.84mm!三星 Galaxy S25 Edge 迎战苹果 iPhone Air,争夺“最薄旗舰手机”头衔SimilarWeb:DeepSeek 官网全球日访问量已超越谷歌 Gemini华为之后第二家!荣耀手机接入DeepSeek-R1:升级系统即可体验2024年中国电视出货量3596万台创15年新低,2025年值得期待
  • 端侧AI随时上云?这套端边云协同方案给出了新解法

    2025年01月07日 09:15:40   来源:智东西公众号

      AI手机、AI PC、AI眼镜等智能设备正逐步AI Agent化,但这些小型终端要用上大模型能力,还差一把关键钥匙,即一套端边云联动的解决方案。

      智东西1月6日报道,目前,大模型行业正呈现出端边云协同,以加速端智能场景落地的新趋势。

      过去一年,智能门锁、AI看护机、AI眼镜、无人机等多种形态的端侧AI产品密集涌入市场,主打轻量化部署,其内置的AI模型通常小而易用。然而,端侧设备的功耗和算力仍十分受限,涉及复杂计算的推理任务正在向边缘和云端转移。

      换句话说,大模型所具备的算力优势与小模型侧重的低成本部署之间,还缺少一座连接的桥梁。字节跳动旗下的云服务平台火山引擎给出了它们的最新解法。

      在2024年冬季火山引擎FORCE原动力大会上,火山引擎边缘云官宣全面升级其智能边缘,优化了物联网平台、智能平台、边缘大模型网关服务,并推出了边缘原生智能体。这可以看作是一整套基础设施,可以用这个系统连接起端侧小模型应用和边云大模型能力。

      火山引擎边缘智能技术负责人谢皓解释道,端侧主要提供了OneSDK一站式解决方案,使得端侧的嵌入式设备也能用上大模型;边缘侧上线了大模型网关,提升了大模型调用过程的效率和稳定性;中心侧会编排一些智能体,降低大模型部署应用的难度;而边缘原生智能体可面向不同行业定制个性化的智能体。

      对于边缘智能最新技术优势、边缘智能新应用场景和边缘智能下一步发展重点,谢皓也向智东西分享了他的看法。

      他认为,边缘AI的发展当前可以分为基础设施和应用场景两个方面来看,前者主要负责解决连接和计算问题,并提供大模型调度和计算推理能力。而边缘AI应用场景的发展目前仍受限于碎片化和难规模化,谢皓称,一套支持端边云联动的智能边缘架构多数情况可复用,在一定程度上能拓宽边缘AI的部署范围。

      为什么要强化AI Agent与大模型的连接,如何安全地实现计算任务的端边云协同处理,边缘智能解决方案能应对AI Agent时代的哪些难题?与火山引擎边缘智能技术负责人谢皓深入沟通后,我们详细拆解了一站式边缘智能解决方案的两大技术优势。

      01.

      大中小厂都在用

      AI Agent调动大模型有新招

      从卷大模型技术到卷大模型应用,2024年AI Agent生态迎来了小高潮。据Cookie.fun最新数据显示,截至2025年1月4日,AI Agent整体市值已经达到173.6亿美元,过去7天的涨幅接近50%。

      除了资本市场热度升温,AI Agent自身能力也得到快速发展。《福布斯》2024年12月底援引业内人士观点称,预计2025年将出现能够依据简短提示词执行复杂任务的AI Agent。

      在LangChain一份针对2024年AI Agent现状的调研报告中,1300多名受访者超半数已经在生产过程中使用Agent。其中员工规模介于100至2000名的中型公司占比63%,最常用Agent来为生产过程提效。

      如果该调研进一步扩大筛选范围,把有计划应用AI Agent或正在开发AI Agent的公司都算在内,那么AI Agent的潜在和实际用户比例则高达78.1%。

      这也意味着,过去一年大多数公司有意愿引入AI Agent,但可能实际部署时遇到了各式各样的绊脚石,从而滞后了相关计划。其中可能不乏一些早前积累了AI模型资源的公司,那么基于一个更通用的边缘AI基础架构,按需把AI模型能力迁移至端侧设备,或许是其新的出路。

      据公开信息显示,国内的润欣科技、地瓜机器人、上海一高校等不同领域的公司和单位,都开始加速落地大模型,以刺激业务增长。而这背后用到了火山引擎的边缘智能基础架构。

      为了更好地适应AI Agent时代,该边缘智能基础架构优化了4大方面,包括简化端智能接入流程,提升边缘云推理请求的加速性能、推理能力和安全性,增强大模型文件分发、智能体配置等功能,以及新增了多个行业智能体。

      谢皓接受智东西采访时提到这套解决方案所涉及的AI模型,云上服务主要使用豆包大模型,而解析提示词等步骤则会用到一些带有行业属性的、自家微调的传统CV模型,或者开源的小模型。

      02.

      会节约算力的智能决策器

      隐私安全为最高优先级

      通常情况下,AI Agent需要依赖云端服务器为其提供大量的算力和算法支持,但同时也面临着算力资源争抢和部署成本高昂的问题。相对于云服务而言,端智能在本地设备等端侧处理计算任务,能够有效降低时延和运算成本。

      端智能在落地过程中可能会遇到以下四个方面的挑战,包括多平台集成、多SDK适配、多重设备身份管理和多种模型协同。对于上述多点联动的难题,火山引擎边缘智能上线了OneSDK、OneCredential和OneStop端智能一站式服务解决方案。

      1、一站式软件开发端智能解决方案OneSDK

      端侧会集成一个软件开发工具包(SDK),基于该SDK可一站式解决在线升级(OTA)、日志记录、远程登入、设备管理等设备运维需求,设备密钥、设备证书等设备安全需求,以及多模型和多智能体调用的设备智能需求。

      同时,端侧还提供硬件抽象层(HAL)接口,以便在实时操作系统(RTOS)、其他嵌入式操作系统以及无操作系统的设备上迁移SDK。

      2、一站式跨云服务权限端智能解决方案OneCredential

      该解决方案支持云上多个平台间的身份互认和权限穿透,使得设备端可共享一套密钥和证书,从而允许访问边缘大模型网关、物联网平台等多项服务。

      这一举措将有效降低设备端的资源占用,以及多份证书的重复创建成本,并且也避免了重复身份认证所带来的额外服务调用。同时,在满足安全性的前提下,该做法还提升了设备端的整体性能。

      另外,在OneCredential端智能解决方案中,每个设备粒度可按需token配额,以提供针对端侧更划得来的计量和计费策略。

      3、一站式企业部署端智能解决方案OneStop

      通过深度融合端云技术,OneStop主要为企业降低了端侧智能体的开发与接入门槛。

      不过,上述端智能解决方案虽然给端侧设备接入AI Agent提供了更多技术支持,但还不能一揽子突破端侧AI的算力上限。由于算力和内存等条件的限制,端侧AI大多采用的是小模型,这也导致其难以兼顾一些复杂的计算任务,或者更加多元化的应用场景。

      如果AI Agent消耗算力时,也可以“吃多少拿多少”,自行匹配每次计算任务是调用端侧的小模型,还是边缘或云端的大模型,便能以性价比更高的方式应对较为复杂的人机交互场景。火山引擎边缘云2024年年底推出的智能决策器,就充当了这个分配过程的总控室。

      据公开信息显示,该智能决策器可以依据提示词等信息,将任务按需分发至本地、边缘或云中处理。AI Agent推理请求难点主要是其对提示词的理解,因此该智能决策器的前端设置了一套提示词解析流程,即借助一个本地边缘大模型解析提示词,然后通过中心位的智能路由把解析结果传输给智能决策器。

      那么接到一个计算任务时,该智能决策器如何界定需要用到本地、边缘还是云端的AI模型来处理呢?

      其对于计算任务复杂程度的定性主要考虑两大方面,一方面是基于规则的静态决策,会综合考虑功耗、机型和温度等因素;另一方面是基于模型的动态决策,会从小模型、隐私判断和任务判断等维度考量适用情况。

      但当决策结果出现矛盾时,数据安全和隐私将成为首要考虑原则。其决策先后顺序大致分为以下几步:计算任务的安全和隐私级别较高时,智能决策器的推理过程被要求仅调用本地模型;而计算任务的安全和隐私级别适中时,智能决策器再结合计算任务的复杂程度分流,涉及隐私的优先在本地处理,较为复杂的则倾向于调度至边缘或云端开展推理。

      以智能座舱为例,车内摄像头可能会拍摄记录到一些涉及隐私的对话和行为,谢皓称这种情况下智能决策器会倾向于本地化处理,但如果是需要联网、涉及影像插件等较为复杂的操作,更多时候会交给云上大模型处理。

      在智能决策器决定将推理请求转发至本地设备外的过程中,具备标准接口、就近访问、推理加速和高鲁棒性四大核心能力的火山引擎边缘大模型网关,会提供进一步的支持,以提升边缘和云端“大脑”的访问效率。

      具体来看,在标准接口方面,边缘大模型网关适配约20家主流大模型厂商,以及多家智能体提供商,实现与OpenAI相一致的标准接口,从而简化了开发流程。

      在就近访问方面,边缘大模型网关通过全球范围的边缘节点和智能流量调度策略,来实现端侧设备的就近快速接入,并降低延迟。

      在推理加速方面,边缘大模型网关采用了多种缓存技术和边缘推理方法,有效提高了查询速度,并增强了整体性能。

      在高鲁棒性上,边缘大模型网关设置了跨模型厂商的故障迁移机制,并应用了错误重试策略,以此增强请求处理的鲁棒性,使得计算任务处理的连续性和可靠性更强。

      03.

      能联动四方的边缘原生智能体

      支持AI Agent就近上云

      边缘原生智能体是AI模型端侧落地的一个重要形式。

      火山引擎方面提出了边缘原生智能体的四大必备能力,包括理解设备能力、连接物理世界、单智能体协同和多智能体协同。这也各自对应了人机交互场景中动态捕捉和理解信息、自主感知或操作设备、单智能体完成特定任务、多智能体配合完成复杂任务的需求。

      其中,为了完善边缘原生智能体自主感知、操作设备的效果,火山引擎选择联动自家的低代码平台“扣子”,通过定制插件和工作流来实现边缘智能与家用设备、工业设备、车载设备等物理世界实体的连接。火山引擎方面称,目前边缘原生智能体已应用于相关智能数字工厂和智慧园区,涉及工业质检、园区安防等领域。

      现阶段,火山引擎边缘云的分布式云网基础设施在海内外共有2500多个边缘节点,其网络时延控制在较低的1至40毫秒区间,支持端边互联、边边互联和边云互联场景,从而实现智能应用就近上云。

      同时智能应用从端侧迁移到边缘或云端的过程中,无论是单智能体内部的端边云互传,还是多智能体之间的协同连接,都依赖于一个安全传输网络。对此,火山引擎边缘云在DDoS防护、边缘WAF和频次控制等传统安全防护措施的基础上,新增了针对AI Agent的边缘安全防护功能,包括提示词检测、系统提示词防御、结果检查等。

      04.

      结语:从各司其职到取长补短

      端边云协同成AI应用大势

      当前,虽然大模型种类、性能及其开发商都较为多元,可供支持部署AI Agent的选择比较多,但芯片、算力、能源等大模型相关资源仍处于僧多粥少的阶段,因此中小型公司在AI Agent的部署上,常常难以抢跑大公司。但如果只用成本较低的端侧AI,又还不足以覆盖公司所有的生产提效需求和场景。

      端边云协同处理AI任务将有效降低AI应用部署的成本,节约算力和功耗,进一步降低中小型公司引入AI Agent的门槛。

      同时,支持端边云协同的边缘智能基础架构,有助于不同行业快速借鉴、定制可行的AI模型落地样本。从火山引擎边缘云现阶段公开的成果来看,具身智能、端智能芯片、智能玩具、创新教育等行业内都拿出了实战案例。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。