• 首页 > 产经新闻频道 > 科技资讯

    0.6秒!手机跑Stable Diffusion创下最快速度,而这仅仅是开始

    2023年11月16日 16:49:29   来源:中文科技资讯

      导语:如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式AI的魅力了。

      2023 已经行至尾声,这一年大模型和生成式 AI成为人工智能圈的主流趋势。自ChatGPT 出现以来,各式各样通用、专业的 AI 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝和知识蒸馏等模型压缩技术进步,手机等终端设备AI算力持续增强,大模型在云端部署之外正在向终端落地迈进。

    1700119921105038.png

      对于这场已经拉开了序幕的「终端侧革命」,芯片巨头和手机厂商们成为主力军,他们不断尝试在手机等终端设备上部署运行生成式AI大模型,时不时给人们一点小小的惊喜和震撼。

      今年2月,我们第一次看到了在手机上运行超过10 亿参数的文生图大模型Stable Diffusion。那是在一部搭载高通第二代骁龙 8移动平台的安卓手机上运行的,不到15秒的时间执行20步推理,生成了一张512×512像素的图像。这也创造了当时智能手机上最快的推理速度。

      你以为这就是手机运行Stable%20Diffusion的速度极限了吗?显然不是。在上个月举行的2023骁龙技术峰会上,不到15秒的生成时间又被整整缩短数十倍。高通最新旗舰移动平台第三代骁龙8(以下简称骁龙8%20Gen%203)让速度飞升成为可能。

      在峰会现场,高通用搭载了骁龙%208%20Gen%203的手机运行相同的Stable%20Diffusion大模型,这次不到1秒(0.6秒)的时间便在本地生成了一张图像。从15秒到0.6秒,终端侧生成式AI大模型的进化速度让我们惊叹不已。

      这只是高通在本届骁龙技术峰会上展示其终端侧AI能力的牛刀小试。除了生成速度(从%2015%20秒到%200.6秒)有了质的飞跃,骁龙8%20Gen%203将支持运行的大模型参数规模(从10亿到百亿)提升一个量级。

      大模型赋能平台也不再局限于手机,高通下一代%20AI%20PC%20芯片骁龙X%20Elite亮相,将百亿参数大模型「塞进」PC平台,极大拓展了生成式AI应用的广度。

      至此,高通在终端侧AI领域积累起来的领导力和技术领先性进一步得到加强,更赋予了手机、PC,甚至耳机等厂商更多终端AI落地的想象力和可能性。

      双平台并进,让生成式AI更加触手可及

      自今年2月以来,高通先后在搭载第二代骁龙8移动平台的安卓手机上运行Stable%20Diffusion、ControlNet,让大模型跑在手机端成为现实。此次骁龙峰会上发布的骁龙%208%20Gen%203%20将大模型终端侧落地的潜力提升到了新的高度,使其自身继续在该领域引领潮流。

      据了解,骁龙8%20Gen%203采用的高通AI引擎拥有面向移动终端的强大Hexagon%20NPU,集成了升级后的硬件加速单元、微切片推理单元、加强张量、标量和矢量单元,所有单元共享%202%20倍带宽的大容量共享内存。同时支持%20INT8+INT16的混合精度以及%20INT4、INT8、INT16和FP16的所有精度。性能较前代提升98%,能效提升40%。

      骁龙%208%20Gen%203%20集成的高通传感器中枢也更强,拥有2个始终感应ISP、2个micro%20NPU和1个DPS,内存增加了30%,支持INT4精度,AI性能提升了3.5倍。

      可以说,骁龙 8 Gen 3赋予了手机前所未有的强大终端侧AI性能,成为高通首个专为生成式AI打造的移动平台。那么这款旗舰级移动平台是否名副其实呢?这是我们大家最为关心的问题。

      在该平台上,高通AI引擎首次支持多模态生成式AI,包括了多种大语言模型、视觉语言模型等。尤其是在终端侧,骁龙8 Gen 3 首次支持运行 100亿参数的模型,规模迈入百亿量级。同时将 Stable Diffusion 生成图像的时间降到了1秒之内,再次创下最快速度。

      在跑Meta大语言模型Llama2-7B时,骁龙8 Gen 3每秒可以生成20个token,同样是手机终端侧最快之一。

    1700119962158195.png

      (图注)高通产品管理高级副总裁Ziad Asghar

      骁龙平台已经支持运行OpenAI、Meta、微软、安卓、stability.ai、BLOOM、百度、智谱、百川智能、有道等企业或机构的大模型,既为这些厂商将自身大模型能力「下放」到终端侧提供契机,也为用户体验生成式AI带来了丰富的选择项。

      牵一发而动全身,随着高通在赋能大模型终端落地上的进一步动作,采用骁龙 8 Gen 3移动平台的手机厂商快速跟进,加速了大模型集成到手机的进程。

      以首发搭载骁龙 8 Gen 3移动平台的小米14系列新机为例,AI大模型技术已经集成到小米全新澎湃 OS 中,并上线各种终端侧应用。有了大模型能力加持,小米14 支持了 AI 妙画、AI搜图、AI写真、AI扩图等多项功能,让输入法、WPS、相册焕发新的活力。

    20231116154221_485401700120541.gif

      vivo旗下品牌iQOO 12系列同样搭载了骁龙8 Gen 3移动平台,全新高通AI引擎使其影像体验大幅升级,照片质感和细节拉满。同时该系列手机预装的 OriginOS 4系统引入生成式AI功能,AI助手蓝心小V可以进行超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互,智能化程度明显提升。

      此前在骁龙峰会上,荣耀CEO赵明宣布新旗舰手机荣耀Magic%206将搭载骁龙8%20Gen%203移动平台,已支持70亿参数的终端侧AI大模型,为用户提供更加智能化的体验。他在现场演示了终端侧AI进行照片搜索、生成视频等智能操作,效果着实不错。

      手机终端融合大模型能力催生了大量或好玩、或有助于提升生产力的生成式%20AI应用。未来更加丰富的生成式AI应用会让更多用户切身体验到%20AI的魅力,提升自身交互体验,这也正是高通致力于在终端侧打造生成式AI能力的重要源动力之一。

      在持续利用AI赋能手机移动平台之外,高通也在寻求利用并把握好大模型及生成式AI的发展契机,以此来重塑PC行业,扩大自身在AI领域的领先优势。

      生成式AI有了「第二阵地」

      高通发布了面向PC%20平台的全新处理器骁龙X%20Elite,它采用4nm制程工艺,集成定制的高通Oryon%20CPU,运行速度是英特尔%2012%20核处理器的%202倍,功耗比英特尔竞品低68%,高峰时段的运行速度比苹果M2快了50%。

      如果这些参数还无法让你相信骁龙X%20Elite的强悍,那就跑个分吧。骁龙%20X%20Elite%20拥有两个版本:注重续航表现的%2023W%20版本、主打性能的%2080W版本。Geekbench%206测试下的单核和多核得分情况如下图所示,单核性能尤为亮眼。

      (图注)图源fonearena

      同样地,骁龙X Elite专为AI打造。它采用业界领先的、集成高通Hexagon NPU的高通AI引擎,异构算力高达75TOPS,Hexagon NPU算力为45TOPS,为创意应用、视频会议和生产力助手的变革性体验提供了算力基础。高通 AI引擎还支持了大量的加速应用程序和体验,创造无限可能性。

      超强生成式 AI 能力也成为骁龙X Elite的一大标签,截止到发布时,它已支持在端侧运行超过130亿参数的生成式AI模型,面向70亿参数大模型每秒生成30个token,AI处理速度是竞品的4.5倍。下图为PC端AI作画能力的展示。

      从手机到%20PC,多样化的端侧平台为释放生成式%20AI能力提供了更多渠道。这也表明,高通在终端侧生成式AI落地这条赛道上继续「加码」,背后既离不开技术上的厚积薄发,也是其在大模型时代自身AI发展战略的延续。

      手机、PC加速迎来全新AI时代

      在当今大模型时代,终端侧部署生成式AI这条路线越来越明晰。基于此,高通秉持「混合AI是AI的未来」这一理念和战略,注重云端与终端的协同发展,并认为终端侧AI是扩展生成式AI至全球更广泛范围的关键。

      遵循这一前瞻性认知,高通一步步积累,逐渐在自身布局中构建了强大、全面的终端侧AI能力,并引领了端侧大模型及生成式AI的革新与进步。毫无疑问,此次骁龙峰会上发布的骁龙%208%20Gen%203、骁龙X%20Elite将进一步夯实高通作为终端侧AI领导者的地位。

      (图注)高通全栈AI优化方案

      如果大模型继续保持当前的落地步伐,我们将可以在手机、PC 甚至XR可穿戴设备、智能网联汽车等智能终端上体验到更多生成式AI应用,让人机交互更加自然且个性化。反过来,这些生成式AI应用以及带来的体验变革也将对这些终端设备产生深远影响,甚至改变它们的核心驱动力,重新定义它们。

      我们以与人们日常工作、生活息息相关的手机为例,在追求绝对性能之外,人们越来越多地关注一些创意性应用。这就需要AI大显身手,生成式AI性能更是成为下一代手机处理器角逐的核心竞争力。

      骁龙移动平台近年来持续发力于此也在意料之中了。从去年的骁龙8 Gen 2 到此次骁龙峰会上的骁龙 8 Gen 3,AI 早已无处不在,生成式 AI 一跃成为「AI 皇冠上的新明珠」,受到了广泛关注和青睐。

      随着大模型及生成式AI在手机终端落地的范围越来越广、成熟度越来越高,我们或许可以看到:传统智能手机被生成式 AI 能力全方位加持的「AI 手机」所取代。小米等手机厂商新发布的旗舰机在这方面已经初具雏形,利用生成式AI增强一些场景的使用体验和效率,为未来颠覆手机的质变做好了充分的量变。

      同时,PC 终端的革新也有类似向生成式 AI 能力倾斜的发展趋势。在这方面,集成到Windows 中的微软 Copilot是一个很好的例证。当然还有更多生成式AI变革人类与 PC 交互的场景和方式,借此实现更高效的智能协作、更简化的工作流程、更强大的生产力、更定制化的使用体验。

      骁龙 X Elite 一出手便瞄准生成式 AI,势必会为当前的PC市场注入新鲜血液。在第六届虹桥国际经济论坛 ——「智能科技与未来产业发展」分论坛上,高通公司中国区董事长孟樸发表了主题演讲,认为下一代 PC 将进入一个全新的「AI PC」时代,以智能、高性能、高效等为特点, 并将对办公效率等方面产生重要意义。

      相信未来高通会在骁龙 8 Gen 3 等移动平台和骁龙 X Elite等PC平台的基础上,继续加强自身在大模型和生成式AI上的基础能力。加之更多搭载这些平台的厂商发布全新旗舰手机和 PC 产品,他们不断增强的自主性及自研能力可以让我们期待更多样化生成式AI应用的亮相。

      不过,在「AI 手机」和「AI PC 时代」真正到来之前,还要看生成式AI能力是否能让用户产生强烈感知、是否能准确满足他们的需求、是否能对相关应用产生依赖性、以及是否能带动他们换机的欲望,这些都是高通和手机厂商现在及未来要考虑的问题。

      结语

      自发布以来,骁龙 8 Gen 3、骁龙X Elite展现出的强大生成式AI能力留给人们无限的想象空间。 正如高通公司总裁兼 CEO 安蒙所言,「我们正在进入将改变用户体验的生成式AI时代,也将创造一个移动行业和计算行业的全新周期。」

      在这一进程中,作为终端侧领导者的高通正担负起应有的时代角色。一方面,利用自身强大的全栈AI优化能力汇聚软硬件各方,助力终端侧AI生态快速发展;另一方面,全新的跨平台技术「Snapdragon Seamless」实现安卓、Windows 和其他操作系统无缝衔接,这种多终端体验有望将 AI在手机、PC 等终端上的落地进一步拓展开来。

      可以预见,基于骁龙生态的AI体验会非常快速铺展开来,各种应用落地的速度也将大大加快。未来,高通将继续保持自身在终端侧AI的技术优势,推动大模型在部署应用时更便捷、更丰富、更有吸引力。同时,携手各大厂商创新基于大模型的生成式AI应用,降低普通用户使用生成式AI的门槛。

      随着新的生成式AI时代开启,高通是否能持续满足人们的期待,我想这次骁龙峰会已经给了我们答案。

      (文章转载自机器之心公众号)

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. X026]
    分享到微信

    即时

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。