突破叙事尺度 刻画极致人物 迷雾剧场《漂白》1月17日上线爱奇艺1月20日手机数码国补落地京东 超千万国补商品等你挑选超千万货品已备足 1月20日来京东购手机享国家补贴每件最高500元拥抱创新科技,探寻体育变革之路—— 第二届LALIGA EXTRATIME体育行业论坛在京成功举办斑马技术《2025全球消费者调查报告》:注重防损管理,增强顾客体验终端创企Nothing拟募资1亿美元 一加联合创始人创立恩智浦获欧洲投资银行 10 亿欧元贷款,用于在欧多国研发创新工作入手松下ZS99相机新品首选京东 售价2998元可先人一步入手1月20日打开京东搜索「1」 3C数码“疯狂星期一”爆款低至1元当代年轻人用上AI,从夸克开始消息称iPhone SE 4将有白色和黑色 预计3月份推出全球PC市场迎来温和复苏:2024年出货量增长1.3%,联想和苹果表现亮眼比亚迪已在韩国推出Atto 3 预计2月中旬开始交付发展新质生产力 赋能健康产品力 ——劲牌有限公司2024年度科技责任(成果)报告美光减产后 SK海力士也计划将上半年NAND闪存产量削减一成赵明离职信曝光:离开荣耀是人生中最艰难的决定消息称京东服饰换帅,阿里前高管担任负责人这年头,谁在互联网上学这么“硬核”的AI?开战2025,本地生活商家「另辟蹊径」年底Mini LED电视到底怎么选?认准这些新技术不踩雷!
  • 首页 > 产经新闻频道 > 科技资讯

    Arm 计算平台加持,全新 Llama 3.2 LLM实现AI 推理的全面加速和扩展

    2024年10月09日 13:46:18   来源:Citnews中文科技资讯

      新闻重点:

      · 在 Arm CPU 上运行 Meta 最新 Llama 3.2 版本,其云端到边缘侧的性能均得到显著提升,这为未来 AI 工作负载提供了强大支持

      · Meta 与 Arm 的合作加快了用例的创新速度,例如个性化的端侧推荐以及日常任务自动化等

      · Arm 十年来始终积极投资AI领域,并广泛开展开源合作,为 1B 至 90B 的 LLM 实现在 Arm 计算平台上无缝运行

      人工智能 (AI) 的迅猛发展意味着大语言模型 (LLM) 的新版本不断推陈出新。要充分发挥 AI 的潜力并抓住其带来的机遇,需要实现 LLM 从云端到边缘侧的广泛部署,而这也伴随着对计算和能源需求的大幅增长。整个生态系统正携手寻找应对这一挑战的解决方案,不断推出新的更加高效的开源 LLM,以便大规模实现各种 AI 推理工作负载,加快为用户带来全新、快速的 AI 体验。

      为此,Arm与Meta 展开紧密合作,在 Arm CPU 上启用新的Llama 3.2 LLM,集成开源创新与 Arm 计算平台的优势,显著推进了解决AI挑战的进程。得益于Arm 的持续投资及与新型LLM 的合作, Arm CPU运行 AI 的优势在生态系统中脱颖而出,使Arm成为 AI 推理开发者的首选平台。

      加速云到边缘侧的 AI 性能

      小型 LLM(如 Llama 3.2 1B 和 3B)能够支持基于文本的基础生成式 AI 工作负载,对于大规模 AI 推理的实现至关重要。通过 Arm CPU 优化内核在 Arm 技术驱动的移动设备上运行新的 Llama 3.2 3B LLM,可让提示词处理速度提高五倍,词元 (token) 生成速度提高三倍,在生成阶段实现每秒 19.92 个词元。这将直接减少了在设备上处理 AI 工作负载的延迟,大大提升了用户整体体验。此外,当边缘侧能处理的 AI 工作负载越多,往返云端传输数据所节省的电量就越多,进而节省了能源和成本。

      除了在边缘侧运行小型模型,Arm CPU同样支持在云端运行更大的模型(如 Llama 3.2 11B 和 90B)。11B 和 90B 的模型非常适合云端基于 CPU 的推理工作负载,可生成文本和图像,其中,在Arm Neoverse V2上的测试结果展现出了更大的性能提升。在基于 Arm 架构的 AWS Graviton4上运行 11B 的图像和文本模型,可以在生成阶段实现每秒 29.3 个词元的表现,远远超出了人类大约每秒阅读五个词元的速度。

      AI 将通过开源创新和生态系统协作迅速扩

      能公开获取新的 LLMs(如Llama 3.2)至关重要。开源创新正以迅猛速度发展,在之前的版本中,开源社区在不到 24 小时的时间内便能在 Arm 上部署并运行新的 LLM。

      Arm将通过Arm Kleidi进一步支持软件社区,让整个 AI 技术栈能够充分发挥这一优化的 CPU 性能。Kleidi 可在任何 AI 框架上解锁 Arm Cortex 和 Neoverse CPU 的 AI 功能和性能,无需应用程序开发者进行额外的集成工作。

      通过最近的Kleidi 与 PyTorch 集成以及正在推进的与 ExecuTorch 集成,Arm正在为基于 Arm CPU的开发者提供从云端到边缘侧的无缝 AI 性能。得益于Kleidi 与 PyTorch 的集成,在基于 Arm 架构的 AWS Graviton 处理器上运行 Llama 3 LLM 的词元首次响应时间加快了 2.5 倍。

      同时,在端侧,与参考实现相比,在 KleidiAI 库的加持下,使用 llama.cpp库在新的Arm Cortex-X925 CPU上运行 Llama 3 的词元首次响应时间加快了 190%。

      构建 AI 的未来

      Arm与Meta的合作成为了行业合作的新标杆,汇聚了 Arm 计算平台的灵活性、普及性和 AI 功能,以及 Meta 等行业巨头的技术专长,共同解锁AI 广泛应用的新机遇。无论是利用端侧 LLM 满足用户的个性化需求,如根据用户所处的位置、日程和偏好来执行任务,还是通过企业级应用来优化工作效率,让用户能够更专注于战略性任务,Arm 技术的集成都为未来奠定了基础。未来,设备不再只是命令和控制工具,更是能在提升用户整体体验方面扮演积极的作用。

      在 Arm CPU 上运行 Meta 最新 Llama 3.2 版本,其AI 性能实现了显著提升。这类开放式合作是实现无处不在的 AI 创新、促进AI可持续发展的最佳途径。通过新的 LLM、开源社区和 Arm 的计算平台,Arm 正在构建 AI 的未来,到 2025 年,将有 1000 多亿台基于 Arm 架构的设备支持 AI。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H002]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。