星曜光学宣布4月9日发布新品镜头七工匠推出“云釉白”50mm F1.8全画幅自动对焦镜头智己汽车2025款LS7本月亮相,多项配置升级引关注五年服役期结束:微软Surface Book 3二合一笔记本迎来“退休日”AI超级应用什么时候才能出现?英特尔将“Panther Lake”处理器列为2026年产品,预计今年晚些时候投产一加13T手机本月发布:骁龙8 Elite+6000mAh大电池腾讯发布GeometryCrafter:用AI解锁开放世界视频的几何一致性之美Krea整合Gemini文字生图与图像编辑功能:Chat界面迎来实用性飞跃“拍星星的手机”遇见“星星的孩子”,中兴努比亚手机全系上线自闭症儿童画作壁纸智行 创见新机 | ECS 2025第八届电子通信与半导体数字科技大会全速起航小豚当家亮相2025上海华为智选鸿蒙智联伙伴峰会与AWE展会,引领智能安防新未来飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80EasyControl_Ghibli模型上线:免费解锁吉卜力风格图像生成AR眼镜销量涨6倍!宇树之后,高科技品牌纷纷加码速卖通腾讯元宝更新,多图上传+智能处理一键搞定ElevenLabs发布全球首款犬类AI文本转语音模型“Text To Bark”AI智启生活 第15届深圳国际移动电子展亮点“剧透”亚马逊云科技AI助手Q Developer集成OpenSearch Service 提升运维效率MiniMax Audio推Speech-02语音模型,一次性可以输入20万字符 星曜光学宣布4月9日发布新品镜头七工匠推出“云釉白”50mm F1.8全画幅自动对焦镜头智己汽车2025款LS7本月亮相,多项配置升级引关注五年服役期结束:微软Surface Book 3二合一笔记本迎来“退休日”AI超级应用什么时候才能出现?英特尔将“Panther Lake”处理器列为2026年产品,预计今年晚些时候投产一加13T手机本月发布:骁龙8 Elite+6000mAh大电池腾讯发布GeometryCrafter:用AI解锁开放世界视频的几何一致性之美Krea整合Gemini文字生图与图像编辑功能:Chat界面迎来实用性飞跃“拍星星的手机”遇见“星星的孩子”,中兴努比亚手机全系上线自闭症儿童画作壁纸智行 创见新机 | ECS 2025第八届电子通信与半导体数字科技大会全速起航小豚当家亮相2025上海华为智选鸿蒙智联伙伴峰会与AWE展会,引领智能安防新未来飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80EasyControl_Ghibli模型上线:免费解锁吉卜力风格图像生成AR眼镜销量涨6倍!宇树之后,高科技品牌纷纷加码速卖通腾讯元宝更新,多图上传+智能处理一键搞定ElevenLabs发布全球首款犬类AI文本转语音模型“Text To Bark”AI智启生活 第15届深圳国际移动电子展亮点“剧透”亚马逊云科技AI助手Q Developer集成OpenSearch Service 提升运维效率MiniMax Audio推Speech-02语音模型,一次性可以输入20万字符
  • 首页 > 云计算频道 > 大模型

    Liquid AI推出STAR模型架构,效率超越传统Transformer

    2024年12月03日 15:35:50   来源:AIbase基地

      在当前大型语言模型(LLM)开发的竞争中,各大人工智能公司面临着越来越多的挑战,因此,越来越多的目光开始转向 “Transformer” 以外的替代架构。Transformer 架构自2017年由谷歌研究人员提出以来,已成为当今生成式人工智能的基础。为了应对这一挑战,由麻省理工学院孵化的初创公司 Liquid AI 推出了一种名为 STAR(Synthesis of Tailored Architectures)的创新框架。

      STAR 框架利用进化算法和数值编码系统,旨在自动化生成和优化人工智能模型架构。Liquid AI 的研究团队指出,STAR 的设计方法不同于传统架构设计,它采用了分层编码技术,称为 “STAR 基因组”,从而探索潜在架构的广泛设计空间。通过基因组的组合与变异,STAR 能够合成和优化符合特定性能和硬件需求的架构。

      在针对自回归语言建模的测试中,STAR 显示出优于传统优化 Transformer++ 和混合模型的能力。在优化质量和缓存大小方面,STAR 进化的架构相较于混合模型的缓存大小减少了高达37%,而相较于传统 Transformer 则达到了90% 的减少。这种高效性并未牺牲模型的预测性能,反而在某些情况下超越了竞争对手。

      研究还表明,STAR 的架构可扩展性强,一个从1.25亿参数扩展到10亿参数的 STAR 进化模型在标准基准测试中表现与现有的 Transformer++ 和混合模型相当或更好,同时显著降低了推理缓存需求。

      Liquid AI 表示,STAR 的设计理念融入了动态系统、信号处理和数值线性代数的原理,构建了一个灵活的计算单元搜索空间。STAR 的一大特色在于其模块化设计,使得它能够在多个层次上编码和优化架构,为研究人员提供了洞察有效架构组件组合的机会。

      Liquid AI 认为 STAR 的高效架构合成能力将应用于各种领域,尤其是在需要平衡质量与计算效率的场景。虽然 Liquid AI 尚未公布具体的商业部署或定价计划,但其研究成果标志着自动化架构设计领域的一次重大进步。随着 AI 领域的不断演进,像 STAR 这样的框架可能会在塑造下一代智能系统中发挥重要作用。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。