• 首页 > 云计算频道 > 大模型

    Liquid AI推出STAR模型架构,效率超越传统Transformer

    2024年12月03日 15:35:50   来源:AIbase基地

      在当前大型语言模型(LLM)开发的竞争中,各大人工智能公司面临着越来越多的挑战,因此,越来越多的目光开始转向 “Transformer” 以外的替代架构。Transformer 架构自2017年由谷歌研究人员提出以来,已成为当今生成式人工智能的基础。为了应对这一挑战,由麻省理工学院孵化的初创公司 Liquid AI 推出了一种名为 STAR(Synthesis of Tailored Architectures)的创新框架。

      STAR 框架利用进化算法和数值编码系统,旨在自动化生成和优化人工智能模型架构。Liquid AI 的研究团队指出,STAR 的设计方法不同于传统架构设计,它采用了分层编码技术,称为 “STAR 基因组”,从而探索潜在架构的广泛设计空间。通过基因组的组合与变异,STAR 能够合成和优化符合特定性能和硬件需求的架构。

      在针对自回归语言建模的测试中,STAR 显示出优于传统优化 Transformer++ 和混合模型的能力。在优化质量和缓存大小方面,STAR 进化的架构相较于混合模型的缓存大小减少了高达37%,而相较于传统 Transformer 则达到了90% 的减少。这种高效性并未牺牲模型的预测性能,反而在某些情况下超越了竞争对手。

      研究还表明,STAR 的架构可扩展性强,一个从1.25亿参数扩展到10亿参数的 STAR 进化模型在标准基准测试中表现与现有的 Transformer++ 和混合模型相当或更好,同时显著降低了推理缓存需求。

      Liquid AI 表示,STAR 的设计理念融入了动态系统、信号处理和数值线性代数的原理,构建了一个灵活的计算单元搜索空间。STAR 的一大特色在于其模块化设计,使得它能够在多个层次上编码和优化架构,为研究人员提供了洞察有效架构组件组合的机会。

      Liquid AI 认为 STAR 的高效架构合成能力将应用于各种领域,尤其是在需要平衡质量与计算效率的场景。虽然 Liquid AI 尚未公布具体的商业部署或定价计划,但其研究成果标志着自动化架构设计领域的一次重大进步。随着 AI 领域的不断演进,像 STAR 这样的框架可能会在塑造下一代智能系统中发挥重要作用。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。