2024一带一路暨金砖国家技能发展与技术创新大赛之元宇宙3D数字内容设计创作赛项(中职组)全国总决赛在湖北崇阳职业技术学校圆满闭幕中国广电、亚信科技700MHz 5G专网案例获工信部“绽放杯”全国总决赛一等奖兰张高铁武威至张掖段开工建设:设计时速 250 公里,工期 3 年摄像头比京东贵40元 下单前多比价才最划算小鹏MONA汽车上市后累积交付4万台 哨兵模式 1 月春节前上线奥迪将关闭比利时布鲁塞尔工厂,因 Q8 e-tron 系列电动 SUV 表现不佳微软Surface Pro 12商用版二合一平板现身Geekbench跑分库,搭酷睿Ultra 7 266V处理器ROG CES 2025全球发布会定档北京时间1月7日华为Mate 70 系列的“智控键”功能 藏着华为AI的大野心宁德时代回应“为供应商提供资金援助”:情况属实,愿支持相关研发创新硅谷“福利文化”逐渐式微:谷歌等科技巨头缩减“标志性”奢华员工福利传音旗下人工智能项目荣获2024年“上海产学研合作优秀项目奖”一等奖不止超薄iPhone17 Air,消息称苹果正研发可折叠iPhone、MacBook消息称三星明年1月为Bixby接入大模型,加强Galaxy S25系列手机AI竞争力第二届人工智能生成内容国际会议暨大模型应用创新大会(AIGC 2024)Kimi发布视觉思考模型k1:试题拍照给出答题思考全过程放弃高通和三星,消息称谷歌 Pixel 10 系列手机首搭联发科T900调制解调器三大运营商均提供量子产品:中标湖北省电子政务项目IDC:第三季度企业WLAN市场环比增长5.8%富士胶片商业创新再度获评“全球大企业开放式创新50强”
  • 首页 > 云计算频道 > 大模型

    Meta AI 推出大概念模型:超越传统语言模型的新突破

    2024年12月16日 15:30:48   来源:AIbase基地

      近年来,大型语言模型(LLMs)在自然语言处理(NLP)领域取得了显著进展,广泛应用于文本生成、摘要和问答等场景。然而,这些模型依赖于逐字预测的 token 级处理方法,这种方式在理解上下文时存在困难,且往往产生不一致的输出。此外,将 LLMs 扩展到多语言和多模态应用时,计算成本和数据需求也相对较高。为了解决这些问题,Meta AI 提出了一种全新的方法 —— 大概念模型(LCMs)。

      大概念模型(LCMs)代表了传统 LLM 架构的一次重要转变。它们引入了两个重大创新:首先,LCMs 在一个高维嵌入空间中进行建模,而不是依赖于离散的 tokens。这一嵌入空间被称为 SONAR,旨在支持200多种语言和多种模态,包括文本和语音,提供语言和模态无关的处理能力。其次,LCMs 的设计允许在语义层面上无缝过渡,能够在不同语言和模态之间实现强大的零 - shot 泛化能力。

      在 LCMs 的核心,存在概念编码器和解码器,这些组件将输入句子映射到 SONAR 的嵌入空间,并将嵌入解码回自然语言或其他模态。这些组件的冻结设计确保了模块化,方便在不重训整个模型的情况下扩展新语言或模态。

      技术细节方面,LCMs 采用了层次化架构,模仿人类的推理过程,从而提升了长篇内容的一致性,同时能够在不干扰整体上下文的情况下进行局部编辑。通过采用扩散模型,LCMs 在生成过程中表现出色,这些模型基于前面的嵌入预测下一个 SONAR 嵌入。实验中,采用了单塔和双塔两种架构,其中双塔架构在上下文编码和去噪上分开处理,提高了效率。

      实验结果显示,基于扩散的双塔 LCM 在多个任务中展现了竞争力,如多语言摘要任务中,LCMs 在零 - shot 情况下的表现优于基线模型,证明了它们的适应能力。同时,LCMs 在处理较短序列时也表现出高效性和准确性,相关度量指标的显著提升印证了这一点。

      Meta AI 的大概念模型为传统 token 级语言模型提供了一种有前途的替代方案,通过高维概念嵌入和模态无关的处理,解决了现有方法的一些关键局限。随着对这一架构研究的深入,LCMs 有望重新定义语言模型的能力,为 AI 驱动的沟通提供更具可扩展性和适应性的方法。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。