带屏版“HomePod”全曝光!苹果要发力智能家居了?小米14无缘!谷歌力推Ultra HDR,是移动影像的未来?重金购买宇树机器人“拆解学习”,波士顿动力从先驱成了跟随者3599元!飞米学小米做价格屠夫,能否成为大疆“平替”?奔驰裁员!被国产新势力“围猎”,昔日豪车正沦为发布会背景板?京东先人一步首发荣耀MagicBook Pro 14 采销直播间下单赠荣耀礼盒推出第二款车型后,美造车新势力 Lucid CEO 罗林森“下课”买电视总踩坑?讲道理,这些新技术才是“硬通货”!权威认证!宝骏享境超低风阻系数0.198,颜值实力派禾赛第四代芯片架构2025年全面量产 打造新一代激光雷达苹果自研C1基带带来两大杀手级特性:长续航与智能数据管理Canalys:2024Q4全球AI PC出货量猛增,苹果54% 独霸半壁江山CountPoint称国补引爆中国手机市场:1月销量逼近2900万部,华为、vivo、小米前三共占53.8%手机直连卫星终端超25款,累计销量超1600万台通义新一代轻量化大语言模型DistilQwen2.5 发布 提升性能与效率OpenAI向免费用户推出“mini版”高级语音模式,Deep Research亦放宽限制OPPO Find N5缺货严重:10999元顶配版供不应求联发科发布5G-A基带M90:峰值速度12Gbps、集成AI+卫星通信开年即王炸!宏碁暗影骑士·擎50系发布“AI战神”级新品!支持联网搜索!OPPO ColorOS接入满血版DeepSeek-R1
  • 首页 > 云计算频道 > 大模型

    通义新一代轻量化大语言模型DistilQwen2.5 发布 提升性能与效率

    2025年02月26日 17:08:28   来源:AIbase基地

      在大语言模型逐渐普及的今天,如何在资源受限的环境中实现高效部署已成为重要课题。为了解决这一挑战,基于 Qwen2.5的轻量化大模型系列 DistilQwen2.5正式发布。该模型采用了创新的双层蒸馏框架,通过优化数据和参数融合技术,不仅保留了模型的性能,同时显著降低了计算资源的消耗。

      DistilQwen2.5的成功得益于其独特的知识蒸馏技术。这一过程首先需要大量高质量的指令数据,这些数据来自多个开源数据集及私有合成数据集。为确保数据的多样性,研究团队通过 Qwen-max 扩展了中英文数据,从而实现了任务和语言的均衡。此后,模型通过采用 “黑盒化蒸馏” 的方式,利用教师模型的输出进行指令的扩展、选择与改写。这种方法不仅提升了数据的质量,还增强了模型的多任务处理能力。

      值得注意的是,DistilQwen2.5还引入了白盒化蒸馏技术,通过模仿教师模型的 its 分布,使得学生模型在知识获取上更为高效。这种技术避免了传统白盒化蒸馏面临的 GPU 内存消耗、存储与读取速度慢等问题。

      经过多个权威指令遵循评测基准的测试,DistilQwen2.5的表现令人瞩目,尤其是在 AlpacaEval2.0和 MT-Bench 的评测中表现优异。这标志着轻量化大语言模型的发展进入了一个新的阶段,能够在保证性能的前提下,大幅降低计算成本,进一步推动了 AI 技术在各种应用场景中的落地。

      DistilQwen2.5的开源发布也将为更多开发者提供便利,使他们能更轻松地使用这一强大的工具,为人工智能技术的普及贡献力量。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。