阿里云今日宣布推出全新的推理模型QwQ-32B,该模型拥有320亿参数,其性能可与具备6710亿参数的DeepSeek-R1相媲美。研究表明,强化学习能够显著提升模型的推理能力,QwQ-32B通过整合冷启动数据和多阶段训练,实现了深度思考和复杂推理。
这款新模型不仅在数学推理、编程能力和通用能力测试中表现出色,还在多个评测集中超越了其他领先模型。特别是在AIME24数学评测集和LiveCodeBench代码评估中,QwQ-32B的表现与DeepSeek-R1相当,远超o1-mini及相同尺寸的R1蒸馏模型。
此外,QwQ-32B集成了与智能体(Agent)相关的功能,使其能够在使用工具时进行批判性思考,并根据环境反馈调整推理过程。目前,QwQ-32B已在Hugging Face和ModelScope平台开源,并采用Apache 2.0开源协议。用户也可通过Qwen Chat直接体验这一先进模型。阿里云表示,这标志着他们在大规模强化学习以增强推理能力方面迈出了重要一步。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。