最新新闻：

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算新体验 iPhone 16 Pro Max立减500元来京东618领3C数码消费券下单更优惠微星游戏本新品5060/5070配置上市，神影/星影系列国补爆款抢先购！职业选手同款至高省50% 京东电竞键鼠三重补贴引爆极致性价比学习机买贵双倍赔全网不怕比入手学习机认准京东618 京东3C数码618开门红1小时呈爆发式增长上万个趋势单品增长超10倍 iPhone 16 618购机指南：京东国补覆盖更广同款机型比天猫便宜400元京东618百万份“AI加油包”助你提升职场效率 1分钱即可获得心仪大奖用AI告别每日2小时繁琐工作京东618推出百万份AI加油包助用户全面提效羊毛党带路！在京东618用“京补合约”下单iPhone 16 Pro只要83元！5月30日晚8点来京东618用“京补合约”下单超6000元手机也能享国补华为nova 14 Pro仅需3249元来京东618购手机享国补加倍补壳牌挚美漆面保护膜,全面守护座驾,助力美好出行打造“全球一朵云”，广汽迈入出海3.0时代 Nothing Phone（3）将推全新灯语设计，定位首款真旗舰奔驰召回部分进口G级汽车涉及ESP系统软件问题算力互联网试验网落地纪实：技术突破、标准引领与生态协同纤薄背后看三星是如何在Galaxy S25 Edge上实现突破的深圳海辰储能柜获TÜV南德CE-LVD认证掠夺者·圣盾7000震撼发布，搭载RTX 5090突破电竞性能新纪元！

首页 > 云计算频道 > 大模型

豆包团队开源SuperGPQA：挑战285学科AI推理极限

2025年03月04日 17:26:05 来源：Citnews中文科技资讯

　　近日，字节跳动豆包大模型团队联合M-A-P开源社区发布SuperGPQA，一个覆盖285个研究生级学科、包含26，529道专业问题的知识推理基准测试。

　　该数据集不仅涵盖数学、物理等主流学科，还首次将轻工业、农业、服务科学等长尾学科纳入评估体系，填补了现有基准测试在长尾知识领域的空白。SuperGPQA已被用于揭示开源与闭源模型的性能差距，成为AI发展的重要工具。

　　传统基准如MMLU和GPQA学科覆盖不足50个，长尾学科占比不到5%，且因数据来源单一(如维基百科)和众包标注不可靠，难以衡量模型在复杂场景中的推理能力。SuperGPQA通过专家-LLM协同机制，从权威来源筛选问题，历时半年构建而成。其题目平均提供9.67个选项，42.33%需数学计算或形式推理，兼具广度与深度。实验显示，最优模型DeepSeek-R1准确率仅61.82%，表明当前大语言模型在多样知识领域仍有提升空间。

　　SuperGPQA采用三阶段流程提升质量:专家筛选原始问题、规范化转录、多层质量检验(规则过滤、LLM检测、专家复审)。评测结果表明，指令微调显著提升性能，如DeepSeek-V3得分超基础版，但开源模型在困难题目上仍落后闭源方案。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号