最新新闻：

天猫下架北京、江苏国补、美团以旧换新不方便？买iPhone还是选京东「月匣」UGC功能正式上线：全民戏精时代来临，你的专属AI剧本由你掌控！第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算新体验 iPhone 16 Pro Max立减500元来京东618领3C数码消费券下单更优惠微星游戏本新品5060/5070配置上市，神影/星影系列国补爆款抢先购！职业选手同款至高省50% 京东电竞键鼠三重补贴引爆极致性价比学习机买贵双倍赔全网不怕比入手学习机认准京东618 京东3C数码618开门红1小时呈爆发式增长上万个趋势单品增长超10倍 iPhone 16 618购机指南：京东国补覆盖更广同款机型比天猫便宜400元京东618百万份“AI加油包”助你提升职场效率 1分钱即可获得心仪大奖用AI告别每日2小时繁琐工作京东618推出百万份AI加油包助用户全面提效羊毛党带路！在京东618用“京补合约”下单iPhone 16 Pro只要83元！5月30日晚8点来京东618用“京补合约”下单超6000元手机也能享国补华为nova 14 Pro仅需3249元来京东618购手机享国补加倍补壳牌挚美漆面保护膜,全面守护座驾,助力美好出行打造“全球一朵云”，广汽迈入出海3.0时代 Nothing Phone（3）将推全新灯语设计，定位首款真旗舰奔驰召回部分进口G级汽车涉及ESP系统软件问题算力互联网试验网落地纪实：技术突破、标准引领与生态协同纤薄背后看三星是如何在Galaxy S25 Edge上实现突破的

推理AI模型基准测试成本激增:评估一个或需近3000美元

2025年04月11日 15:13:49 来源：AIbase基地

　　根据第三方AI测试机构Artificial Analysis的数据，评估OpenAI的o1推理模型在七种流行基准测试上需花费2，767.05美元，而其非推理模型GPT-4o仅需108.85美元。这一显著差异引发了关于AI评估可持续性和透明度的讨论。

　　推理模型，即能够逐步"思考"问题解决方案的AI系统，虽然在特定领域表现出色，但其基准测试成本远高于传统模型。Artificial Analysis评估约十几个推理模型总计花费了5，200美元，几乎是分析80多个非推理模型花费(2，400美元)的两倍。

　　成本差异主要源于推理模型生成的大量标记。例如，o1在测试中生成了超过4400万个标记，约为GPT-4o的八倍。随着基准测试越来越复杂，评估现实世界任务的能力，加上顶级模型每单位标记成本的上涨(如OpenAI的o1-pro每百万输出标记收费600美元)，独立验证这些模型性能变得极其昂贵。

　　尽管一些AI实验室为基准测试机构提供免费或补贴访问，但专家担忧这可能损害评估的客观性。General Reasoning的CEO Ross Taylor质疑:"从科学角度看，如果你发表了一个没人能用相同模型复制的结果，那它还能算是科学吗?"

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号