最新新闻：

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算新体验微星游戏本新品5060/5070配置上市，神影/星影系列国补爆款抢先购！职业选手同款至高省50% 京东电竞键鼠三重补贴引爆极致性价比学习机买贵双倍赔全网不怕比入手学习机认准京东618 京东3C数码618开门红1小时呈爆发式增长上万个趋势单品增长超10倍 iPhone 16 618购机指南：京东国补覆盖更广同款机型比天猫便宜400元京东618百万份“AI加油包”助你提升职场效率 1分钱即可获得心仪大奖用AI告别每日2小时繁琐工作京东618推出百万份AI加油包助用户全面提效羊毛党带路！在京东618用“京补合约”下单iPhone 16 Pro只要83元！5月30日晚8点来京东618用“京补合约”下单超6000元手机也能享国补华为nova 14 Pro仅需3249元来京东618购手机享国补加倍补壳牌挚美漆面保护膜,全面守护座驾,助力美好出行打造“全球一朵云”，广汽迈入出海3.0时代 Nothing Phone（3）将推全新灯语设计，定位首款真旗舰奔驰召回部分进口G级汽车涉及ESP系统软件问题算力互联网试验网落地纪实：技术突破、标准引领与生态协同纤薄背后看三星是如何在Galaxy S25 Edge上实现突破的深圳海辰储能柜获TÜV南德CE-LVD认证掠夺者·圣盾7000震撼发布，搭载RTX 5090突破电竞性能新纪元！新股速递｜容大合众(9881.HK)启动招股百惠担任联席账簿管理人及联席牵头经办人

首页 > 云计算频道 > 大模型

OpenAI发布AI智能体的评测集：MLE-bench

2024年10月12日 15:28:02 来源：AIbase基地

　　在近期的一项研究中，OpenAI研究团队推出了名为 MLE-bench 的全新基准测试，旨在评估AI智能体在机器学习工程方面的表现。

　　这项研究特别关注75个来自 Kaggle 的机器学习工程相关竞赛，旨在测试代理在现实世界中所需的多种技能，包括模型训练、数据集准备和实验运行等。

　　为了更好地进行评估，研究团队使用了 Kaggle 公开排行榜的基础数据，确立了每个竞赛的人类基准。在实验中，他们利用开源的智能体架构，对几种前沿语言模型进行了测试。结果显示，最佳表现的配置 ——OpenAI 的 o1-preview 与 AIDE 架构结合使用 —— 在16.9% 的竞赛中，达到了 Kaggle 铜牌的水平。

　　不仅如此，研究团队还对 AI 智能体的资源扩展形式进行了深入探讨，并研究了预训练对结果的污染影响。他们强调，这些研究结果为今后进一步理解 AI 智能体在机器学习工程方面的能力提供了基础。为了促进未来的研究，团队还将基准测试的代码进行了开源，供其他研究人员使用。

　　这项研究的推出，标志着机器学习领域的一次重要进展，特别是在如何评估和提升 AI 智能体的工程能力方面。科学家们希望，通过 MLE-bench，可以为 AI 技术的发展提供更科学的评估标准和实践依据。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号