信仰玩家征集令!长沙 2025 ROG DAY 粉丝嘉年华盛大开启冲破次元壁!初音未来梦幻联名丨华硕ROG DAY暨2025新品发布会解决多地协同难题!半导体行业本地部署ERP实现安全远程访问!先人一步购新品就来京东3C数码上新季 OPPO Find X8s系列享限量好礼三选一天玑AI开发套件2.0全面支持DeepSeek四大关键技术,强劲推理让AI智慧再进化百度移动生态正在经历一场开放性变革首次连发三款直屏旗舰,OPPO的动作传递了一些行业信号钉钉等待乔布斯时刻国补叠加以旧换新补贴真香预警!京东入手Apple产品还可享12期免息新报告显示西班牙俱乐部在本土青训球员留用方面处于领先地位AI应用突围,中小企业的新周期已至Canva发布全新AI功能:涵盖AI助手、指令生成应用、动态表格等Krea发布全新工具Krea Stage:从图片到3D场景:一键构建沉浸式世界12种营养分时补充 孕产妇专用营养美好蕴育润康守护孕期营养华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream7B,打破文本生成格局Pika推出全新AI视频功能Pika Twists,可以操控编辑视频中的任何角色或物体ChatGPT记忆力升级解锁完整记忆,OpenAI或下周发布新模型GPT-4.1LoRA上端训练,推理能力提速,联发科让端侧AI训练正式驶入快车道电脑微信更新 这些功能Windows端和Mac端都能体验了日本游戏机成美关税受害者 任天堂、索尼或涨价30%
  • 首页 > 云计算频道 > 大模型

    字节跳动开源Multi-SWE-bench 推动大模型代码智能升级

    2025年04月10日 15:43:01   来源:Citnews中文科技资讯

      字节跳动豆包大模型团队最近开源了Multi-SWE-bench,这是首个多语言代码修复基准数据集,旨在提升大模型在自动修Bug能力方面的评估。

      相较于以往的SWE-bench,Multi-SWE-bench不仅覆盖了Python,还新增了Java、TypeScript等六种语言,构建了1632个真实任务,并引入了难度分级机制。

      Multi-SWE-bench是首个多语言代码修复基准数据集,覆盖7种主流编程语言。

      数据集包含1632个真实任务,经过严格筛选和人工验证,确保质量可靠。

      实验显示大语言模型在Python修复上表现尚可,但在其他语言的修复率低于10%。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。