埃夫特与华为云携手推进具身智能领域合作AMD发布RX 9060 XT显卡 回应8GB显存争议5月26日京东3C数码“疯狂星期一”再上线 名著图书7折抢玄戒O1发布前小米手机芯片供应情况:联发科与高通“唱主角”,紫光展锐占2%UFCS 2.0标准发布!OPPO、vivo、华为、荣耀在一起:快充互授权联想推出国内首个轮胎AI质检智能体方案,破解行业痛点2025无创水光品牌排行榜全汉FSP台北电脑展推多款散热新品 机电散布局再升级瑞莎推出Rock 4D系列单板机,搭载RK3576芯片支持4K 120Hz输出同程旅行2025年一季度财报:实现营收43.77亿元,同比增长13.2%曝小米16提档至9月底:全球首发高通骁龙8 Elite 2网易数智发布CoreAgent智能体开发平台及多款行业智能体AOC E-Note Ring智能办公本全新上市,为精致悦己而来!弱化规模情结 强化能力引领 招联以数智化能力重塑消金行业韧性海信与谷歌Home API深度合作 智能家居生态再升级Anthropic API增加四大功能:代码执行工具、MCP连接器、文件API和扩展提示缓存谷歌Beam发布!2D视频秒变3D沉浸式体验,实时翻译+真实眼神交流商汤科技推出元萝卜 AI 下棋机器人五合一版,京东 Joy Inside 首度合作告别可穿戴!OpenAI秘密开发无屏幕AI设备,Altman称将成为第三大核心设备BOE(京东方)携手飞利浦EVNIA推出全球首款原生硬件圆偏光显示器 引领健康显示新未来
  • 首页 > 企业IT频道 > 软件即服务

    编程AI Claude 4系列登场,可自动写代码7小时

    2025年05月23日 09:41:14   来源:Citnews中文科技资讯

      Anthropic 公司在北京时间 5 月 23 日 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。

    1.jpg

      Claude Opus 4 被定位为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。

      测试数据显示,该模型在 SWE-bench 基准测试(评估模型解决真实 GitHub 问题的能力)中准确率达到 72.5%;在 TerminalBench 测试(在多步骤终端代码生成任务中验证模型表现)中准确率为 43.2%。

    2.jpg

      更令人瞩目的是,Opus 4 在软件环境中展现出强大的自主行为,得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,据 Rakuten 测试数据,可连续进行近 7 小时的代码生成和任务执行,刷新 AI 世界纪录,远超前代 Claude 3 Opus(不到 1 小时)。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。