最新新闻：

雁门萨氏萨师煊：中国数据库学科的拓荒人与奠基者历经百年，托盘仍是有待深挖的数据来源董明珠和孟羽童“再次合体”，必须看懂的流量密码大疆新品曝光：Romo、Mini 5 Pro、Avata 3、Neo 2、Nano、Mic 3、M400A等中国植入式脑机接口技术正式启动临床入组谷歌Pixel 10 Pro真机现身：全球首发自研Soc 骁龙8至尊版满血小折叠！小米MIX Flip 2已备案：本月发布曝iPhone17配备120Hz屏但不支持ProMotion自适应刷新率华为Pura 80系列配色首曝：主打陶瓷质感 REDMI电竞小平板本月发：8英寸板王 iPhone又整大活儿？外国剁手党们，催着中国电商集体出海大模型驱动质检革命：得助智能质检实现跨场景精准识别 Supermicro推出标准化AI数据中心解决方案DCBBS，降低20%总体成本警惕：AI生成恶意软件入侵Open WebUI实例刚上手AI，职场人就踩了幻觉的坑智明达推出近40款无人机载嵌入式计算机产品亚信科技被Omdia评为5G专网全球供应商挑战者三星抛弃谷歌Gemini?Galaxy S26将携手Perplexity掀起AI搜索革命 ElevenLabs推全新语音交互平台Conversational AI 2.0：AI语音助手比真人还懂你

首页 > 云计算频道 > 大模型

DeepSeek 等秒变操控电脑 AI 智能体，微软开源工具 OmniParser V2.0 发布

2025年02月17日 15:31:34 来源：IT之家

　　2 月 17 日消息，微软 OmniParser 是一款基于纯视觉的 GUI 智能体解析和识别屏幕上可交互图标的 AI 工具，此前搭配 GPT-4V 可显著增强识别能力。

　　2 月 12 日，微软在官网发布了 OmniParser 最新版本 V2.0，可将 OpenAI(4o / o1 / o3-mini)、DeepSeek(R1)、Qwen(2.5VL)和 Anthropic(Sonnet)等模型，变成可以操控计算机的 AI 智能体。

　　与 V1 版本相比，OmniParser V2 使用了更大规模的交互元素检测数据和图标功能标题数据进行了训练，在检测较小的可交互 UI 元素时准确率更高、推理速度更快，延迟降低了 60%。

　　在高分辨率 Agent 基准测试 ScreenSpot Pro 中，V2+GPT-4o 的准确率达到了 39.6%，而 GPT-4o 原始准确率只有 0.8%。

　　为了能够更快地实验不同的智能体设置，微软还开源了 OmniTool，这是一个集成了智能体所需一系列基本工具的 Docker 化 Windows 系统，涵盖屏幕理解、定位、动作规划和执行等功能，也是将大模型变成智能体的关键工具。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号