Kimi长思考模型API正式发布,多模态推理能力受关注创历史同期新高,“五一”假期全国快递揽投超 48 亿件同比增长超两成近 40 万韩国 20 岁以下年轻投资者押注三星电子股票,对其未来充满信心OpenAI 盈利转型失败,“金主”微软是投资者中最大反对小马智行与Uber达成全球战略合作外骨骼机器人刷爆五一假期,千亿市场“钱”景无限年中最强3K档性能机!iQOO Neo10 Pro+跑分破331万微软CEO:公司多达30%的代码是由AI生成的!Claude 移动应用即将推出语音模式,支持多种声音选项Excel MCP Server上线 可通过Claude等客户端直接操作Excel文件谷歌Gemini聊天机器人全新升级:支持多图上传和图像编辑功能Freepik 发布“F Lite”:一个为版权安全而构建的开放AI图像模型iOS18.6或为中国用户启用AI功能 国行苹果AI或由阿里百度技术支持Claude AI将升级:网页版酝酿支持MCP定制链接Midjourney V7推出全新功能 “Omni-Reference”,让图像生成更灵活Runway发布图像一致性参考功能 Gen-4References 支持提取人物、场景或风格特征及多图混合Suno v4.5正式上线,仅限付费用户使用,生成歌曲延长至8分钟英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2,语音转录能力再提升谷歌悄然成立 100 Zeroes 影视公司,针对年轻群体提升安卓“酷感”新西兰推动立法,拟禁止 16 岁以下未成年人使用社交媒体
  • 首页 > 云计算频道 > 大模型

    谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

    2025年03月13日 10:56:12   来源:IT之家

       北京时间昨晚,谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。

      其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。

      Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。

      该模型在谷歌 DeepMind 认为构建高效机器人所需的三大核心领域取得了进展:通用性、互动性和灵活性。除了能够应对新的情境外,Gemini Robotics 在与人类及环境的互动上表现更好,且能够执行更精确的物理操作,比如折纸或打开瓶盖。

      另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够“理解复杂且动态的世界”。

      Parada 进一步解释道,当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER 正是为此类推理任务而设计,机器人专家可通过该模型与现有的低级控制系统对接,开启由 Gemini Robotics-ER 驱动的新功能。

      谷歌 DeepMind 的研究员 Vikas Sindhwani 表示,公司正在开发一种“分层安全策略”,并称 Gemini Robotics-ER 模型已被训练用于评估在特定情况下某个动作是否安全。公司还发布了新的基准和框架,推动 AI 领域的安全研究。据IT之家了解,去年,谷歌 DeepMind推出了“机器人宪法”,这是一套受艾萨克 阿西莫夫启发的机器人行为规范。

      据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于“打造下一代人形机器人”。此外,谷歌还向包括 Agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。