最新新闻：

IDC：预计2025年中国物联网支出达1658.6亿美元世界模型成AGI关键，算力成本与数据质量成发展桎梏产教融合新样板！河北大学携手卓世科技共建实习实践基地与创新中心大厂争当AI「婆婆」第五届平潭IM两岸青年影展联合即梦AI发起“AIGC单元”智能电视仅需399元！价格战是策略还是毒药？消失的百亿利润背后，是拼多多的超绝钝感力线上空调市场价格战：小米均价不降反升，美的系海尔系降价猛大尺寸OLED电视也降价了，77吋不到万元 AMD发布25.6.1显卡驱动，支持RX 9060 XT与FSR 4游戏优化情绪消费狂潮：年轻人的“心灵按摩师”来了！宇树科技CEO王兴兴：人形机器人技术突破重在全身动作控制字节跳动推出AI图像编辑模型SeedEdit 3.0，大幅提升主体保持与指令执行能力红魔电竞平板 3 Pro 即将发布：首发 5280Hz 调光与 80W 快充 vivo X Fold5折叠屏手机即将发布或成首款三防大折叠机型最强手感小直屏来了！魅族22系列入网：首次安排潜望长焦 AI驱动本地视频编辑工具Diffusion Studio Pro，号称“CapCut + Cursor”结合 Meta发布Aria Gen2技术细节:四摄像头加持，续航8小时挑战苹果Vision Pro Anthropic 发布专为国家安全定制的 AI 模型，获亚马逊和谷歌支持地表最强AI语音来了!Eleven v3Alpha版震撼发布，会说话还能‘演戏’

首页 > 企业IT频道 > 人工智能

谷歌打造最强机器人 AGI，动嘴就能操控 007

2023年07月31日 11:15:27 来源：站长之家

　　谷歌 DeepMind 推出全新的视觉 - 语言 - 动作模型(VLA)，命名为 Robotic Transformer2(RT-2)。这个模型可以与机器人互动，通过学习网络和机器人数据，将知识转化为有效的指令。

　　RT-2是 RT-1的升级版，基于 Transformer 构建，具有更好的性能和泛化能力。RT-2还在一系列的定性和定量实验中展示出惊人的学习和理解能力，能够执行基本推理和多阶段的语义推理。通过与思维链推理结合，RT-2可以学习长期规划和低级技能，执行更复杂的命令。

　　研究人员观察到，与之前的基线模型相比，RT-2的泛化性能提高了3倍以上。RT-2的成功展示了视觉语言模型转化为视觉语言动作模型的潜力，为构建通用实体机器人提供了前景。

　　论文地址:https://robotics-transformer2.github.io/assets/rt2.pdf

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™处理器：性能飞跃，重塑计算新

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™处理器：性能飞跃，重塑计算新

USB-C「接口乱炖」乱象严峻，微软终于看不下去了

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号