半导体跨界潮,谁在跟风,谁在下棋?Nikola,一个千亿造车独角兽破产了消息称谷歌将因违反反垄断规则而遭欧盟指控,恐被处以高额罚款透明美学再进化,Nothing Phone(3a)系列手机宣传物料曝光2025 年春运今日迎来最后一天,全国铁路已累计发送旅客 4.99 亿人次国内通信运营商首次:中国联通通过数字货币桥实现跨境支付微软 Outlook“保存邮件到 OneNote”功能 3 月谢幕,“发送到 OneNote”接棒全国首个:浙江率先布局低空经济“下乡”,目标到年底建成 200 个乡村无人机起降枢纽拨打客服电话强制等待 15 分钟,惠普欧洲试点遭强烈反对后取消OPPO一键问屏 / 全能搜基于阶跃星辰Step系列多模态模型打造京东&创维联合定制JD100 Mini电视发布 下单享免费送装一体服务我国成功发射中星 10R 卫星中科闻歌发布“智川”企业智能体平台1.0、“优雅”音视频大模型平台1.5,领先技术加速AI普惠落地这个周末,在最懂开发者的城市邂逅最懂开发者的算力平台DDN推出 Infinia 2.0对象存储 加速AI数据处理速度全部免费!百度文心智能体平台已全面接入DeepSeek模型灯塔云系统:开启劳务派遣管理4.0时代超2671万名消费者申请手机等数码产品购新补贴 用国补买手机上京东皇家马德里对阵赫罗纳:不乏进球与高水平竞技的足球现场OpenAI宣布面向多个国家推出AI代理 Operator
  • 首页 > 企业IT频道 > 人工智能

    机器人也会系鞋带了!斯坦福团队用模仿学习赋予机器人新技能丨已开源

    2024年09月11日 17:15:32   来源:量子位公众号

      斯坦福年初刚教完机器人炒菜,现在又教机器人系鞋带!

      他们还发布了全球首个机器人自主系鞋带演示视频:

      与之前的炒菜版1.0相比,这个版本的它可以执行更加轻巧、复杂的任务。

      评论区的网友也是一片夸夸:

      网友一:小手怪巧的,我系鞋带都没他系的好!

      网友二:OMG!是个好东西!量产!

      网友三:可爱捏!它甚至会打蝴蝶结!

      小手怪巧的

      除了系鞋带,视频中的Aloha2机器人还会挂衣服、拧齿轮、收拾厨房,甚至是给“同事”换不同用途的配件。

      咱们一起来看一下它的表现~

      先是挂衣服。演示视频中,Aloha2先是乖乖的把衣服摆好,然后一气呵成地就把衣服套在了衣架上(它甚至知道抵一下防止衣服掉落)。

      数据库中的没有的衣服类型也可以挂。

      在拧齿轮的测试中,它的表现也不错。成功地把三个塑料齿轮插进了一个带摩擦力的插座,完美咬合。

      “收拾厨房”的环节:Aloha2乖乖地把桌面散落的餐具规整到一起,摆放整齐。

      到了给“同事”换配件的时候,也是一气呵成。先摘下旧的,再拿起新的对准后安上!

      怎么学会的

      为了训练Aloha2机器人,研究团队使用扩散策略进行大规模训练,共在5个任务中收集2.6万个示范数据。

      值得一提的是,他们的训练仅仅是基于模仿学习的方法,并不涉及强化学习。

      而Aloha2机器人的神经网络架构则是参考了ACT模型,没有用到条件VAE编码器(变分自动编码器)。

      他们具体是这么做的:

      研究人员给嵌入加了个位置嵌入,然后喂了一个8500万的Transformer编码器,之后用双向注意力进行解码,就得到了观察结果的潜在嵌入。

      这些潜在的东西再传给一个5500万参数且带双向注意力的Transformer编码器。

      解码器的输入是个50x14的张量,就是一个带位置信息的噪声动作块。这些嵌入跟观察编码器的潜在嵌入和时间步(用独热向量表示)进行交叉注意力。

      解码器最后输出一个50x512的维度,然后用线性层映射成50x14,这就是对接下来50个动作的预测噪声。

      基础模型总共有2.17亿个可学习的参数。小模型的话,研究人员用1700万的编码器和3700万的解码器,总共1.5亿参数。

      训练时,研究人员基于JAX框架,在64个TPUv5e上并行训练,批量大小256,总共进行了200万步的训练。

      并且使用带权重衰减的Adam优化器,权重衰减是0.001,线性学习率预热5000步,之后保持恒定速率为1e-4

      最终结果如下:

      研究人员对最终的结果很满意,发文感叹:

      实验的总体成功率很高!模仿学习可能是实现99%成功率的有效途径!

      One more thing

      Aloha2的研究团队主要由DeepMind和斯坦福研究小组组成。

      Aloha2是对原始Aloha系统的增强版本,为了更加支持双手的远程操作。

      与之前的版本相比Aloha2在硬件方面进行了多项改进,使其能够执行更复杂和细致的操作任务,

      目前研究团队已经开源了Aloha2的所有硬件设计,并提供详细的教程和模拟模型,以便于研究人员和开发者进行大规模的双手操作研究。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。