人形机器人真正走到我们身边,大概还需要10年左右。
文|赵艳秋 游勇
编|周路平
北京亦庄的一场人形机器人半程马拉松,在吸引着巨大关注的同时,也让网友吵翻了天。
有人说,这场马拉松让热闹了半年的人形机器人“祛魅”了,它看起来更像是个遥控的大号电动玩具,在网络上,人形机器人各种酷炫动作,但在现实中连路都走不稳;也有人说,对新产业应该给予更多的宽容,只有现在的起步,才有未来的发展,就像汽车在诞生之初跑得比马车还慢,但并不妨碍汽车的进步。
北京经开区管委会副主任梁靓介绍,此次“人机半马”比赛,更像一次产业对话和机器人“大练兵”。相比于最后的成绩,业内普遍认为,这更像是一场人形机器人系统工程的极限演练。
虽然很多人对“首马”中机器人的表现有些失望,但实际上人形机器人这两年的发展在提速。以机器人本体为例,过去一两年迭代的速度,可能超过了之前10年的迭代。
今年初,“具身智能”首次被写入《政府工作报告》,成了产业界的热词。具身智能产业链足够长,市场体量足够大,而人形机器人是其中技术集成度最高的。在行业被热捧的背后,人形机器人还面临诸多挑战。业界正在探索将大模型与机器人结合,一些企业在思考推动如何将人形机器人在产业中落地。“真正走到我们身边,我认为大概还需要10年左右。”北京通用人工智能研究院院长朱松纯说。
01
当科幻照进现实
4月19日,北京亦庄,作为全球首个人形机器人参与的半程马拉松赛事,热度非常高,尤其是在AI和具身智能概念火热的当下,大家都在关注机器人在赛场上的表现。
在现场,机器人赛道和人工赛道中间有护栏分隔,很多报名参加了半马的人都在跟着机器人一起奔跑,甚至站在两旁为机器人加油欢呼。而无论在家中、地铁上,很多人也在通过直播观看人形机器人在马拉松赛的首秀。
当天有20个机器人参赛,其中7个跑完了全程21公里,而第一个出发的天工机器人不负众望拿下了冠军,用时2小时40分钟,配速达到了每小时八九公里,中途更换了3次电池。
不过,相比于在网络视频上人形机器人的酷炫表现,真实的比赛现场让很多人感觉到了落差。
比如松延动力的N2机器人“旋风小子”在最后的冲刺阶段,不小心摔了一跤,把“头”都摔掉了,甚至有些在外形上拟人化很高的机器人,刚起步就摔在了起跑线上;一些机器人在中途遇到了故障,不得不从补给车里拿出备用的机器人继续完成后续的比赛。
很多机器人都需要人工在旁边辅助,甚至用手搀扶着;一些机器人在赛道上不断走出“S形”路线,陪跑工程师不得不出手拉回来;另外由于高强度运动,导致关节发热,也需要在关键部位经常喷冷却液给机械结构降温。
以至于很多人说,最累的不是机器人,而是在旁边跟随的工程师,他们不仅要跟着奔跑,还需要时刻关注机器人的动向。
根据主办方的介绍,这次参赛的队伍有两种参赛方式,一种是遥控模式,考察的主要是硬件层面的能力,比如关节、电机、能耗、散热等;另一种是跟跑模式,需要机器人能够准确跟随、快速响应前方目标。
而现场大部分机器人采用的是遥控模式,会有工程师在旁边控制机器人的奔跑速度和方向。虽然主办方赛前会为人形机器人赛队提供线路的GPS坐标数据,但这些人形机器人并不能实现完全自主控制。
在网络上关注度很高的宇树机器人,当天的表现也不出色,起步就摔倒。针对表现不佳的质疑,宇树科技还专门发了一则声明,称有好几个独立团队在使用,“不同人操作或开发情况下,机器人的表现差别很大,请大家不要误解。”据悉,清华一个团队拿着宇树机器人去参赛,相当于是拿了宇树的硬件去跑了自己训练的算法。这个团队当天也没能跑完全程。不过也有网友质疑,为什么宇树官方不来参赛?之前又跑又跳、行云流水的视频,是真的假的?
钛虎机器人产品生态负责人谌威则在腾讯科技的一场直播中坦言,这次比赛不只是为了“跑”,它本质上是在测试人形机器人的“基础身体能力”。马拉松是一种非常适合做“压力测试”的场景,比如这次亦庄半马的比赛地形,包含了平地、坡道,全程线路共包括6个左转道、8个右转道,最小转弯角90度。这些都考验了机器人精准的路径规划和灵活的转向能力。
通过这样实战的方式,能够看到问题和发现不足,比如关节精度、热管理、电源系统、控制算法、通信干扰等问题,在这场马拉松赛中得以全面暴露,从而推动整个行业快速迭代。而且在一段20多公里封闭路段的珍贵数据,为企业提供了珍贵的数据。
谌威说,这次比赛最特别的一点是所有参赛企业都在统一标准下,诚实面对自己的技术状态,不再像过去那样通过剪辑展示“机器人陪我一天”的表演场景。对于公众来说,这次是非常难得的真实展示,也是一种科学普及。
02
是祛魅还是加速?
在马拉松之后,有人说“对人形机器人祛魅了”。但从产业实际情况和发展速度来看,包括人形机器人在内的具身智能,其发展是在加速。
“大模型出来之后,机器人行业最大的变化就是驱动范式的变化,从传统的模型驱动方式,变为了一个数据驱动的方式。因为人形机器人要进入到复杂未知场景中,现实中没有这么多模型,那么它最终的理想情况,应该是以数据作为指导,或者说是行为数字化,把我们人在现实工作中的技能采集数据化,然后转移给机器人。”乐聚机器人董事长冷小坤说。
而因为范式的变化,也给具身智能提出非常大的挑战,其一是数据。“相比无人驾驶,具身智能更大的挑战是先有鸡还是先有蛋的问题,即数据从哪来。”智源研究院院长王仲远说。全球电动汽车因为有基本的运行功能,它的辅助驾驶系统每天都可以收集数据进行迭代。“而机器人如果不能完成具体的场景任务,就没办法形成规模化销量,也就无法收集数据、迭代模型,整体陷入了‘死循环’。”
这也能看出这次马拉松赛事,创造出20多公里封闭路段,对机器人运动性能研发的珍贵性。很多机器人公司结束比赛后,已迫不及待地去分析数据。
“数据的稀缺,导致无法实现具身智能的泛化能力。”软通动力副总裁兼技术研究院副院长雒冬梅告诉数智前线,“拿抓取这件事来说,在某一空间某一个节点上,机器人顺利去实现抓取,但换一个空间维度,就做不到了。”
“整个产业目前采用了多种手段,例如虚拟采集、合成数据采集、多模态数据融合采集,来逐步解决数据问题。”雒冬梅说。
不过,这些获得数据的技术路径,也都存在不同程度的挑战。比如,合成数据、生成动作序列的方法中,最大的挑战是空间匹配度并不好。在虚拟空间形成的抓取数据,放到机器人本体上,会出现抓取位置偏差、抓取姿态错误,甚至根本无法成功抓取目标物体,无法完成预期动作。
为此,今年北京、杭州、无锡、南京、重庆等地,都在积极建设数采中心,未来几年将会陆续投产。“它有点像我们之前算力中心的投资逻辑。”雒冬梅说。数采中心是完全面向场景化的,投资很高,比如要采集抹墙机器人需要的数据,就要搭建楼房场景,实际采集、验证后,将数据集提供给机器人企业,降低业界的开发成本,这也可以说是数据要素发展的另一种形态。
在这些数采中心中,实地采集打乒乓球、叠衣服、扫地等一个个技能的数据。如在北京人形机器人创新中心,正全力建设百万量级的高密度、高质量、高通用性数据集。这需要产业链各方联手,如各机器人企业、百度智能云等模型和算力企业。
具身智能面临的第二大挑战,是机器人本身对复杂任务的理解,以及在动作序列中能否形成连贯性,这是下一阶段业界要去重点攻克的难题。
“比如有十位客人,请机器人给其中一个人倒杯水,它可以理解,也可以执行倒水动作。”雒冬梅说,“但如果让机器人引导客人到某个会议室,然后再给他倒杯水,两三层任务,机器人就没法形成连贯性了。”
为什么今年受到关注的Manus,能实现一系列工作,而人形机器人就做不到?雒冬梅告诉数智前线,Manus是数字AI,而具身智能是“物理AI”,两者之间唯一的区别,就是空间维度。而空间维度不断变化,这比训练辅助驾驶难度还要大,因为辅助驾驶还有一系列交通规则可以遵循,而通常的物理空间,没有明确的规则,动态不确定。这还需要大模型的泛化性来解决。
北京通用人工智能研究院院长朱松纯说,现在最大的难点在于(数字)智能体和硬件本体的融合,在全球无论是产业界还是学术界,现在已开始在探讨这两者的结合问题。
03
今年有真实的落地场景吗?
既然人形机器人有这些需要逐步解决的挑战,它什么时候能落地?
其实,伴随人工智能的火爆,今年以来,行业市场中涌现出急迫需求。中工互联董事长智振告诉数智前线,他们打算购买机器人和机器狗,在工业场景下展开探索。“工艺流程要与设备关联,软硬件结合,才能形成闭环和竞争力。”智振提出“具身智能体”概念,它既是智能体,有大模型优化和决策能力,也具备执行能力,比如控制阀门,还能根据外部反馈自我进化。
“以前我比较怀疑,人形机器人为什么要进工业场景?”乐聚机器人冷小坤说,但接触一些企业后发现,其实大量场景,现在只能用人。因为产品的品类太多了,可能每半天或一天就要更换一批产线,而没有一种自动化设备把产线都覆盖掉。在这种情况下,目前最优解就是人形机器人。乐聚在通信和新能源车厂,都在做相同的研发,让人形机器人与场景结合。
冷小坤说,人形机器人什么时候能像博士一样聪明,像家电一样便宜,也就到了产业爆发的时刻。他预测5年内,人形机器人成本能达到一辆小轿车的水平。
雒冬梅则认为,机器人特别适合优先考虑高危场景下的应用,而这还有很多难题要攻克。为此,软通动力已与理工华汇,成立软通天汇特种人形机器人实验室,其中的关键技术之一是人形机器人防爆问题。现有防爆多是外挂或穿戴式,与机器人轻量化相矛盾,软通天汇通过材料、电机等做了结构性优化。同时,实验室中也在开展复杂动作研发,涉及多模态识别、技能训练。
不过,更多企业采取了“沿途下蛋”策略。“具身智能不只是赋能于人形机器人,也可以赋能于多种形态的智能装备。”雒冬梅说。她看到今年一些大型企业,已在一些具体场景中,提出强烈诉求。软通天枢联合生态伙伴,也推出了巡检复合机器人、勘测复合机器人、测量放线复合机器人和天汇Phyxis平台。
“从大模型到本体到控制到场景,人形机器人和工业机器人不一样,靠任何一家公司是搞不定的,它必须是一个大的生态,然后整个产业链一块配合。”北京通用人工智能研究院院长朱松纯说。
近些年,国家在顶层设计上对具身智能做了很多的布局和政策引导,人形机器人产业链因多年布局已逐渐成熟。上游关键零部件如机械臂、关节、丝杠等,国内具备一定实力,供应稳定;中游大模型、操作系统、机器人“大脑小脑”、仿真训练企业,则在抢占行业垂类赛道,才能发挥更大优势;下游各类人形机器人公司,多在2021年后创立。
“对人形机器人的发展不能期望太高、太快,因为大众对人工智能的理解,总是在某些热点上,一旦热点来了,以为马上就到了。但如果没有马上达到他的预期,他的态度马上又翻转到另一边去了。”朱松纯说。而相比这样的情绪起伏,行业需要一个比较稳定、长期的发展环境。
“过高的期望会损害这个产业,因为确实还没到那个成熟度。”智源研究院王仲远说,“现在有些不切实际的期待是两三年后,人形机器人遍地跑,然后哪都用上。这个期待恐怕会落空。”他说自己赞同,RoboCup联盟预期的,人形机器人在2050年之前,战胜足球世界杯冠军。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。