第十四代英特尔@酷睿™ 处理器:性能飞跃,重塑计算新体验iPhone 16 Pro Max立减500元 来京东618领3C数码消费券下单更优惠微星游戏本新品5060/5070配置上市,神影/星影系列国补爆款抢先购!职业选手同款至高省50% 京东电竞键鼠三重补贴引爆极致性价比学习机买贵双倍赔 全网不怕比 入手学习机认准京东618京东3C数码618开门红1小时呈爆发式增长 上万个趋势单品增长超10倍iPhone 16 618购机指南:京东国补覆盖更广 同款机型比天猫便宜400元京东618百万份“AI加油包”助你提升职场效率 1分钱即可获得心仪大奖用AI告别每日2小时繁琐工作 京东618推出百万份AI加油包助用户全面提效羊毛党带路!在京东618用“京补合约”下单iPhone 16 Pro只要83元!5月30日晚8点来京东618用“京补合约”下单 超6000元手机也能享国补华为nova 14 Pro仅需3249元 来京东618购手机享国补加倍补壳牌挚美漆面保护膜,全面守护座驾,助力美好出行打造“全球一朵云”,广汽迈入出海3.0时代Nothing Phone(3)将推全新灯语设计,定位首款真旗舰奔驰召回部分进口G级汽车 涉及ESP系统软件问题算力互联网试验网落地纪实:技术突破、标准引领与生态协同纤薄背后 看三星是如何在Galaxy S25 Edge上实现突破的深圳海辰储能柜获TÜV南德CE-LVD认证掠夺者·圣盾7000震撼发布,搭载RTX 5090突破电竞性能新纪元!
  • 首页 > 产经新闻频道 > 汽车时代

    特殊时期李想再谈智驾:VLA才是未来,行业正在黎明前的黑暗

    2025年05月08日 14:20:32   来源:雷科技

      2024年底,理想汽车CEO李想在理想AI Talk第一季上表示,基座模型到一定时刻,一定会变成VLA(视觉语言行动模型)。2024年10月,理想汽车才开始推送端到端+VLM(视觉语言模型)智驾方案,年底就表示要押注VLA,可能会给用户否定原方案的感觉。

      2025年5月7日,理想AI Talk第二季上,李想再次强调,端到端+VLM的能力不足,现阶段VLA是最强架构,只有VLA的能力可以接近人类,甚至超越人类。这一次,李想详细讲解了VLM的不足,以及理想汽车是如何训练VLA的。

    图片1.png

      (图源:理想)

      李想举例,VLM对于位置的判断非常糟糕,如果是两三个ETC出入口,还能作出准确判断,但若遇到了京承高速这种十几个ETC的高速出入口,VLM模型就不知道怎么判断了,而且问题出在模型架构,即便喂更多语料给VLM都无法解决这个问题。

      VLA的训练分为VL(视觉语言)基座预训练、辅助驾驶后训练、辅助驾驶强化学习三个部分。其中预训练相当于人类通过视觉数据、语言数据、视觉语言联合数据学习和认知物理世界、交通知识,训练出VL模型基座。

    QQ20250507-202219.png

      (图源:直播截图)

      后训练则相当于人类在驾校学习开车,通过Action(动作)数据对周围环境和自车驾驶行为编码,将VL模型基座训练成VLA司机大模型。同时,VLA采用短思维链的特性,搭配Diffusion扩散模型对于他车轨迹和环境的预测,令其实时性更强,在复杂交通环境下依然具备较强的通行能力。

      强化训练则相当于我们日常开车,可以通过RLHF(基于人类反馈的强化学习),训练大模型对于交通规则的理解能力,并使VLA更符合用户的驾驶习惯。

      最终产品会以司机Agent(智能体)的形式呈现,可以理解人类自然语意,用户怎么指挥,车就怎么开。理想公布的测试视频中,司机Agent可以根据语音指令,在不退出NOA的情况下切换路线,或者根据用户指令在高速出入口走人工通道。

    QQ20250507-202950(1).png

      (图源:直播截图)

      VLA并未摆脱端到端智驾方案的黑盒问题,为此理想在2024年底组建了超过1000人的超级对齐团队,并构建了仿真世界模型,可在虚拟世界中验证司机Agent的专业能力、职业能力和构建信任的能力。原本依靠人类司机验证,一万公里成本高达17万元到18万元,仿真世界中1万公里验证成本仅4000多元。

      理想汽车车表示,由于英伟达Orin-X芯片无法直接运行语言模型,端到端+VLM对于部分企业而言仍是不小的挑战。理想拥有编译团队,自研了底层推理引擎,使芯片可通过INT4(4比特整型)量化的方式运行VLM,理想在智驾技术领域的原创性,高于理想汽车核心竞争力之一的增程技术。

      不过理想汽车表示,VLA的实现不是突变过程,而是从规则算法到端到端大模型及端到端+VLM,再到VLA的进化过程,唯有夯实基础,才能实现VLA。这也解释了为何理想会在推送端到端+VLM方案后,又押注VLA,基于规则算法和端到端+VLM的技术积累,理想才跨步到了VLA阶段。

      对于近期辅助驾驶车型接连出现事故,消费者失去信任,甚至有网友呼吁叫停辅助驾驶的情况,理想则认为更像是黎明前的黑暗,技术不会停止向前发展。

      的确,辅助驾驶车型出现事故,只会让车企在研究技术时更加谨慎,增加验证频次,不会导致车企因噎废食,技术领域的竞争将更加激烈。一直处于国内辅助驾驶技术第一梯队的理想,也许能够通过VLA方案,为行业带来新的思路与方向。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。