最近,Waymo 在自动驾驶领域又迈出了重要一步。这家公司一直以来都把与谷歌 DeepMind 的合作视作自己的竞争优势,如今,他们正在利用谷歌的多模态大型语言模型 Gemini 来提升其自动驾驶出租车的训练效果。
Waymo 发布了一篇新的研究论文,介绍了一种名为 EMMA 的 “端到端多模态模型”,该模型能够处理传感器数据,从而生成自动驾驶汽车的未来行驶轨迹。这意味着 Waymo 的无人驾驶车辆可以更智能地做出行驶决策,并能有效地避开障碍物。
这项新技术的重要性不仅在于它的创新,还因为它可能改变目前大多数大型语言模型的应用范围。Waymo 希望将 MLLM 视为其自动驾驶系统的 “一级公民”,这代表着未来的自动驾驶可能会与当前的聊天机器人或图像生成器有很大的不同。
在这篇论文中,Waymo 提到,传统的自动驾驶系统通常会为各种功能开发特定的 “模块”,包括感知、映射、预测和规划等。虽然这种方法在过去几年内取得了一些进展,但它的局限性也显而易见,尤其是在应对新的复杂环境时。Waymo 认为,像 Gemini 这样的 MLLM 可以解决这些问题,因为它们具备广泛的 “世界知识”,并且能够进行 “链式思维推理”,模拟人类的逻辑推理。
EMMA 模型被开发出来是为了帮助 Waymo 的自动驾驶出租车在复杂环境中进行导航。比如,当遇到动物或道路施工等情况时,EMMA 能够帮助无人驾驶汽车找到最佳行驶路径。不过,Waymo 也意识到 EMMA 还有一些局限性,例如目前无法处理来自激光雷达或雷达的3D 传感器输入。
Waymo 在这方面的研究还需要进一步深入,但他们希望这项成果能激励更多的研究,以应对目前存在的问题,推动自动驾驶技术的发展。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。