
不止卷硬件!理想新一代VLA智驾大模型有望下半年落地

3月10日消息,据媒体报道,理想汽车正在研发下一代VLA(视觉-语言-动作)智驾大模型,目标是于今年下半年实现项目落地。
理想汽车在去年二季度财报电话会议上表示已启动端到端VLA模型的研究,将两个模型合二为一,使多模态大模型内化为端到端智驾大模型的一种能力。
那么,VLA智驾大模型与此前的智驾系统有何区别呢?
VLA智驾大模型结合了端到端和VLM(视觉语言)多模态模型的优势,能够提升智驾系统对复杂场景的理解能力,从而提高智能驾驶的精准度。
与端到端大模型相比,VLM对图像和场景的理解能力更强,但端到端大模型存在决策不可解释以及难以处理部分场景的缺陷。
当前,VLA是智能驾驶领域的核心竞赛之一,理想汽车、吉利汽车和元戎启行都在积极推动其落地。
然而,VLA的落地面临较大挑战,除了模型研发需要时间外,目前市面上的芯片性能大多无法支持其运行。
不过,英伟达即将量产的Thor系列芯片有望解决这一问题。

文章版权及转载声明
作者:访客本文地址:https://zsclv.com/zsclv/4679.html发布于 2025-03-10 13:09:00
文章转载或复制请以超链接形式并注明出处好豆网