理想汽车技术发布:12篇论文入选CVPR 2026,AES系统实测生效

摘要:理想汽车12篇论文入选CVPR 2026,涵盖感知规划与世界模型;AES系统在130km/h逆光场景成功避让工程车。

理想汽车12篇论文入选CVPR 2026顶级学术会议,同时AES自动紧急避让系统在130km/h高速逆光场景下成功避免碰撞,验证了具身智能与主动安全技术的最新落地成果。

外观设计

本次并非新车外观发布,而是聚焦于支撑车辆智能化体验的底层视觉感知技术突破。在CVPR 2026中,理想汽车SparseWorld-TC论文被收录为Oral口头报告,该架构直接决定了车辆对外部环境的“视觉理解”能力。传统智驾方案依赖鸟瞰图投影和离散化token表示,存在信息损失瓶颈,而SparseWorld-TC直接从原始图像特征端到端预测多帧未来三维场景占据情况。这意味着车辆不再仅识别当前障碍物,而是能提前1至3秒预测周围整个三维空间的变化趋势。在nuScenes基准测试中,该方法在任意未来轨迹条件下均保持高精度,为复杂路况下的行车安全提供了更精准的环境预判基础。此外,InfiniDepth论文将深度建模为神经隐式场,突破了传统离散网格分辨率上限,使车辆对物体远近、精细几何细节的感知更加连续细腻,有效提升了大基线场景下的渲染质量与感知置信度。这些视觉感知技术的迭代,虽不改变车身线条,但实质性地拓展了车辆的“视野”边界与认知精度。

AES系统高速逆光避让实测画面

内饰与科技

智能座舱与交互体验的核心升级体现在认知模型与语言智能的效率提升上。LinkVLA论文解决了语音指令与车辆动作执行不匹配的痛点,通过将语言和动作特征统一编码,并采用两步解码替代传统逐步生成,使指令遵循准确性显著提升的同时,推理延迟降低86%,大幅改善了人车交互的流畅度。CogDriver论文提出认知惯性机制,让AI具备历史驾驶状态记忆能力,结合时空知识蒸馏训练决策一致性,在Bench2Drive基准上驾驶得分提升22%,轨迹误差降低21%,有效减少了辅助驾驶过程中的行为抖动。针对多模态大模型部署成本高的问题,FastMMoE框架在不重新训练的前提下,通过精简MoE架构冗余计算,最高削减55%浮点运算量且保留95.5%性能,为车端边缘计算和智能座舱轻量化部署提供了关键支撑。Switch-KD则通过跨模态知识蒸馏,让0.5B小模型拥有逼近1.5B模型的理解力,进一步释放了座舱芯片算力潜能。

动力与续航

本次技术更新聚焦于智驾系统的“决策动力”与安全冗余,而非三电系统。在端到端规划领域,SGDrive框架将驾驶理解分解为“场景-交通参与体-目标”三层级结构,模拟人类认知逻辑,在NAVSIM纯视觉方案中取得最优性能。强化学习方面,PlannerRFT框架配合自研nuMax仿真器(推演速度提升10倍),解决了AI规划器在不同路况下生成自适应轨迹的难题。实车验证层面,AES自动紧急避让系统近日在高速NOA模式下,于130km/h逆光弯道中成功识别无标识工程车并自动向右避让,弥补了AEB制动距离不足的极限场景短板。世界模型领域,AD-R1论文通过反事实合成流水线,修正了模型仅基于安全数据训练导致的乐观偏差,将其作为危险感知模块整合进闭环强化学习,有效降低了仿真及实际场景中的安全违规率,为高阶智驾提供了更可靠的安全底座。

价格与配置

此次技术升级属于研发成果展示与OTA功能迭代范畴,不涉及车型售价调整或新增硬件配置包。理想汽车2025年全年研发费用达113亿元创历史新高,连续5个季度保持30亿元左右高强度投入。相关技术如AES、端到端规划等将通过后续软件推送覆盖现有车型,用户无需额外付费即可获取安全与体验升级。值得注意的是,近期也有分析指出辅助驾驶在特定分叉路口场景仍存在轨迹预测不足的问题,官方正通过增强全空间多模态轨迹预测与社会驾驶合理性评估体系进行优化,建议用户在复杂路段保持接管意识。

结尾

CVPR 2026论文已正式发布,AES等功能正通过OTA持续推送;针对已知长尾场景的算法优化预计将在后续版本中逐步验证上线。