基座模型重构自动驾驶:一场迟到却必然的技术路线革命
2019年,我第一次接触辅助驾驶项目时,行业还在争论"视觉为主还是激光雷达融合"。那时判断算法好不好,核心指标是识别准确率、漏检率这些单点数据。整个研发团队的工作模式,是围绕一个个功能模块做定向优化——车道线识别优化三个月,换来准确率提升两个百分点;目标跟踪改版,又耗掉两个月。
这种迭代方式在功能有限、场景可控的阶段确实有效。但当城市NOA功能开始大规模铺开,问题就暴露了:系统能认出路、认出车、认出行人,可一旦遇到施工绕行、暴雨天、地下停车场出口这类边界场景,表现就不稳定了。用户反馈用一句话概括:"能用,但不敢常用。"
单点优化触达天花板
去年Q3,我们内部做过一次复盘。城市NOA功能的算法指标在过去两年持续提升,但用户实际使用频率几乎没变化。数据指向一个核心矛盾:传统分模块优化解决了"能识别"的问题,却没解决"能理解"的问题。系统知道前方有辆公交车,却判断不出它可能要并线进站;能识别出施工锥桶,却不能理解"绕行"这个概念的完整语义。
元戎启行CEO周光在前几天论坛上的判断,我高度认同:下一阶段竞争的关键不再是算法性能的边际提升,而在于系统层面的"认知能力"。这不是某个模块的改进,而是整个技术架构的重构。
基座模型:统一架构的解题思路
基座模型的核心逻辑,是用一个大一统的模型替代多个独立小模块,实现决策、感知、评估的统一建模。好处显而易见:信息在不同模块间传递时的损耗消除了,模型能基于全局上下文做推理,而不是依赖预设规则硬编码的"if-else"。
元戎启行披露的数据闭环周期从5天压缩到12小时,这个数字背后意味着什么?意味着从数据采集、清洗、训练、验证到部署的全流程效率提升了一倍以上。更短的闭环周期带来更快的迭代速度,而迭代速度在当前阶段的竞争优势,怎么强调都不为过。
规模化不等于能力跃迁
但必须泼一盆冷水:车队规模扩张和系统能力提升之间,从来不存在简单的线性关系。元戎启行已经量产30万辆、累计13亿公里运行里程,这些数据是重要资产,但资产本身不会自动转化为能力。真正决定系统价值的,是单位能力的稳定性与可复制性。
他们提出的2026目标——100万辆交付规模、MPCI1000公里、高频使用率50%——指标设计很清晰,但落地难度不小。尤其是高频使用率这个指标,它不只关乎技术,还关乎用户体验、产品设计甚至用户教育。
人才绑定路线
引入DeepSeek背景的阮翀担任首席科学家,这个动作信号明确:基座模型方向不是试水,而是主战场。多模态能力在自动驾驶领域的价值,正在被越来越多人认识到——视觉、语言、地图信息的多模态融合理解,是通向"真正理解驾驶场景"的必经之路。
智能驾驶的竞争正在从"功能竞赛"转向"认知能力竞赛"。在这个阶段,单一技术优势很难形成壁垒,真正的分水岭将来自系统工程能力、数据闭环效率与长期投入能力的叠加。留给中小玩家的时间窗口,正在快速收窄。



