
“世界模型”&“强化学习”&“模型自进化”,更基础的难题尚未有效解决:驱动这些先进范式的数据从何而来?又该如何实现高价值释放?

近日,第十三届智能网联汽车技术年会(CICV 2026)在上海隆重举行。车凌科技产品总监陆羲文先生受邀并发表《智能网联汽车高价值数据应用实践:从数据采集到AI闭环》主题演讲,分享了从多源数据采集治理,到高阶场景筛选构建,从而实现AI驱动推理闭环的数据应用协同方案。
以下为演讲实录:
产业拐点:数据质量决定AI能力天花板
当前,智能网联汽车正加速驶入“大模型时代”。无论是端到端自动驾驶模型的训练迭代,还是智能座舱大模型的场景优化,亦或是车辆健康管理的AI诊断升级,其核心驱动力都指向同一个要素:高质量的车端数据。
陆羲文在论坛上指出,行业普遍面临“数据爆炸但价值稀缺”的结构性矛盾—车辆ECU数量持续增加,传感器信号密度不断提升,数据体量呈指数级膨胀,但真正能够支撑模型训练、故障诊断和场景泛化的高价值数据,依然严重匮乏。“数据质量决定了AI能力的天花板。”陆羲文强调,“没有高质量数据的持续输入,大模型的智能化就是无源之水。”
技术突破:构建毫秒级精度的数据高速公路
从“全量采集”走向“精准采集”,车云协同成为关键。面对AI时代对高价值数据的需求,车凌科技提出“精准采集 + 智能闭环”的整体思路,构建覆盖车端、云端与AI训练链路的数据协同体系。

在车端采集层,车凌科技自研灵活数采平台支持200ms级高频采集能力,可针对轻微碰撞、急加速、电池异常、紧急变道等关键事件,完整保留事件前后的多域关联数据。相比传统“全量上云”的模式,车凌科技更强调“在正确的时间,采集真正有价值的数据”。通过事件触发、边缘计算与动态任务机制,系统能够根据场景实时调整采集策略,在降低带宽与存储成本的同时,提升有效数据占比。此外,平台还支持底盘、动力、座舱、智驾等跨域数据实时关联上传,解决传统车端系统中“数据孤岛”问题,为后续AI分析与场景还原提供统一数据基础。
在传输层,高压缩比的数据编码技术进一步降低大规模车队数据上云成本,使长期、持续的数据运营真正具备商业可行性。
AI闭环的核心,不只是训练模型,而是让数据持续自我进化。
在云端分析层,车凌科技构建了从数据采集、场景识别、异常归因到模型优化的完整闭环体系。车端上传的多维数据进入云端后,系统可自动完成场景识别与异常分析,并基于分析结果生成新的数据策略与训练需求,再实时下发至车端。这意味着:当某类异常场景被识别后,系统能够自动扩大相关数据采集范围,持续补充训练样本,推动模型不断优化。这种“采集—分析—训练—再采集”的闭环机制,使车辆智能能力能够在真实道路环境中持续演进,而不是停留在实验室数据阶段。
场景落地:数据+AI全场景价值释放
从“人工经验诊断”走向“数据驱动诊断”。
在智能诊断场景中,车凌科技正将AI能力与车云数据闭环深度结合,构建新一代远程智能诊断体系。传统诊断模式高度依赖人工经验与单点故障码分析,面对复杂故障、偶发问题与跨域异常时,往往存在定位周期长、复现困难的问题。基于多源数据关联、知识图谱与AI分析能力,车凌科技能够实现:故障场景自动关联、历史案例智能匹配、多域信号联合分析、远程辅助定位与建议生成等。在部分复杂故障场景中,系统诊断准确率可达到90%以上,常规问题处理效率也得到显著提升,帮助车企缩短售后周期并降低用户停车时间。

面向全球化运营,数据能力正在成为中国车企的新基础设施。目前,车凌科技的数据采集与分析平台已在泛欧洲高合规区域及东南亚市场完成多车型验证。面对不同国家的网络环境、法规要求与数据合规体系,平台能够稳定支持跨区域数据协同与远程运营,为中国车企全球化提供统一的数据底座能力。
随着汽车产业进入“软件定义汽车”与“AI驱动汽车”阶段,行业竞争正在从单一功能能力,逐渐转向数据能力与持续进化能力。而数据闭环,也正在成为下一阶段智能汽车竞争的核心基础设施。