为坚决落实《打赢蓝天保卫战三年行动计划》、《柴油货车污染治理攻坚战行动计划》的相关要求,2020年4月23日,生态环境部正式对外发布《重型车远程排放监控技术规范(征求意见稿)》(以下简称“征求意见稿”)。征求意见稿在gb 17691-2018的基础上,进一步明确了重型车远程排放监控的系统架构、平台技术要求、终端性能指标、通讯协议规范,标志着重型车排放监管即将全面步入正规化阶段。
数据质量是整个重型车远程排放监控工作的重要基石,监控数据质量的好坏将直接影响后续数据分析、应用乃至决策的科学性、准确性。
目前,重型车远程排放监控工作重点仍集中在平台建设、终端联调及数据存储方面,数据质量和可用性问题没有得到足够重视。经过分析发现:
(1)终端校时准确率普遍偏低,无法准确判定终端数据发送时间。
(2)终端丢包率普遍大于标准要求的1%,数据完整性不达标。
(3)scr下游nox无效率普遍偏高,不利于后期排放分析应用。
北理新源建立了一套标准化、专业化的“端到端”数据质量评估体系,系统化、精准化识别车辆远程数据传输存在的问题,可辅助相关部门进行终端硬件设备和平台软件系统的优化工作,不断提高车辆远程数据接入质量,为后期基于远程监测数据开展深层次的分析应用,打赢柴油货车污染防治攻坚战管理决策奠定坚实基础。
数据质量评估体系
根据gb 17691-2018及“征求意见稿”要求,从数据缺失值、无效值、越界值、异常值四个维度建立数据质量检验规则,作为评价依据。
(1)缺失值:是指在车辆登入状态下,监管平台应收的却没有收到的数据。
(2)无效值:是指按gb 17691-2018附录q数据格式要求,上报值被定义为无效的数据项。
(3)越界值:是指车载终端采集的数据项中超出“征求意见稿”第4部分要求数据范围的数据。
(4)异常值:是指在符合gb 17691-2018附录q中数据格式和范围要求的有效数据中,上报数值不在该字段值合理逻辑界限内的数据。
将数据质量核查作为抓手,依据数据质量评估规则,建立数据质量评估算法。以车辆静态数据和终端上报数据为对象,对影响数据质量各环节的核心指标进行计算,全局化、数值化展示影响数据质量的各项指标现状,使管理者对终端数据质量现状做到心中有数。
图 数据质量核查结果展示
通过北理新源重型车数据质量评估体系,将有效解决目前重型车远程传输数据质量分析中检查手段单一、及时性与准确性程度不够、管理难度大等问题,有效提升整体数据质量,为后期数据分析和决策支撑奠定坚实基础。同时,该评估体系具有良好的扩展性,可广泛应用于车辆监管部门、车辆运营单位、终端制造企业等各类主体,提升行业大数据分析平台数据质量。
撰稿:徐 莎
审核:刘 鹏