大数据挖掘车辆行为,北理新源助力非法加油站监管-ag凯发k8国际

ag凯发k8国际-k8凯发天生赢家一触即发人生

大数据挖掘车辆行为,北理新源助力非法加油站监管
时间:2020-06-24 09:09来源:北京理工新源 作者:bitnei

一、背景及意义
 

国v及国六排放标准实施以来,我国柴油车主要采用选择性催化还原的技术路线,在使用中需要加注尿素降低氮氧化物的排放量。很多车主出于成本因素,采用多种作弊方式使氮氧化物控制装置失效或采用劣质尿素水溶液。同时,据行业协会对京津冀及周边地区重型柴油货车油箱油品抽样调查,柴油样品符合标准的不足9%,其中硫含量平均超标110倍,最高超标800倍,超标情况触目惊心。
 
非法加油站不具备相关危险品经营的资质,往往存在严重的安全隐患;销售的油品质量无法受到监督、以次充好导致车辆氮氧化物等污染物排放超标;缺少相应的油气回收装置和加油、卸油过程中的泄露会形成对大气、土壤及地下水质的直接污染。非法加油站未经注册备案,难以获取其位置信息,对非法加油站的人工排查需投入大量人力、物力,且时效性较差。
 
随着车联网技术的发展,积累了大量车辆监测数据,如何从这些数据中高效提取信息并应用于实际业务场景中显得尤为重要。北理新源利用大数据工具,为有效解决柴油车加油行为的监管手段缺失问题,提出一种基于移动源大数据的柴油车加油行为环保合规性监管方法,对重点移动源实现精细化管理提供数据支持。
 
二、基于大数据的加油行为检测方法
 
利用车联网大数据监测柴油车加油行为的方法包括数据预处理-加油行为识别-结果输出:
 
1、数据预处理
 
从数仓中提取gb17691原始报文数据,根据柴油车辆数据质量分析标准和内部通讯协议要求,基于数据缺失值、异常值、无效值、越界值四个维度建立数据质量分析标准,对于车载tbox检测的油箱液位时间序列数据进行数据预处理;
 
2、加油行为识别
 
柴油车行驶和加油行为中的油箱液位变化曲线具有一定特征,将经过预处理后的油箱液位数据进一步作滤波、采样、排序和阈值筛选处理获得加油窗口,用于检测加油行为,保证加油或行为识别的鲁棒性,减少信息的遗漏和缺失。同时,在识别加油行为的过程中,引入决策回归树方法,降低传感器噪声的干扰,提高识别准确度。
 

图 1油箱液位变化特征检测 

图2加油点分布图

3、输出数据

 
输出数据包括黑加油站位置、车辆加油特征画像:
 
在较长时间尺度内,柴油车辆到固定加油站重复加油行为呈现出空间上的聚集特征,因此对一定时间内的大量加油点聚类采用grid-search调参和dbscan聚类及方法,对加油点进行聚类;计算类簇面积和加油总量作为评估参数优劣的指标,并选择最优参数,输出最终聚类结果作为加油站位置。将聚类结果与map_poi中已有的备案加油站数据匹配,若无法匹配到备案加油站,则可能为黑加油站,作为排查非法加油站的辅助依据。
 
按时间维度对同一辆车的加油行为时间序列进行分析,得出相邻两次车辆加油行为间隔的行驶里程、柴油百公里消耗量,分析车辆的柴油消耗是否合理,是否可能存在不合规柴油使用行为,并可统计车辆在合规黑加油站加油比例等,获得车辆的加油特征画像。
 
三、某市实践案例
 
对于某地区所有柴油车在2019年11月-2020年3月的103058个加油点数据按照以上方式进行筛选和统计,得出统计车辆共5086辆,该地区加油点71087个。聚类获得523个类簇,其中能匹配到poi加油站的类簇有303个。
 

图3某地区加油点分布图(整体) 

图4某地区加油点分布图(局部)

由上图可见提取出的加油点呈现出较明显的聚集特征,而且聚集形成的类簇空间位置和已备案加油站匹配情况较好,一些无法匹配到已知加油站但聚集特征较为明显的类簇有一定概率为黑加油站,虽然仍存在一些沿道路分布的散点,但是数量相对较少,根据具体到单个加油点的数据质量分析,可能与数据缺失问题导致的加油点时间定位误差和gps飘移导致的空间定位误差有关。
 
四、助力地方精准识别非法加油站
 
综合以上特点,该算法相对传统监测方法能更高效地解决非法加油监管问题:
 
1、传统监测方式的不足
 
目前的检测加油行为方法一般为在加油站设置车辆身份识别和校验装置的方式,利用无线通信将车辆加油信息传输至远程服务器,该方法对加油站相关基础设施的及时更新速率和读写存储数据结构的统一程度要求较高,且无法检测未经注册的黑加油站及其相关加油行为,不仅会造成信息的遗漏和缺失,而且会存在传感器噪声的干扰,使得检测结果不准确。
 
2、本算法具有的优势
 
相对传统监管方法,本算法通过移动端对车辆行为直接进行监测,能高度保证数据的时空连续性、完整性和数据结构的一致性,有助于进一步提取分析有效信息,辅助相关部门决策。

 

撰稿:刘晏伶

审核:龙超华






网站地图