车辆越来越多地转变成复杂的数字系统,产生大量的高频数据。随着传感器、连通性、GPS和ADAS系统等驾驶员辅助设备的广泛应用,以及逐渐向自动驾驶汽车的转变,每辆车的数据生成预计将呈指数级增长。

从车辆的数据量可以从每小时几千字节(当车辆被跟踪时相隔几分钟)到每小时几十兆字节(当高频车辆传感器数据被传输时)不等。这就带来了两个挑战——一是传输如此庞大的数据量,二是分析数据以在如此庞大的数据量中找到模式。第一个问题可以通过某种程度的边缘计算来解决,使用预先训练好的模型部署在能够处理这些数据的板载设备上。这节省了数据传输,只发送需要进一步注意的数据或在进一步分析步骤中作为其他模型输入的数据。对传送的数据进行分析和建模,对于解决个别车辆或车队一级的车辆健康、安全、效率和利用问题,以及为区域和城市一级的监管和执法提供替代办法,都具有巨大的价值。本文提供了利用此类数据分析所提供的价值示例,其中一些来自我们在该领域获得的经验。正是通过从数据中得出这样的见解,效率的提高可以实现,并在汽车行业的价值链上逐步发展。

车辆健康

一种令人信服的数据分析用例包括使用ECU传感器数据确定车辆健康状况。车辆的ECU报告多个参数,这些参数可能指示潜在的车辆问题。这些参数的操作范围可以用作检测异常的潜在阈值,但它们并不表示车辆的健康状况不佳,因为在车辆的正常运行中可能会期望一定数量的异常值,并且这些参数值随后可以恢复到正常范围内。正常工作范围。实际上,车辆报告的诊断故障代码是基于这样的操作范围和发生频率的。

在控制不同环境条件和驾驶状态的同时,建立特定车辆模型的参数阈值一直是人们感兴趣的领域,而数据挖掘可以发挥关键作用。

在控制不同环境条件和驾驶状态的同时,建立特定车辆模型的参数阈值一直是人们感兴趣的领域,而数据挖掘可以发挥关键作用。在这里,来自车队的数据定期报告参数,经过清理和过滤以去除无效值,并对缺失值和异常值进行处理后,可以用于定义车辆子系统的运行机制和不同环境条件下特定车型的异常值阈值。可以为单个参数或为多个环境条件(如环境温度、压力、相对湿度和海拔)以及不同驾驶状态(怠速、加速、制动、巡航等)的一组参数定义运行机制。针对不同环境条件的操作制度将确保行为和外部因素受到控制,并且只考虑由于车辆健康而引起的变化。这些操作机制本身的阈值可以使用基于距离(如欧几里得距离,马氏距离等)或基于相关性甚至基于直方图(分布)的不同多元统计技术进行参数化。

由于数据是从多辆车中汇集而来的,因此可以从给定车辆模型的历史数据中挖掘或“学习”每种运行状况的阈值,并在有新数据可用时不断刷新这些阈值。当然,在从表现出异常性能的车辆中滤除车辆数据后,需要注意确保每个操作方案的基线都已估算。这可以通过几种无监督的学习方法来实现。然后可以通过将车辆在运行状态下的参数与基线值进行比较来确定车辆的健康状况。可以通过组合每种操作方案的得分得出车辆的总体健康得分。

该框架可能非常具有挑战性,实现这一点需要在边缘完成重要的数据管理任务,并与后端系统交互,后者不断从车辆池中挖掘数据并刷新基线。车辆的健康状况评分可以通过在车载系统上部署算法来设计在边缘,也可以在后端系统上通过api公开车辆的分数,以便在仪表板上显示。这取决于系统需要设计的用例——例如,如果需要在汽车仪表盘上提供关于车辆健康状况的实时信息,将计分算法部署在边缘,并让车辆只与后端通信,以定期获取更新的基线值是合适的。分数也可以传输到后端,以便车队仪表板显示。另一方面,如果需要仅在车队级别监控车辆健康状况,则可以对车辆参数进行某种程度的预处理,以最小化数据传输,并在车辆上进行聚合和转换。可以在后端使用这些聚合的数据进行评分和监控。

驾驶员行为和风险评分

一项对美国交通事故的分析显示,超速是超过28%的交通事故的原因之一(国家公路运输和安全管理局,2014年)。急刹车是另一个分心驾驶的迹象,也是一个危险因素。

我们分析了美国和加拿大超过8500万英里的驾驶数据,并根据这些车辆的真实事故记录建立了超速、硬刹车和快速加速行为之间的关联模型。这是驾驶员评分算法的基础,该算法利用多层数据集,包括覆盖天气、时间、事件大小和频率、车辆类别等的行为数据。这些驾驶员分数和事故的模型显示,刹车分数每增加10分,发生事故的风险就降低23.6%。同样,加速分数增加10分,风险降低3.3%。司机总分增加10分,风险降低11.4%。当暴露风险也被纳入总分(作为保险得分)时,总分每增加10分,发生可预防事故的风险就会降低48.6%。这些模型表明,远程信息技术数据可以很好地衡量行为和暴露风险,保险公司可以用来为产品定价,个别司机和车队可以用来改善驾驶行为以减少风险。监测车队的司机行为并提供反馈可以极大地降低事故风险并提高车队效率,而基于使用的保险计划,利用司机分数来激励良好的驾驶行为,可以有助于改善交通部门的整体安全。

这些模型表明,远程信息处理数据可以很好地衡量行为和暴露风险,并且可以由保险公司用于定价产品以及由个人驾驶员和车队用来改善驾驶行为以减轻风险。监控车队的驾驶员行为并提供反馈可以极大地降低事故风险并提高车队效率,而基于使用情况的保险计划则利用驾驶员评分来激励良好的驾驶行为,从而可以改善运输行业的整体安全性。

分析历史驾驶模式是评估风险的另一种有效方法。可以使用个人驾驶的机器学习模型根据过去的驾驶模式预测行为,从而通过激励或传递给车辆仪表板的适当通知来抢先冒险驾驶行为。

最近,基于视觉的高级驾驶员辅助系统已经可以作为翻新产品使用,以通过图像识别向驾驶员发出有关交通速度限制的警告,并通过更高级的模型向驾驶员发出碰撞警告或停车距离估计的警告。这些还使用预先训练的AI模型提供车道偏离警告以及分心驾驶和困倦驾驶检测。根据报告的1999年至2008年的碰撞数据,此类车载系统估计可将死亡人数减少多达16%(来源:CASR报告系列,CASR094。汽车安全研究中心,澳大利亚阿德莱德大学)。违规的视频片段被发送到云存储库,可以在需要时进行查看。

燃油经济性

燃油经济性是数据分析可以提供有用见解的另一个领域。在印度,ARAI通常在底盘测功机上测试新车型,该测功机模拟在印度的驾驶,使用改进的印度驾驶循环(IDC)进行排放和燃油性能测试。这些测试为每种车型提供了一个燃油经济性性能值,但由于地形、天气条件、驾驶行为以及驾驶模式的差异等各种因素,这可能与现实情况下的实际性能存在显著差异。可用的大量数据从多个车辆粒度级别的——每一秒甚至之行的最后一站——可以用来估计燃料经济性能使用基于人口模型在访问级别,可以提供巨大的价值基准测试每个汽车生产型号的燃油经济性。

例如,使用来自超过2.1亿英里的燃油消耗数据,我们已经能够为多个地理区域和季节的2500多种年制品牌发动机开发这样的燃油经济性基准。这些基准使我们能够针对某个区域和季节的特定平均行驶速度,根据这些基准对出行进行评分,并可以突出表明出行的燃油效率是否由于不良的驾驶行为或由于可能的车辆健康问题而变差。具有基于人口的基准可以帮助监管机构评估车辆的实际燃油性能是否符合规定的标准,并据此制定标准。车辆制造商还可以从符合政策和法规的此类数据和基准中受益。

与驾驶行为相关的燃油消耗建模还可以在个人驾驶行为(如刹车和超速)导致的额外燃油消耗之间建立定量联系。这可以从燃料的角度量化与不良驾驶行为相关的成本。例如,对于一款特定的中型商用车,我们可以将一次硬刹车事件与燃油增加0.16升联系起来,将时速超过120公里每小时1分钟的速度与0.05升联系起来。

加速度计数据应用

车载设备通常配备有加速度计,当超过某个g力阈值时,该加速度计具有检测事故的能力。这是边缘计算的一种形式,需要边缘模型的边缘部署来区分实际碰撞事件和当车辆以较高速度驶过大坑洞时触发的误报。分类模型是使用高频数据(至少100Hz)开发的,除加速度计外还使用各种输入。此类事故检测算法可用于在发生事件时提供实时通知以进行紧急响应。

加速度计数据还可以用于建模和分类路面,车辆已行驶。这可以用来确定轮胎上的额外应力以及可能影响某些车辆系统的振动。根据道路质量对道路进行分类还可以帮助地方政府确定需要维护的路段,并在资金分配给其管辖范围内不同地区的方式上提供透明度。

电动车

向电动汽车的转变在过去几年非常迅速,预计未来几年还会进一步加速。除上述电动汽车健康监测和驾驶行为监测外,车辆参数(电压、电流、与目前可用的算法相比,可以结合环境条件和驾驶风格,对不同荷电状态(SOC)下的驾驶里程进行建模和计算,从而获得更准确、更可靠的估计。同样,可以使用多个电池参数之间的关系来建模电池的健康状态(SOH),以指示是否需要更换电池。在系统层面,通过对驾驶模式、资源可用性和运营的数据分析,可以更好地优化充电网络和公用事业(特别是与可再生能源的集成)和其他基础设施的集成。电动汽车与智能电网的集成是另一个新兴的用例可能产生更大的兴趣在未来与巨大的应用程序使用汽车电池供电电网高峰需求,检测网络的缺陷,可再生能源最大化吸收车辆充电等。

结论

本文概述了车辆数据分析和建模的几个应用和用例。这些目标包括OEM的研发工作,提高商用车队和乘用车的安全性、燃油经济性和运营效率。将天气和交通状况等背景数据与可能来自车辆数据本身或其他传感器/馈送的行为输入相结合,提供了进行更丰富、更深入分析的机会。包括电动汽车充电在内的电动汽车行业仍处于发展初期。集成先进的数据分析和建模可以为价值链中的各种利益相关者增加巨大的价值,并可以产生创新的商业模式来将这些数据货币化。汽车行业在整个移动领域的未来提供了巨大的潜力,最先利用数据分析能力的人很可能在汽车数据的应用和货币化方面获益。

by Ashwin Sabapath