您好,欢迎来到九壹网。
搜索
您的当前位置:首页基于车辆行驶数据的驾驶人行为谱分析方法

基于车辆行驶数据的驾驶人行为谱分析方法

来源:九壹网
Journal of Computer Applications

计算机应用,2018, 38(7): 1916 - 1922,1928文章编号:1001-9081 (2018)07-1916-07

ISSN 1001-9081

CODEN JYIIDU2018-07-10

http: //www. joca. cn

DOI: 10.11772/j. issn. 1001-9081.2018010090

基于车辆行驶数据的驾驶人行为谱分析方法

陈镜任U2,吴业福i

(1.武汉理工大学计算机科学与技术学院,武汉430063;

(*

p

,吴冰i’2

2.交通物联网湖北省重点实验室(武汉理工大学),武汉430063)

通信作者电子邮箱wuyefti@ whut. edu. cn)

摘要:针对我国驾驶人行为谱的研究尚不完善,专业领域内没有相应的行为谱分析工具的问题,提出了 一套针

对营运客车的完整的驾驶人驾驶行为谱体系并设计了 一套分析工具。首先,设计并定义了驾驶人行为谱的特征指标 和评价指标;其次,给出了驾驶人行为谱的特征指标分析、计算方法,采用基于马尔可夫链蒙特卡洛采样和离群点剔

除的/f-means算法对驾驶人的驾驶风格进行分析,采用回归学习对驾驶人的驾驶技能进行分析;然后,设计了基于车 联网、大数据的驾驶人行为谱的基础数据采集和预处理方法;最后,采用Java语言、Spring MVC架构开发出驾驶人行 为谱分析工具。将机器学习中的数据挖掘、数据分析算法与交通安全领域相结合,对完善我国驾驶人行为谱框架体 系具有理论意义,为我国驾驶人行为谱的研究提供了一个科学、定量化分析的工具,对交管部门规范驾驶人驾驶行 为、提高道路安全指数、制定合理的交通安全管理策略具有指导意义。

关键词:驾驶人行为谱;驾驶人行为谱分析工具;车辆行驶数据;车联网;交通安全;大数据

中图分类号:TP391.4 文献标志码:A

Driver behavior spectrum analysis method based on vehicle driving data

CHEN Jingren1'2, WU Yefu1'2*, WU Bing1'2

(1.

School of Computer Science and Technology, Wuhan University of Technology, Wuhan Hubei 430063, China;

2. Hubei Key Laboratory of Transportation Internet of Things ( Wuhan University of Technology), Wuhan Hubei 430063, China)

Abstract: Focusing on the issue that our country’s driver behavior spectrum research is still not perfect, and there is no

corresponding behavioral spectrum analysis tool in the professional field, a set of complete driver behavior spectrum system for commercial motor vehicle of passenger transport was proposed and an analyzing tool was designed. Firstly, the characteristic indexes and the evaluation indexes of driver behavior spectrum were designed and defined. Secondly, the characteristic indexes analysis method and algorithm of driver behavior spectrum were given, the improved K-means algorithm based on Markov chain Monte Carlo sampling and outlier removing was used to analyze driving styles of drivers, and regression learning was used to analyze driving skills of drivers. Then, the basic data acquisition scheme and preprocessing methods of driver behavior spectrum based on car networking and big data were designed and proposed. Finally, Java language and the Spring MVC (Model View Controller) architecture were used to develop the profiling tool of driver behavior spectrum. Data mining and data analysis methods in machine learning were combined with traffic safety, which has theoretical significance for perfecting the driver behavior spectrum framework. It provides a scientific and quantitative analysis tool for our country’s driver behavior spectrum analysis work. It also provides guiding significance for traffic management department to standardize the driving behaviors of drivers, improves the road safety index and makes reasonable traffic safety management strategies.

Key words: driver behavior spectrum; driver behavior spectrum analysis tool; vehicle driving data; car networking;

traffic safety; big data

〇引言

我国交通事故连年高发,绝大部分与驾驶人自身紧密相

关。驾驶人急加速、高速行驶、急减速、跟车距离近以及随意 超车等不良驾驶行为是导致交通事故多发的主要原因[1]。 要尽快地从根本上提高我国驾驶人交通安全意识,规范交通 行为,需基于我国驾驶人的行为特征展开研究,通过技术开发 与大规模集成应用,建立一套针对驾驶人群体的宣传教育内 容、方式和模式,以有效预防道路交通事故的发生、减少交通 事故伤亡和损失。

驾驶行为人行为谱的研究建立在对车辆行驶数据进行分

析的基础上,而驾驶行为数据的多样化和复杂性给数据采集 带来了诸多困难。在数据采集方面,Arioui等[2]使用汽车模 拟器进行驾驶人健康状况和车辆零配件的运行状态监测研 究;Zeng等[3]利用个人计算机(Personal Computer, PC)模拟 器进行驾驶人驾驶行为、自行车安全状况以及路人的安全的 数据监测;付坤[4]采用非对称数字用户线路(Asymmetric

Digital Subscriber Line, ADSL)方法通过车辆参数的仿真进行

路面交通的安全性研究。

在驾驶人驾驶行为研究方面,0tte等[5]通过分析驾驶人 的道路驾驶行为,确立和量化欧洲的道路安全问题;Fuller[6] 利用汽车模拟器,研究了驾驶人行车的生理、心理状态因素对

基金项目:国家科技支撑计划项目(2014BAG01B03-2)。

收稿日期:2018-01-11;修回日期:2018-03-28;录用日期:2018-03-29。

作者简介:陈镜任(1996—),女,江西南昌人,硕士研究生,主要研究方向:机器学习、大数据分析、交通安全;吴业福(19—),男,湖北红

安人,副教授,博士,主要研究方向:交通信息与安全、人工智能;吴冰(1992—),男,湖北武汉人,硕士,主要研究方向:大数据分析、交通安全。

第7期陈镜任等:基于车辆行驶数据的驾驶人行为谱分析方法1917

行车安全的影响;郭孜政等[7]运用车载信息融合技术分析驾 驶人的驾驶行为,利用反向传播(Back Propagation, BP)神经 网络对驾驶行为进行判断并取得一定的成果;杨诚[8]利用隐 马尔可夫与BP神经网络建立了预测模型,对驾驶人转弯时 的决策建议及行为辨别进行了研究;吴付威[9]就动态视觉的 影响因素和驾驶人的行车决策机制对驾驶人行车过程的动态 视觉信息进行了分析研究;第三军医大学黎忠刚[1°]基于 度提取、分析驾驶行为习惯;哈尔滨工业大学卢凯旋[11]提出 了基于人-车_环境三者融合的驾驶行为分析方法,综合分析 判定驾驶状态的危险或安全;长安大学崔海朋[12]以驾驶人的 驾驶行为特性作为分析基础,将驾驶人的驾驶行为分为感知 特性类、判断特性类和操作特性类,并通过分析采集到的数 据,得出不同特性类的驾驶行为与适宜性检测指标的相关性 有大小之分的结论。

当前对于驾驶人驾驶行为的研究耗费巨大的人力、物力, 且结果往往受驾驶人的主观性以及其自身状态的影响且存在 指标获取困难及准确性难以保证的问题,无法达到预警效果。 基于部分影响因素和特定环境得到的驾驶行为的研究成果, 缺乏一个完整的驾驶人行为谱系框架及表征指标体系,因而 不同的研究之间缺乏有机联系,相关的研究成果来源于特定 的框架或指标体系,无法反映驾驶人驾驶行为的普遍特征及 其内在规律,从而使得这类研究的成果无法推广应用。

为了更好地分析驾驶人行为,特别是“两客一危”驾驶人 的驾驶行为,国家道路科技行动计划(二期)课题三之专题二 “重点驾驶人交通行为分析技术及系统开发”首次提出了“驾 驶人行为谱”这个全新的概念,用于有效评价驾驶人驾驶行 为特征。本文提出了针对营运客车的驾驶人行为谱的框架体 系和指标构成要素,通过对驾驶人驾驶车辆的行驶信息的提 炼分析,得出驾驶行为的内在规律;通过深人研究驾驶行为特 征指标,客观评价驾驶人驾驶行为类型,为驾驶人行为谱分析 提供有效的理论和工具支持。

1技术路线

首先,提出并详细定义驾驶人行为谱的指标,包括特征指

标和评价指标。特征指标用于定性分析驾驶人行为谱的表现

特征,评价指标用于定量分析产生驾驶人行为谱的表现特征 的数据对象,为驾驶人行为谱的构建提供了理论依据。

其次,分析驾驶人行为谱的特征指标的计算方法。基于 驾驶行为特征,采用聚类算法分析驾驶人驾驶风格类型;采用 回归分析进行驾驶人驾驶技能评价。

然后,设计驾驶人行为谱的基础数据采集方案,并提出基 于车辆行驶数据的驾驶人行为谱的基础数据的预处理、提炼 方法。采用车载器、定制的数据交换协议和3G或4G网络获 取、组织和传输驾驶人行为谱的基础数据,在接收端对该数据 进行解析后存储到数据中心。通过车联网监控平台采集到的 自然驾驶行为车辆行驶数据受到诸多外界因素的影响,大量 数据异常、无效,导致很多原始数据无法直接用于驾驶人行为 谱分析并从中提炼驾驶行为评价指标,最终应用于驾驶人驾 驶行为评价算法。研究采用数据清理的方法对异常、无效的 数据进行过滤、预处理。

最后,米用 Spring MVC( Model View Controller)架构研发 驾驶人行为谱分析工具。该分析系统实现了驾驶人行为谱的 基础数据的采集和驾驶人的行为分析,能给驾驶人提供有效

驾驶建议,有利于车辆营运公司全面掌握车辆行驶情况,对交 通管理部门的交通状况管理和交通安全预警提供有效建议。

驾驶人行为谱体系结构如图1所示。

图1驾驶人行为谱体系结构

Fig. 1

Driver behavior spectrum architecture

2驾驶人行为谱分析指标定义

本章定义了驾驶人行为谱的各项特征指标和评价指标,

特征指标用于描述驾驶人行为谱的表现特征,评价指标用于 描述产生驾驶人行为谱的表现特征数据对象。2.1驾驶人行为谱的特征指标

驾驶行为是导致交通事故的根本原因,驾驶行为由驾驶 风格和驾驶技能共同作用产生。上述两个指标可以综合反映 某驾驶人的驾驶行为谱特征,因此采用两者所属类别的不同 组合来定义驾驶人行为谱的特征的表述。

2.1.1驾驶风格特征指标

基于交通安全特征,将驾驶人群体的驾驶风格特征指标 定义为以下3类:

1)

激进型(A)。该类驾驶人在行车过程中,容易受到外

界因素的影响,产生烦躁的情绪,以致作出过激的驾驶行为。

行车车速往往高于管理车速、超速(<10%)多但超速比例 小、车辆纵向加速度较大、油门及刹车开度较大。

2) 适中型(B)。介于激进型和保守型之间,该类驾驶人 严格按管理车速行驶、车速分布处在中等水平(50%分位车 速左右,或15% ~ 85%分位车速)、无超速现象、车辆纵向加 速度适中、油门及刹车开度适中。该类驾驶人的驾驶行为表 现更为妥当安全。3) 保守型(C)。该类驾驶人在行车过程中通常会选择低 速平稳的行车方式来保证行车的安全。行车车速低于管理车 速、车速总体偏低、无超速现象、车辆纵向加速度较小、油门及 刹车开度较小。

2.1.2驾驶技能特征指标

基于驾驶人的车辆控制能力,将驾驶人群体的驾驶技能 特征指标定义为以下2类:

1)

熟练型(a)。该类驾驶人在行车过程中面对外界复杂

的交通环境时,能作出快速决策,拥有良好的控制车辆稳定的 能力。应变能力强、动作敏捷协调、车速和加速度稳定、驾驶 平顺。

2)

生疏型(b)。该类驾驶人在行车过程中面对外界复杂

的交通环境时,缺乏包括快速换挡以及及时避让等在内的对 车辆的稳定控制以及快速决策能力。车速、加速度和方向盘 控制均不稳定,不敢使用合适的加减速。

1918

计算机应用

第38卷

2.1.3驾驶行为特征指标

综合考虑驾驶风格和驾驶技能两个方面,将驾驶人群体

定义为以下6类:激进熟练型(Aa)、适中熟练型(Ba)、保守熟 练型(Ca)、激进生疏型(Ab)、适中生疏型(Bb)、保守生疏型 (Cb)。各类驾驶行为对应的安全等级如表1所示。

表1

驾驶安全等级

Tab. 1

Driving safety level

分类安全等级分类安全等级激进熟练型较危险适中生疏型较安全激进生疏型危险保守熟练型安全适中熟练型

安全

保守生疏型

较安全

2.2驾驶人行为谱的评价指标

判断驾驶人的驾驶风格、驾驶技能的因素多样,这些因素 同时也对交通安全有着很大的影响。

般地,驾驶人的驾驶

风格越偏向激进、驾驶技能越偏向熟练,则车速平均值越高。 车速标准差是车速离散程度的反映,车速分布越离散,则驾驶 人的驾驶风格越激进,驾驶行为越不稳定。加速度反映驾驶 人踩压加速踏板的行为规律,减速度反映驾驶人释放加速踏 板或操纵制动踏板的行为规律。此外,驾驶人踩踏油门踏板、 刹车踏板的变化率也能大致反映驾驶人的驾驶风格和技能。 根据以上描述,将驾驶人行为谱的评价指标定义如下:

车速平均值~、车速标准差〃.,、超速时间占比7?、加速度标 准差、正向加速度平均值 <、正向加速度标准差 <、减速度 值 <、负向加速度平均值(、负向加速度标准差 <、油门踏 板变化率7?,4、油门踏板变化率平均值7?,油门踏板变化率 标准差I,,、制动踏板变化率刹车踏板变化率平均值、刹车踏板变化率标准差I.,、车速与正向加速度的乘积 tf、车速与正向加速度乘积平均值丑》、车速与正向加速度乘积 标准差。

3驾驶人行为谱特征指标计算

现有的驾驶人行为研究方法大部分基于主观感受和定性

分析,其分析结果会掺杂个人主观因素。本章基于车辆行驶 数据,选择合适的算法发掘驾驶人驾驶行为的特征及其内在 规律,为客观、定量地评价驾驶人交通行为谱提供有效依据。

驾驶人行为谱构建方案如图2所示。3.1驾驶风格分析 3.1.1聚类算法

之所以采用聚类算法,是因为本文只是确定要将数据依 据其相似度聚成3类(驾驶风格被定义为3类),并不知道具 体某个驾驶人的行车数据属于哪一类,且由于事先没有任何 训练样本对应的类别标签,而事先也无法确定驾驶人的分类 结果、行车数据本身具有复杂性等因素都使本研究不便手动 标注或是通过人为的方式来对数据进行分类,综上,选择用聚 类这种无监督学习的方式来相对地判别驾驶行为类型。I means算法具有可伸缩、收敛快、运行时间短等特点,运用【

means算法进行快速聚类,通过反复迭代来达到最终的聚类

结果。

经典X-means算法的具体思想是:Y

k

,x2,…,心1为

要聚类的/V个数据样本,其中A为第i个数据对象,它是一个 n

维的数据点,可以表示为,…,^„)。相似度度量使用 欧几里得距离公式,如下所示:

=

\\/(xa ~ xfl ) + (xa — x]2) + \"• + (xin - Xjn)

(1)

聚类的目标收敛函数E选择使用误差平方和,S的定义 如式(2)所示:

E = Xi = 1 ? e Cj

X 1^ _ mi I2

(2)

其中:C;表示第〖个聚类簇,mi表示该簇中所有数据对象的平

均值。

I

车辆行驶数:据获取丨

f

( 车辆行弱;数据

~

〜. ~

'~

I

数据传输

I

数据处理

|

I

计算聚类中心1

I

计算回归线I

I驾驶风|格分析I I驾驶技i能分析I

驾驶风格:1~ ~ { 1驾驶技能:

懲保寸毕 、适中、丨驾驶行I

分析结果~|熟练、生疏

|

生成驾驶行为诊断拫告|

图2驾驶人行为谱构建方案

Fig. 2 Construction scheme of driver behavior spectrum

经典/C-means算法的聚类过程是:

步骤1 随机选择X个初始聚类中心C = |Cl,C2,…,ck t 〇

步驟2对每个i e丨1,2,…,,都使得样本x中离c;最 近的点加人到聚类簇C,中。

步骤3对每个i e 11,2,…

,使〇,成为C,的中心,其

卜越*。

步骤4 重复步骤2和步骤3直到初始聚类中心C不再

变化,此时,误差平方和S收敛。

但经典fmeans算法的速度快、时间复杂度低是以牺牲 聚类的准确性为代价的,易陷人局部最优解,经典K-means算 法的时间消耗和聚类效果在数据量非常庞大及复杂的情况下 会受到较大影响。本文采用基于马尔可夫链蒙特卡洛采样和 离群点剔除的【means算法,在时间复杂度不高、不影响聚类 速度的情况下,通过优化初始聚类中心的选择来尽量保证聚 类的准确度,获得全局最优解。

采用的改进fmeans算法的聚类过程如下。

步驟1

随机选取样本数据集X中的一个点^作为初始

聚类中心点。

步骤2选取某一数据点x计算其与初始聚类中心点的 距离 d〇,c;)。

步骤3

对于剩余的& - 1次迭代,建立一个长度为m的

马尔可夫链,并使用最后- 1个元素作为新聚类簇的中心, 建立马尔可夫链的提案分布为:

第7期

陈镜任等:基于车辆行驶数据的驾驶人行为谱分析方法1919

q(x\\ c,)d(xfcl)^x'd(x! ,cx)2(3)

步骤4对每个i e丨1,2,… >丨,都使得样本尤中离c;最 近的点加人到聚类簇C;中。

步骤5对每个i e |1,2,…

,使^成为C;的中心,其

卜越心

步骤6 重复步骤4、5,直至C不再变化。

该K-means算法和经典K-means算法的主要区别在于初

始聚类中心的确定,经典【means算法是随机选择X个初始 聚类中心,而本文采用的K-means算法是先选择一个初始聚 类中心,计算样本中的点到聚类中心的距离,在后续的每次迭 代y E [2,3,…,m]中依据提案分布建立马尔可夫链 ,> —:*;⑵—…—W —…即依据初始中心生成下一个候 选点T,,并依据接受概率来决定是否采用新的候选点,接受概 率为:

7r(xj.1,v)=

rfU.,C)

A

11 q(7j),> \\d(xhl,C)^)(4)

由此可以确保该方法下建立马尔可夫链的过程是平稳 的。

经典【means算法的时间复杂度为O(teefe),其中rf(x,C) =

I

|| *_ c; ||〗为迭代次数。而采用的【means算

i = 1,2,…

法时间复杂i约为〇(tkgfc)。

经典X-means算法的初始聚类中心是随机抽取的,在之 后的迭代运算中不断替换产生新的聚类中心,在噪声和干扰 数据多时易陷人局部最优,而采用的改进K-means算法基于 马尔可夫链蒙特卡洛方法选择初始聚类中心,过程平稳细致, 不用遍历欠已选出的初始聚类中心,在时间上和空间上尽 量寻求到全局最优解。

3. 1.2运用改进的X-means算法进行驾驶风格聚类

运用改进的fmeans算法对不同驾驶人个体的驾驶风格

进行聚类的过程如下:

1)

对数据库中车辆行驶基础数据进行数据预处理,驾驶风格评价指标。

根据第2章,选取车速平均值、车速标准差、超速时间占 比等作为驾驶人驾驶风格评价指标。因为算法中采用欧几里 得距离,各个驾驶风格评价指标之间存在单位不统一以及数 量级相差较大的问题,所以在进行聚类计算之前,需要对各个 评价指标进行归一化处理,使之投射到[〇,1 ]区间,其归一化 处理如下:_ (x - minValue) (5)

^ (maxValue - minValue)其中为原始评价指标的值(即归一化前的值),y为聚类计

算指标的值(即归一化后的值)为样本的最大值,

miraFaftte为样本的最小值。

将归一化后驾驶风格评价指标数据作为驾驶人群体聚类 的初始样本集,进行聚类分析。

2) 初始化聚类中心个数的选择。

因为本研究中采集的数据量庞杂,为了防止初始聚类中 心个数确立的随意性对驾驶风格分类产生影响,通过设置不 同的初始聚类中心的个数实验来判断K的初始值取多少时,

既时间消耗少,又能获得相对较好的聚类效果。本文采用多次 实验得到如下结果,如表2所示:在聚类过程中,初始X值设 置越大,迭代运算的次数越多,则驾驶风格聚类中心越准确, 聚类结果越好,驾驶人驾驶风格分类越接近真实情况;但与此 同时所用时间消耗也会随着K值和迭代次数的增加而增多, 所以将K的初值置为30相对合适,能在时间消耗不是很大的 情况下获得较好的聚类效果。

表2

聚类过程对比分析

Tab. 2

Comparative analysis of clustering process

A:的

聚类中心的

所用 A:的

聚类中心的

所用 初值

准确率/%

时间/s

初值

准确率/%

时间A

20

68.370.505 335.690.792576.560.592840

90.52

0.9842

30

87.35

0.6571

3) 任选一点作为初始聚类中心点,计算样本中的点到该

中心点的距离。

4) 依据式(3)中的提案分布建立马尔可夫链,取最后一 个点作为新聚类中心,直至选完30个初始聚类中心。5) 依据第2章对驾驶风格的分类设计,主要包含激进型、适中型和保守型三类,故X的最终值取3。在得到30个初始聚 类中心后,计算剩下的点与这些初始聚类中心的距离,分别将 它们分配给与其最相似的类,然后再计算每个所获新聚类的 聚类中心(该聚类中所有对象的均值),不断重复这一过程直 到误差平方和开始收敛为止,最终形成较为明显的不同的3 个类簇。在最后结果中,之前的30个初始聚类中心所对应的 类中相对较近、较集中的类对应一个驾驶行为类型。

基于数据散点距离的驾驶风格聚类算法描述如下。

输人:参与聚类的驾驶风格评价指标散点集合。输出:驾驶风格聚类集合。

/ *步骤1:将驾驶风格评价指标投射到[0

,1 ]

区间* /

if (

maxAndMin[j][0^\\ < fieldValue)

//最大值进行赋值

then maxAndMin[j~\\ [0] = fieldValue;and if (

maxAndMin[j^ [ 1 ]

> fieldValue)

// 最小值进行赋值

then maxAndMin[j][l^\\ = fieldValue;

/ *

将对象单位化* /

for each value \\if (

maxAndMin^

[0] != maxAndMin[ ^] [ 1 ])

//

如果最大值和最小值不等,防止分母为〇

thenm/ue =

(fieldValue — nmxAndMin[i][l])/

(maxAndMin[i] [0] - maxAndMin[ i] [ 1 ]);

else value - 0

//当一个维度的最大值和最相等的

//

时候,分母为〇的时候,将单位化的数据值赋值为〇

End for/*步骤2:驾驶人群体的驾驶风格聚类* /

/ *

循环计算每个点到初始聚类中心的欧几里得距离,判断数据

对象的所属类簇,纳人与之距离最小的类簇*

/

Data set ^

, center k , chain length m

Point uniformly sampled from ^ —>• q

//

任选一个点作为初始聚类中心

for all a; g ^ do

^(尤,ci)2/5^(W,ci)2 + 丄 4?(无)

~

n

/ *

主循环* /

I ci 1 ~

for ^ =

2,3

,k do

Point seimpled from ^ using q(x) —► a;

得到

1920

计算机应用

第38卷

dix^C^) ~^dx

for) = 2,3,…,m do

Point sampled from ^ using q(y) —► y

J,Q_i )2 —*■

ifH^y> Unif(〇A)then y ^

x,dy^- dx

Q_! [j \\x\\

return Ck End for

3.2驾驶技能分析

驾驶技能反映的是驾驶人在行车过程中对车辆稳定性控 制的能力,而驾驶流畅度在一定程度上能体现驾驶人稳定控 制车辆的能力,因此本文选取一定平均车速下车辆加速度变 化率的累积来判断驾驶人的驾驶流畅程度。加速度变化率累积/ = I;,其中,i为采样点,/e1;*为车辆行驶过程中纵向

= 1

加速度变化率,通过累加得到/。

回归学习通常用于分析两个变量相互依赖的定量关系, 运用回归估计来定量分析平均车速和加速度变换率累积这两 个变量之间的关系,其公式如下:

J = 130 + p! • va + e (6)

其中为车速平均值,■/是根据该车速推算出的加速度变化

率累积是回归误差。

以驾驶技能平均水平作为衡量标准,得出每个驾驶人驾 驶技能类别。采用最小二乘法以准确地反映平均车速和加速 度变化率累积之间的关系,其离差平方和如下:

(7)

Q(P') =

- (p0 + ^ ■ vj]2

(8)

为了使得式(7)得到的结果最小,求解偏微分方程组,计 算得到参数Ai和A的值。

W

= 〇}; * = 1,2’…

(9)A

X

(7 -■/)]/[ X

2

(10)

Po = J - ^ ■ va

(

11)

对驾驶人群体进行驾驶技能分类的过程如下:步骤1

对数据库中车辆行驶基础数据(车速、时间)进

行数据预处理,得到车速平均值、加速度变化率累积两项驾驶 风格评价指标。

步骤2根据最小二乘估计对驾驶人群体进行回归分 析,计算得到回归直线的斜率A和截距啟。

步骤3判断每个驾驶人与回归直线的位置关系,在回 归直线下方的驾驶人为驾驶技能生疏;反之则为驾驶技能熟练。

4实验分析与结果

4.1数据采集

驾驶人行为谱基础数据采集通过与无锡某物联网公司

合作,利用营运车联网联控平台进行车辆的实时跟踪,营运车 辆的车载终端通过无线网络向车联网管理平台发送数据,管

理平台通过读取控制器局域网络(Controller Area Network,

CAN)总线协议以及全球定位系统(Global Positioning System, GPS)信号,将车辆行驶数据进行存储。车联网数据云平台及

其相关的应用环境逻辑结构如图3所示。

门—

鼇i

_

If.

ft

移动终端心

可视化展

i 示服务器监控终端

j

据服务器

载终端

图3

车辆行驶数据采集逻辑图

Fig. 3

Logic diagrgim of vehicle driving data acquisition

4

.2

数据提炼预处理方案及其实现

数据集描述及提炼规则利用相关物联网设备和车辆联

网联控平台采集行车数据,实现基于大样本的驾驶人行为谱 分析。目前,该平台已经实现对6万多台车辆的实时监控,可 记录车辆轨迹、车速以及超速驾驶、超时驾驶等报警信息。

由于遮挡物遮挡信号、车载终端设备故障等因素的影响 导致其中出现一些错误、无效的车辆行驶数据,这些错误的信 息混杂其中,可能会导致分析结果不准确甚至得出错误的实 验结果,因此,车载终端采集到的车辆行驶基础数据往往不能 直接用于数据分析。

在分析车辆行驶数据之前,需要将其中错误的、无效的数 据剔除,本研究针对车载终端采集的数据信息制定的数据过 滤规则如下:

1)

剔除车速为〇的数据记录。在停车状态下,车辆行驶

车速为〇,驾驶人驾驶行为分析应该是建立在行驶动态过程

中,所以剔除车速为〇的数据记录。

2) 速度过大的数据记录。车辆在路面行驶时,车速都设 有一定的阈值,如果出现车速大于120 km/h的数据记录,则 视为错误的数据。

3)

数据信息少的数据记录。一般地,车辆行驶时间长,所获取到的数据信息更有说服力,进而分析得到有效的驾 驶行为特征,一辆车每天的信息记录数少于1〇〇条视为无效 信息剔除。

4) 加速度异常的数据记录。车辆在设计过程中,其性能 受到技术的,车辆纵向加速度受限,一般为正向加速度< 3 m/s2,负向加速度< 9 m/s2。

4

.3

聚类算法效果对比

本节从本文采用的基于马尔可夫链蒙特卡洛采样和离群 点剔除的X-means算法、经典X-means算法以及【means + + 算法的聚类所消耗的时间和散点聚合度两个方面来对这三种 聚类算法的效果作出对比,验证改进的【means算法的良好 性能。

因为本文所设计的驾驶人行为谱分析工具是基于车辆行 驶数据的,所以选用了经过预处理后的1〇〇〇条车辆行数据进 行算法的时间消耗比较,由实验结果可知,选取不同的初始聚 类中心数量(K值),改进K-means算法、/C-means ++算法和经

第7期陈镜任等:基于车辆行驶数据的驾驶人行为谱分析方法

1921

典X-means算法有着不同的表现。根据实验结果可知,经典 /f-means算法和X-means + +算法在时间消耗上都比改进K-

means算法要多。/C-means + +

算法在选取初始聚类中心时需

要进行/U欠遍历,而改进fmeans

算法则不需要,改进K-

means是依据提案分布建立马尔可夫链并根据接受概率决定

是否接受新的候选点来获得所有的初始聚类中心,因此在要 获得近似聚类效果的情况下,改进fmeans算法的时间消耗 比/C-means ++和经典/C-means算法都要少。3种聚类算法的 时间消耗对比如图4所示。

Fig. 4 Comparison of consume time of various clustering algorithms

控制初始聚类中心个数K = 30时,改变所要聚类的数据 总数,通过数据散点的聚合度来比较3种算法的聚类效果。聚 合度公式为:£>e?im(c) = |iVm(c)|/ $

cfct(c,x),其中:c

xeNm(C)为聚类中心,m为一个类簇中的散点个数,7Vm(c)

表示距离中

心c最近的m个点的集合表示点x

到中心c的距

离。从实验结果可得知,3种算法的散点聚合度都随着样本数

量的增加而升高,但

K-means +

+算法和经典K-means算法在

数据量增加到一定程度时,散点聚合度的升高速度相对下降,

而改进fmeans算法的性能相对优良,聚合度相对优于

K-means + +

算法和经典【means算法。聚合度对比如图5所

7K〇

样本数/1〇2

图5

各种聚类算法的聚类程度对比

Fig. 5

Comparison of clustering degree of various clustering algorithms

3种聚类算法的样本聚合如图6所示。从图6中可以看

出:经典X-means算法的散点聚合度不高,聚类结果中同一类 别的散点相对分散,且各种类别间的界限不清晰,存在散点群 相互覆盖的现象;K-means + +算法比经典/C-means算法的聚 合效果稍好,但依旧存在散点群边界不够清晰、少量相互覆盖 的情况;改进fmeans算法的散点聚合度相对更高,类别间的 界限也相对清晰,基本没有散点群相互覆盖的情况。

11

2

0

rs

日)/#«退«卅

5 10 15 20 25 30

车速平均值/(m • s_1)

(a)经典尤-means算法样本聚合

12 r

a

保守型 ■适中型 〇激进型

5 10 15 20 2530

车速平均值/(m • s_1)

(b) ^:-means++算法样本_合

1210a 8

I

6

4

2

0 5 10 15 20 2530

车速平均值/(m • s_1)

(c)改进K-means算法样本聚合

图6

3

种K-means算法的样本聚合

Fig. 6

Seimple aggregation of three kinds of K-means algorithms

4.4

驾驶行为分析结果展示选取2016年

11

1

日00:00:00—2016年

12

16

00:00:00的车辆行驶数据作为驾驶人行为谱分析实验的成果 展示。该数据集中采集到的车辆行驶数据记录总数为

1663021条,预处理后的车辆行驶次数为158755。驾驶人数 量为37 699人:激进型有11 875人,占31.5%;适中型有9 199 人,占24.4% ;保守型有16 625人,占44.1 %

从车辆行驶数

据提取驾驶人风格指标进行驾驶风格聚类分析,将

属性投射在二维上,横轴为车速平均值,纵轴为车速标准差。 图7(a)展示了从驾驶人的驾驶风格分布。从图7(a)中可以 看出,激进型驾驶人的平均车速偏大,车速标准差较大(即车 速分布离散程度较大)。保守型驾驶人普遍车速偏低且车速 分布较为集中。激进型驾驶人占比依旧不少,交管部门可对 这些驾驶人的驾驶状态进行跟踪记录,对该类驾驶人多加教 育。

依据该时间段内的车辆行驶数据对驾驶人的驾驶技能进 行回归分析后,得到驾驶技能回归直线(即驾驶人群体的平 均驾驶技能水平),如图7 (b)所示。其中纵截距为-0. 505,

1922

计算机应用

第38卷

回归直线斜率为0.417,即得到回归直线为;y = 0.417% - 0. 505。其中:回归直线上方的三角形(A )代表驾驶技能生 疏,有105人,占比28.9% ;回归直线下方的圆形(〇)代表 驾驶技能熟练,有26804人,占比71.1%。如图7(b)所示:在 直线下方的部分的驾驶人在行车过程中车辆的加速与减速相 对比较流畅,加、减速的幅度小,反映驾驶人对车辆的控制能 力较好;而直线上方部分的驾驶人加速度变化率累积值比较 大,反映出驾驶人频繁加、减速,驾驶技能相对生疏。

12A

保守型

10■适中型

C

I

银6遊4讲

2

00

5 10 15 20 25 30

车速平均值/(m • s_1) (a)驾驶风格统计分布

▲生疏型

r.s

〇-

A

。熟练型

车速平均值4 6 8

/(m . s_1)

(b)驾驶技能分布统计

各类驾驶人按逆时

针顺序依次是: □保守熟练型 因激进熟练型 囹适中生疏型 因激进生疏型 圍保守生疏型 □适中熟练型

(c)无锡某企业驾驶行为统计分布

图7

某时段的驾驶人行为分析结果

Fig. 7

Analysis results of driver behavior in a period

本研究中采集了某客运公司驾驶员的行车数据,将其作 为本文研究的一个群体,并展示了驾驶行为类别结果。将驾 驶风格和驾驶技能进行组合,可查看无锡某企业总体的驾驶 行为类型分布,得知该段时间内车辆营运企业总体的驾驶行 为类型分布情况,查看各个类型人数所占比例。如图7 (c)所 示,总人数为154人,各类驾驶人按逆时针顺序依次是:保守 熟练型70人占45. 6%、激进熟练型35人占22. 8%、适中生 疏型20人占12. 9%、激进生疏型16人占10. 6%、保守生疏 型10人占6. 3%、适中熟练型3人占1.8%。公司和交管部 门应对激进和生疏型驾驶人重点关注、多加教育。

5结语

本文根据影响车辆行驶的驾驶行为特征,提出了驾驶人

行为谱的各项特征指标和评价指标。利用车联网监控平台采

集真实的车辆行驶数据,并根据剔除规则对数据进行预处理。 对完成提炼和预处理后的车辆行驶数据进行分析,采用聚类 算法分析驾驶人的驾驶风格,运用回归学习分析驾驶人的驾 驶技能。

本文从驾驶人行为谱体系架构到实际需求分析,进行了 驾驶人行为谱分析工具的研发;但研究仍存在以下不足之处: 首先本文当前自主建立的车辆监控、数据采集平台只能在局 部范围内进行驾驶行为分析;其次,交通系统主要由人、路、环 境这三个要素构成,虽然人在其中占据核心地位,但不可否认 路和环境对驾驶人的驾驶行为也具有一定程度的影响,目前 采集的数据信息有限,没有进行驾驶人心理的检测,路段的检 测以及车外周边环境信息的采集,综合考虑外部环境对驾驶 人的影响,可以更全面、更客观分析驾驶人驾驶行为状态。

总体而言,本文基于车辆行驶数据,完善了驾驶人行为谱 体系结构;提出了驾驶人行为分析算法,研发出了驾驶人行为 谱分析工具,为营运客车的驾驶人驾驶行为的定量分析提供

了更为精确、有效的方案,对交管部门规范驾驶人驾驶行为、 提高道路通行安全指数、制定合理的交通安全管理策略具有 指导意义。

参考文献(References)

[1]

张丽霞,刘涛,潘福全,等.驾驶员因素对道路交通事故指标的影 响分析[J] •中全科学学报,2014,24(5): 79 - 84. (ZHANG L

X, UU T, PAN F Q, et al. Analysis of effects of driver factors on road traffic accident indexes [ J]. China Safety Science Journal, 2014, 24(5): 79 -84.)

[2]

ARIOUI H, HIMA S, NEHAOUA L, et al. From design to experi­ments of a 2-DOF vehicle driving simulator [ J]. IEEE Transactions

on Vehicular Technology, 2011, 60(2): 357 -368.

[3]

ZENG J G, LIU J Y, YU Q. Kinematic and dynamics modeling of vehicle driving simulator with 6D0F motion platform [ J]. Applied Mechanics & Materials, 2014, 543/544/545/546/547: 379 -382.

[4

] 付坤.基于驾驶员与道路环境因素的驾驶行为差错数学分[D].

长春:吉林大学,2013: 83 - 87. ( FU K.

Mathematical analysis

of driving behavior errors based on driver and road environmental factors [ D]. Changchun: Jilin University, 2013: 83 -87.)

[5]

OTTE D, JANSCH M, HAASPER C. Injury protection and accident causation parameters for vulnerable road users based on German in- depth accident study GIDAS [ J]. Accident Analysis and Preven­

tion, 2012, 44(1): 149.

[6]

FULLER R. Towards a general theory of driver behavior [ J]. Acci­dent Angilysis and Prevention, 2005, 37(3): 461.

[7

]

郭孜政,谭永刚,马国忠,等.基于BP神经网络的驾驶精神疲劳

识别方法[J].

哈尔滨工业大学学报,2014, 46(8): 118

- 121.

(GUO Z Z, TAN Y G, MA G Z, et al. Recognition method of driv­ing mental fatigue based on BP neural network [ J]. Journal of Har­bin Institute of Technology, 2014, 46(8): 118-121.)

[8]

杨诚.

基于隐马尔可夫理论的驾驶人换道意图识别研究[D].长

春:吉林大学,2016:48 -54. (YANG C.

Research on driver's lane

change intention recognition based on hidden Markov model [ D]. Changchun: Jilin University, 2016: 48 -54.)

[9

] 吴付威.

跟车和换道过程中驾驶人注视转移模式研究[D].西

安:长安大学,2012: 20 -24. (WU F W.

Research on driver’s fixa­

tion transition mode during car following and lane changing process [D]. Xi'an: Chang'an University, 2012: 20-24.)

(下转第1928页)

析 1928

[2]

计算机应用

第38卷

dynamics of arterial traffic from probe data using a dynamic Bayes­ian network [ J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(4): 1679 -1693.

NEWSON P, KRUMM J. Hidden Markov map matching through noise and sparseness [C]// Proceedings of the 17th ACM SIGSPA- TIAL International Conference on Advances in Geographic Informa­tion Systems. New York: ACM, 2009: 336 -343.

[13]

MATTHEIS S, AL-ZAHID K, ENGELMANN B, et al. Putting the car on the map: a scalable map matching system for the open source community [C]// Proceedings of INFORMATIK 2014: Workshop Automotive Software Engineering. Stuttgart: [ s. n.], 2014: 2109-2119.

[3] LOU Y, ZHANG C, ZHENG Y, et al. Map-matching for low-sam­pling-rate GPS trajectories [C]// Proceedings of the 17th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. New York: ACM, 2009: 352 -361.

[4] JAN-HENRIK H, BENEDIKT B. An algorithm for map matching given incomplete road data [ C]// Proceedings of the 20th Intema- tiongil Conference on Advances in Geographic Information Systems. New York: ACM, 2012: 510-513.

[14] 王美玲,程林.浮动车地图匹配算法研究[J

].

测绘学报,2012,

41(1): 133 -138. (WANG M L, CHENG L, Study on map-matc­hing algorithm for floating car [ J]. Acta Geodaetica et Cartographi- caSinica, 2012, 41(1): 133 -138.)

[15]

[5] LIU X L, LIU K, LI M X, et al. A ST-CRF map-matching method for low-frequency floating car data [ J]. IEEE Transactions on Intel­ligent Transportation Systems, 2017, 18(5): 1241 -1254.

曾詰,李清泉,邹海翔,等.曲率积分约束的GPS浮动车地图匹

1176. (ZENG Z,LI

配方法[J].测绘学报,2015,44( 10): 1167 -

Q Q,ZOU H X,et al. Curvature integration constrained map matching method for GPS floating car data [ J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(10): 1167 -1176.)

[16] 章威,徐建闽,

[6] HU G, SHAO J, LIU F L, et al. IF-Matching: towards accurate map-matching with information fusion [ J]. IEEE Transactions on Knowledge & Data Engineering, 2016, 29(1): 114-127.

林绵峰.基于大规模浮动车数据的地图匹配算法

[7] YUAN J, ZHENG Y, ZHANG C Y, et al. An interactive-voting based map matching algorithm [ C]// Proceedings of the 2010 Elev­enth International Conference on Mobile Data Management. Wash­ington, DC: IEEE Computer Society, 2010: 43 -52.

[J] ■交通运输系统工程与息,2007,7(2): 39 -45. (ZHANG W, XU J M, LIN M F. Map matching algorithm of large scale probe vehicle data [J]. Journal of Transportation Systems Engineering and Information Technology, 2007, 7(2): 39 -45.)

[8] HUMMEL B. Map matching for vehicle guidance [M]// Dynamic and Mobile GIS: Investigating Space and Time. Boca Raton, FL: CRC Press, 2006: 18 -27.

This work is peirtially supported by the Guangdong Provincial Science and Technology Program (2017A040402009).

[9] ALT H, EFRAT A, ROTE G, et al. Matching planar maps [ J]. Journal of Algorithms, 2003, 49(2): 262 -283.

CHEN Hui,

bom in 1974, M. S., associate professor. His research

[10] BRAKATSOULAS S, PFOSER D, SALAS R, et al. On map­matching vehicle tracking data [C]// VLDB 2005: Proceedings of the 31st International Conference on Very Large Databases. [ S.1.]: VLDB Endowment, 2005: 853 -8.

interests include computer network, cloud computing, data science.

JIANG Guifeng, JIANG Guiyuan,

bom in 1991, M. S. candidate. His research in­

terests include machine learning, data mining, data science.

bom in 1985, Ph. D. His reseeirch interests in­

[11] LAMB P, THIEBAUX S. Avoiding explicit map-matching in vehi­cle location [C]// ITS-99: Proceedings of the 6th World Confer­ence on Intelligent Transportation Systems. Toronto: 1999: 1 -9.

[ s. n.],

clude urban intelligent transportation system, traffic big data processing, optimization of traffic resources.

WU Jigang,

bom in 1963, Ph.

D.,

professor. His research inter­

ests include data science, network design, machine intelligence, fault tol­erance calculation, hardware and software collaborative design.

[12] HOFLEITNER A, HERRING R, ABBEEL P, et al. Learning the

(

上接第192

2

页)

D].

[10]

黎忠刚.基于数据挖掘技术的驾驶行为分析[重庆:第三军

[15]

gies, 2015, 58(D

): 657 -

668.

医大学,2017: 33 -41. (LI Z G.

sity, 2017: 33 -41.)

[11]

卢凯旋.

Driving behavior analysis based CHANDRASIRI N P, NAWA K, ISHII A. Driving skill classifica­tion in curve driving scenes using machine learning [ J]. Journal of Modem Transportation, 2016, 24(3): 196 -206.

on data mining technology [ D]. Chongqing: Army Medical Univer­

基于车载信息融合的驾驶行为分析[

14:7-8.(01

D].

深圳:哈尔滨

[16] 吴超仲,严新平,马晓凤.考虑驾驶员性格特性的跟驰模型[J

22.(1110 2,¥

].

工业大学深圳研究院,20〖乂.〇1^118匕61^丨〇^-交通运输工程与信息学报,2007,5(4):18 -入〜

nalysis based on vehicle information fusion [ D]. Shenzhen: Harbin Institute of Technology, Shenzhen Graduate School, 2014: 7 -8.)

[12]

X P, MA X F. Car-following model based on drivers, characteris­tics [J]. Journal of Transportation Engineering and Information, 2007, 5(4): 18 -22.)

崔海朋.营运车辆驾驶员驾驶行为与驾驶适宜性检测单项指标

].

相关性研究[D西安:长安大学,2015:22 -25. (CUI

H P.

This work is partieilly supported by the Nationgil Key Technology Re­search and Development Program (2014BAG01B03-2).

Study on relationship between the driving behaviors and the single index of the driving aptitude tests to professional drivers [ D ]. Xi'an: Chang'an University, 2015: 22 -25.)

[13]

ZOHAR D. Thirty years of safety climate research: reflections and future directions [ J]. Accident Analysis and Prevention, 2010, 42 (5): 1517 -1522.

[14]

JAMSON S L, HIBBERD D L, JAMSON A H. Drivers’ ability to learn eco-driving skills; effects on fuel efficient and safe driving be­haviour [J]. Transportation Research Part C: Emerging Technolo­

CHEN Jingren, WU Yefu, WU Bing,

bom in 1996, M. S. candidate. Her research in­

terests include machine learning, big data angilysis, traffic safety.

bom in 19, Ph. D., associate professor. His research

interests include transport information and safety, artificial intelligence.

bom in 1992, M. S. His research interests include big

data analysis, traffic safety.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务