基于模拟数据的双向LSTM高速公路,交通预报模型的开发与评价

大数据
后台-插件-广告管理-内容页头部广告(手机)
 

文 | 猎奇研究院

编辑 | 猎奇研究院

 

近年来,为改善运输管理,对短期交通预测模型的研究大量增加,对准确的预测模型在优化高速公路运行、避免交通故障等方面发挥着重要作用。

这些模型是利用连接在道路上的探测器提取的模拟数据或历史现场数据开发的,然后,这些数据成为统计技术和人工智能(AI)的输入,基于短期交通预测的机器学习模型,也因此,大数据和复杂的计算智能的快速发展创造了人工智能模型。

 

最近的一个模型是单向长期记忆(UU-LSTM)反复神经网络及其扩展双向长期记忆(BISSTM),先前的研究表明,UI-LSTM模型在处理长期依赖关系时是有效的,因为它们记住来自已经通过使用其架构中的"附加门"的输入的有用信息。

然而,近年来对双向LSTM模型进行了测试,这些模型提供了额外的培训能力,输出层同时接收过去(向后)和未来(向前)实例的信息,提供了更好的预测精度。

 

本文从澳大利亚墨尔本东部高速公路的校准和验证模拟模型出发,利用模拟计数(流量)、速度和占用率(车辆占用环路探测器空间的时间百分比是密度的替代指标),评估了BILSTM在不同时间范围内的性能。

旨在论证利用基于深度学习的AI技术来预测交通流量、速度和占用的多预测范围的可行性,除此之外,本文还提供了基于相同模拟数据的统一-LSTM模型和BILSTM模型的比较性能评价,并研究了BILSTM模型在多个预测范围内对不同流量变量是否获得了良好的预测精度。

 

验证了在未来交通需求增加25%、50%、75%和100%的情况下,已开发的交通模型的性能,这使这项工作对智能交通系统和网络运营领域的知识做出了宝贵的贡献,因此,它将使公路经营者和运输机构有信心认为,这一模式可以适应未来的交通模式。

 

模型校准

用于校准的实际数据是从澳大利亚墨尔本东部高速公路上嵌入的感应环中收集的,收集数据的时间分别为2016年7月1日至2016年8月30日,为期两个月,包括东行和西行。

这些数据涵盖每天24小时的所有时间,每隔1分钟在每个地点的所有车道进行汇总,但由于检测器故障或结果不可靠,在校准过程中没有使用一些检测器数据。

这次试验共使用55个探测器进行校准,包括26个东行探测器和29个西行探测器,然后对模型进行了校准,以适应高峰时段的早上6:00-9:00。

 

大量的参数在模型校准中起着重要的作用,需要精确地指定,其中包括针对车辆的基本参数,如长度、宽度和所需最大速度以及更复杂和动态的模型参数,如速度接受(驾驶员遵守限速限制的程度)、通行(车辆前方距离)和最大让路时间(超过几秒钟的阈值,驾驶员就不能再等待车辆间隙来执行某种动作),在微观模型参数中,还考虑了最大加速度、最大减速和灵敏度因素。

建模动态行为在校准过程中至关重要,车辆的动态行为是由车辆的类型、车辆的尺寸、最大加速度/减速和司机的行为来表现的,这些参数直接影响网络中的流量流。

 

车辆在模拟网络中的流动也受到其他因素的影响,如行驶速度、响应时间、换道间隙接受阈值或换道距离等,一旦这些参数被指定,模式的校准就可以使用一些预先确定的措施来评价,其中包括GHH和RMSE的关键性能指标。

 

模型开发数据

神经网络应用需要大量数据来开发模型,数据通常分为用于模型校准的训练数据集和用于模型验证的测试数据集。

训练数据通常包括最大的一组观测数据,并用于培训模型以执行预期的操作,使用这些数据,神经网络应用程序学习输入和输出之间的关联模式,并形成不同变量之间的关系,模型的有效性在一个独立的数据集上进行测试,这个数据集在模型训练中没有使用,称为测试数据集。

 

真实生活中的数据是从澳大利亚墨尔本东部高速公路上嵌入的感应环路中收集的,这些数据用于模拟模型的校准和验证过程,该模型已成功校准到高精度,代表了东部高速公路的基线情景。

 

此后,从基准校准情景生成了多个数据,然后用于模型开发,这些数据包括从(6-9号)上午高峰时间收集的交通量、速度和占用率(车辆在环路探测器上花费的时间的百分比),这些数据是从基线情景模型中每隔1分钟生成的,为每个交通特征收集了总共9,900次观测结果。

 

建模框架

单向LSTM近年来受到了广泛的关注,因为它与最先进的循环神经网络(RNNS)相比表现得更好,尽管rnns提供了良好的准确性,但由于rnns无法使用遥远的过去的信息,人们发现它们在长期记忆中表现不佳。

同时,与传统的RNNS相比,LSTM可以学习具有长期依赖性的模式,由于增加了额外的培训,因此一些被称为双向LSTM的LSTM模型得到了扩展,该模型对输入时间序列数据进行了两次训练,通过向前和向后的方向。

 

这些模型已被广泛用于未来的流量预测,利用神经工程专业人员和MATLAB开发,神经工程专业是一个人工神经网络的商业包和开发系统,单LSTM由四个层组成:输入层、隐藏单元数(300个单位)、完全连接层(响应数=1)和回归层。

模型超参数设置与表中的BILSTM模型相似,分别用于状态激活函数和闸门激活函数,对两种模型进行了比较。

 

RNNS和Elman是前向神经网络,在时间序列预测数据中表现良好,本实验采用的参数为:隐藏层与神经元、激活功能(TAU)、学习规律(EXDBC)和时代。反传播神经网络是最流行的捕捉非线性关系和自学习的学习算法,典型的反向传播网络总是有一个输入层、一个输出层和多个隐藏层,即所谓的"深入学习",每一层都与下一层完全连接。

 

示范发展成果

BILSTM是为了预测未来的速度、流量和60分钟内的入住,如前所述,将校准高速公路模型的模拟数据分为60%的训练数据和40%的试验数据,利用平均绝对百分比误差(MAAP)来计算模型比较和评价的预测精度,MAAP计算了模型(Y1)的预测输出和预期的真实输出(Y)之间的平均绝对差。

 

迄今为止所使用的艾姆松模型是根据2016年基准年的情况进行校准的,正如以往所显示的那样,它作为一个短期预测模型与其他模型相比是有效的。

模拟模型的主要优点是,它们可以用来评估流量增长情景对道路网络性能的影响。为了证明这一点,交通需求增加了25%、50%、75%和100%,代表未来几年的交通状况

 

对于每一种情况,都使用了相同的BILSTM模型(不需要再培训),用于最多60分钟的短期预测,总共有9,900次观测用于模型开发,其中60%是培训(5,940次观测),40%是测试(3,960次观测)。

当时,为每个未来的交通场景收集了观察结果,并用于验证目的,而无需对模型进行重新培训,例如,墨尔本的运输系统每天处理1700万次旅客,预计到2050年将增加到每天3000万次。

因此,有必要开发一个能够应对未来交通需求变化的模型,在校准的基本情景中,通过高速公路3小时的车辆总数为 401,229,然后,假设需求增加25%(橙色线),50%(灰色线),75%(黄色线)和100%(绿线),因此,车辆数目增加到 501,536 , 601,844 , 702,151 和 802,458 车辆分别反映了这些未来年份的增长。

 

结果表明,即使未来的交通需求比基年的需求高出100%,BISSTM也能够准确预测。

当模型没有经过再培训而被验证时,对未来60分钟以内的预测范围的所有未来需求情景的流量和速度的预测精度都在90%以上;对于占用率,该模型能够预测高达45分钟,精确度在90%以上;然后性能下降到82%-88%的60分钟预测范围;当需求量增加25%时,目标值与预测值之间的流量预测精度为93%。

 

当未来的交通需求量增加50%、75%和100%时,准确度仍保持在95%、95%和96%的高水平;对于速度,25%的需求增加导致99%的准确性;当需求量增加50%时,模型的精度仍然达到了99%;当未来的交通需求增加了75%和100%时,这个错误继续以相同的99%的高精度存在。

另一方面,在需求增加25%的情况下,入住率的目标值与预测值之间的准确性为94%;当需求量增加了50%时,模型的精度仍然达到了相同的94%;当未来的交通需求增加了75%和100%时,高精度将继续保持在95%。

 

结语

基于澳大利亚墨尔本东部高速公路的校准交通模拟模型的模拟数据,对该模型进行了评价。

该高速公路模型是利用从位于高速公路干线沿线的55个探测器收集的实地数据进行校准的,采用了一种全面而严格的程序,将现场数据与软件生成的模拟数据进行匹配。

结果表明,该模型具有良好的适应性,在高速公路上的所有检测器位置上进行了良好的校准,其GEH<5和RMS值为1.9,然后,用校准模型的模拟数据预测未来的速度,使用BIRSTM计算和入住时间可长达60分钟。

 

同样,采用了严格的程序来评估不同架构和建模参数的适宜性,结果表明,与单向LSTM、RNN、Elman和深深BP模型相比,双向模型的精度在93%以上,在未来60分钟内表现优异。

当未来交通需求增加25%、50%、75%和100%时,BISSTM在未来交通情景下的性能,结果表明,即使未来交通需求增加100%,BISSTM也能预测。

就计数、速度和占用率而言,预测精确度在60分钟以内的未来预测视界的所有场景中均高于92%。结果表明,深入学习预测工具在测试未来流量模式变化时是有效的。

 

缺点:本文仅侧重于高速公路交通状况预测模型的评价,不考虑干线道路,此外,它不考虑其他影响因素,如天气进一步完善预测模型。

这项研究还侧重于工作日期间的拥挤期,即从周一到周五,周末的交通问题越来越成为墨尔本等城市的一个问题,因为家庭使用私人车辆进行休闲活动,而且较少依赖公共交通,导致周末出现新的拥堵模式。

未来的研究方向包括在澳大利亚和海外从干线公路和高速公路上收集的更多野外数据上测试这些开发的模型的复原力,同时,开发和测试更多的架构,为短期预测提供进一步改进的准确性。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。