暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

TKDE |一种轻量、准确的交通预测时空转换器(附论文)

时空实验室 2023-01-05
752

通过研究发现交通预测时各区域间具有动态、周期性和联合时空依赖性的问题。现有技术通常以解耦的方式分别考虑空间和时间依赖关系,或者在使用大量需要调整的超参数进行训练时,计算开销非常大。本次为大家带来数据挖掘顶级期刊TKDE上近期收录的论文:《A Lightweight and Accurate Spatial-Temporal Transformer for Traffic Forecasting》,该文提出了一种新颖的、轻量级的、精确的、具有信息融合和区域采样功能的交通预测时空转换器。

一.背景

交通预测是预测一个城市下一个时间段的流入(即单位时间到达对象的数量)和流出(即单位时间离开对象的数量)。对象可以是人、车辆、货物/物品等。交通预测在交通、零售、公共安全、城市规划等领域都有重要的应用。虽然有很多集中在深度学习提高预测精度的预测模型,但是性能的提升却伴随着参数的增加和训练资源的增加,这就导致训练和部署大型深度学习模型的成本高昂,因此,一个轻量级且高效的模型对于快速交付和部署至关重要。此外,区域交通在空间上和时间上是相关的,这种依赖在不同的时间隙上是动态的,它可能具有时间周期模式。因此,为了准确预测区域交通,无论区域之间有多远,考虑区域之间的动态性和联合的时空(ST)依赖性是至关重要的。鉴于此,本文提出了一种新颖的、轻量级的、精确的、具有信息融合和区域采样功能的交通预测时空转换器ST-TIS。ST-TIS基于考虑区域之间的时空依赖关系,尤其是考虑了具有信息融合模块(IFM)的任意单个时间片的动态时空依赖性,以及使用注意力机制的多个时间片之间的时空依赖性可能周期性特征,提出了数据驱动的转换器方案。此外,本文提出了一种新的考虑到计算效率的区域采样策略,利用转换器框架来学习区域依赖关系,与此同时还采用了一种新的区域采样策略来生成连通区域图,并基于该图学习其依赖性。在ST-TIS中,通过信息传播保证考虑到任意一对区域之间的依赖关系(近距离和远处依赖关系),计算复杂度从降低到,其中,n是区域的数量。

二.方法介绍
2.1 总体框架
图1为论文提出的ST-TIS框架的结构。给定从时隙0到t−1的所有区域的交通数据,ST-TIS是一个端到端模型,可以捕获时空依赖性,并预测t时任何区域的流入和流出。在ST-TIS中有五个模块,即信息融合模块、区域采样模块、单个时间片的依赖学习(DLI)、多时间片依赖学习(DLM)、预测网络(PN)。

     

图1 总体框架图
2.2 模块介绍
接下来详细介绍ST-TIS各个模块的设计目的以及模块之间的关系。
(1)信息融合模块
ST-TIS利用信息融合模块,通过融合自己的位置、时间片和流信息来学习自己的时空流(STF)嵌入。给定n个区域,我们首先使用一个单热向量来表示一个区域ri,其中只有Si中的第i个元素为1,否则为0。然后,我们对一个区域ri的位置信息进行编码如下:
在时间信息方面,我们首先将一天分成o个时间槽,并使用由嵌入的一个热向量来表示第i个时间槽。在那之后,我们通过以下公式来学习时间:
由于两个区域之间的通行时间ti,其中一个区域的交通量可能依赖于另一个区域在以前的时间段的交通量。因此,我们使用人们周围的观察结果,而不是仅仅使用快照来学习依赖项。我们在一个时间槽tj上对一个区域周围的观测值定义如下:
对于一个时间槽tj的区域ri,其周围的观测被定义为前时隙中的流量:
需要注意的是,通过使用周围的观测结果,可以考虑区域之间依赖关系的时间滞后。考虑到ritj位点对周围的观测值,我们首先应用核大小为与步长1f的输出通道的一维卷积应用于其流入和流出周围的观测值,以提取不同的模式。ritj处的流嵌入计算为:
最后,我们融合位置、时间片和流信息,学习在tj时刻区域ri的STF嵌入。我们定义tj是一天中的第时间隙,其中是一个匹配函数,融合过程被定义为:
(2)区域采样模块
为了捕获一个区域对其他区域(包括附近和远处)的依赖性,文章规范转换器计算目标区域和所有其他区域之间的注意力分数,并根据计算的注意力分数聚合所有其他区域的嵌入。然而,这就导致了二次计算问题和长尾效应问题。但是经过前期工作研究证明信息可以通过多层网络结构在图中的节点之间传播。因此,有了适当的图结构和网络结构,一个区域即使不直接评估它们的注意力分数也可以聚合另一个区域的嵌入,如图2所示:
图2 图中的信息传播
其中区域被表示为图中的节点,并与边缘连接。在第一个聚合层中,r1r2捕获信息,而r2r3捕获信息。由于r3的信息已经在r2中聚合,r1也可以在第二个聚合层中捕获它,而不计算r1r3之间的注意力得分。从这个例子中,我们得出结论,如果一个节点的距离不超过β,则可以通过β层聚合操作到达另一个节点的信息。然而,之前的研究表明,当β = 2时,网络达到了最好的性能,但从3层显著下降。因此,我们在工作中将β设为2
解决规范转换器的局限性,我们建议生成一个连接图(即,至少有一个路径之间的图),其中任何一对节点之间的距离不超过2和任何节点的程度(即区域)不超过。因为给定n个节点,当β = 2时,我们应该有,并且构造图的最小度k。这样,对于目标区域,我们只需要将区域的嵌入聚集到聚集层中,就可以通过信息传播在双层聚集过程中捕获来自其他区域的影响。这样的设计,我们不需要计算任何对区域之间的注意力分数和聚合的嵌入所有n个区域的目标区域,从而将每一层的计算复杂度降低到,并解决了长尾问题。
在此工作中,我们提出了一种区域连通图生成的启发式方法。我们首先计算任意一对区域之间的交通相似性。交通相似度的计算是灵活的,它可以是任何相似度度量。我们在本工作中使用DTW为例来衡量一天中不同时间段的平均流量的相似性。我们使用来表示相似度矩阵,其中rirj之间的相似度。基于,连通图的生成过程如图3所示:                    
图3 连通图的生成过程

(3)单个时间片的依赖学习(DLI)
在标准转换器之后,ST-TIS采用了一种多头注意力机制,因此它可以解释区域之间的不同依赖关系。对于第m个头部,在tjrirv之间的注意得分定义为:
与典型的转换器不同,我们不评估一个区域和所有其他区域之间的注意力分数,相反,我们只计算区域连接图中的相邻区域的注意力分数,并根据他们的注意力得分汇总它们的嵌入,以更新区域的嵌入。对于第m个头,在tj时区域ri的嵌入更新为
最后,我们将多头的结果连接起来,并计算出ri的嵌入为
按照转换器的结构,然后将多头区域注意层的输出传递到一个完全连接的神经网络,如图4所示。我们还在这两层之间使用了残差连接。由于信息的传播是通过一个多层的网络结构来实现的,因此,我们堆叠各层的α时间。我们将DLI的最终输出表示为,其中是区域ritj处的嵌入。
图4 对个体时间段的依赖学习的处理
(4)多时间片依赖学习(DLM)
考虑到时空依赖性可能具有周期性特征,DLM通过评估与其他历史时隙(其中)的依赖性之间的相关性来学习周期依赖性。然后,根据嵌入的相关性在不同的时间段进行聚合,为ri生成新的ri嵌入。
我们采用具有自注意的点向聚合来评估它们的相关性,并相应地聚合嵌入。为了捕获多重周期依赖关系,我们在DLM中使用了一个多头注意网络。
给定一组历史时隙Q,对历史时隙的第z个依赖性计算如下:
我们使用一个softmax函数来规范化依赖关系,并按权重聚合每个时间片段的上下文:
因此,第z个头的聚集是
最后,我们将不同头部的结果与下列公式相连
在周期性依赖学习过程中本文共同考虑了空间和时间依赖。计算复杂度为,其中是用于学习的历史时隙的数量。
(5)预测网络(PN)
给定一个区域的时空嵌入,预测网络使用全连通网络预测流入和流出。预测函数的定义为:
我们在工作中同时预测了流入和流出量,并将损失函数定义如下:
三.实验
3.1 实验设置
(1)数据集:采用了基于三个真实世界的交通流数据集,即纽约-出租车数据集、纽约-自行车数据集、自行车数据集和PeMS数据集(PeMSD4)
(2)评估指标:使用均方根误差(RMSE)、平均平均百分比误差(MAPE)和作为评估度量。
(3)基线:本文将提出的模型与以下最先进的方法进行了比较:Historical average (HA)、Ridge Regression、XGBoost、Multi-Layer Perceptron (MLP)、Convolutional LSTM (ConvLSTM)、ST-ResNet、STDN、ASTGCN、STGODE、STSAN、DSAN。
3.2 实验结果
表1、表4和表5中的比较结果表明,我们提出的ST-TIS比其他基于深度学习的基线方法更快、更轻量级,同时实现了更好的预测精度。ST-TIS在训练效率方面显著优于其他先进的深度学习方法(训练时间减少了46%~95%,网络参数减少了35%~98%),因此在调谐、训练和记忆方面非常有效。尽管它的体积小,训练速度快,但与其他最先进的作品相比,它的在线预测精度更高(RMSE提高了9.5%,MAPE提高了12.4%)。
四.总结
本文介绍了ST-TIS,它是一种新型的、轻量级、计算效率高且精度也高的交通预测模型。主要采用具有信息融合和区域采样的时空转换器,联合考虑任何单个时间片之间的动态空间和时间相关性,以及来自多时间片的周期性的时空相关性。基于真实数据和部署的大量实验结果表明,ST-TIS极大地提高了效率,并使用新的区域采样策略解决了规范转换器的长尾问题,降低了复杂性。
-End-
本文作者
孟菲
重庆大学计算机学院交通运输工程博士二年级在读学生,重庆大学START团队成员。主要研究方向:流式轨迹数据处理与分析,时空数据挖掘。


时空艺术团队START,Spatio-Temporal Art)来自重庆大学时空实验室,旨在发挥企业和高校的优势,深入探索时空数据收集、存储、管理、挖掘、可视化相关技术,并积极推进学术成果在产业界的落地!年度有2~3名研究生名额,欢迎计算机、GIS等相关专业的学生报考!

关注公众号,回复“TKDE_ST-TIS”获取论文

文章转载自时空实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论