KDD 2022 | 基于交通摄像头视频数据的路网时空车辆轨迹恢复

时空实验室 2022-08-29

1075

轨迹恢复在轨迹数据挖掘中起到重要的作用，传统方法无法恢复道路上所有车辆的轨迹，因为它们基于部分轨迹数据。本文带来清华大学团队在国际顶级数据挖掘会议KDD 2022上发表的论文：《Spatio-Temporal Vehicle Trajectory Recovery on Road Network Based on Traffic Camera Video Data》

一．背景

大规模车辆轨迹在理解城市流动性方面起着重要作用，这为智能交通系统中的许多应用带来了巨大好处，如路线规划、交通状况预测、视频监控和交通信号控制。支持GPS设备的发展为随时随地记录车辆轨迹提供了机会。然而，由于设备的限制，轨迹数据的质量具有不确定性。同时，由于商业和用户隐私保护，很难共享来自不同提供商的数据，因此轨迹数据通常来源于少数车辆。如今，随着在道路交叉口部署交通摄像头的普及使得获得所有车辆的轨迹数据成为可能。具体来说，交通摄像头记录了在不同时间通过交叉点通过的所有车辆。通过利用来自城市范围的摄像机网络的大规模视频或图像数据，期望恢复全部车辆轨迹。

论文提出了一个迭代框架来共同优化车辆识别和轨迹恢复任务。在车辆识别任务中，论文提出了一种有效的策略，以根据视觉特征和轨迹发现任务更新的时空约束特征来指导车辆聚类。在轨迹恢复任务中，论文通过恢复轨迹的概率方法对空间和时间关系以及车辆错过问题进行建模。广泛的实验表明，论文的框架优于现有的最新解决方案。

二．方法介绍

1.总体框架

图1 模型总体框架

如图1所示论文提出方法的总体框架由三个部分组成：1）预处理模块，对三种原始数据进行预处理，即从摄像机快照中提取视觉特征，包括外观特征和车牌特征，并使用地图匹配算法将历史轨迹与道路网络进行匹配。2）车辆识别模块，多模态相似聚类算法不仅将视觉特征作为输入的静态部分，还将自监督嵌入作为输入的动态部分，并由反馈模块更新。3）轨迹恢复模块，道路速度估计器根据地图匹配的轨迹计算每个时隙中每条道路的速度分布，并其中采用矩阵分解方法来解决稀疏性问题。同时，道路转移估计器基于路网上每个节点处的地图匹配轨迹的转移频率提出转移概率矩阵，该转移概率矩阵描述了从其先前道路到其后续道路的先验概率。最后，最大后验路径搜索器将聚类结果作为输入，搜索最大后验路线，以恢复聚类中每两个连续记录之间的轨迹。

论文提出的模型作为一个迭代框架，反馈模块计算恢复轨迹的时空可行性分数，基于该分数，它可以检测有噪声的记录并补充丢失的记录。相应地更新记录的动态嵌入，以便在下一次迭代中改进聚类结果。

2.车辆重新识别

车辆特征表示。对交通摄像机捕获的原始视频数据进行采样和裁剪，以形成单个车辆图像的集合。我们使用两个分别预训练和微调的ResNet-50模型从图像中提取256维车辆外观特征和256维车辆牌照特征。

车辆聚类。多模式相似性聚类算法将外观特征f_a和车牌特征f_p以及动态嵌入f_d（其初始化与外观特征相同）作为输入，并由迭代框架中的反馈模块更新。对于两个记录𝑖和𝑗，论文将它们的相似性定义为其特征的余弦相似性的加权和。具体来说聚类算法有两个层面，如图2所示。首先，我们分别通过外观特征和车牌特征搜索每个车辆记录在所有车辆记录中的𝑘个最近邻，并将收集记录作为KNN记录集。对于第二个层面，算法逐个查看记录，并决定是将它们添加到现有集群，还是基于多模式相似性构建新集群。具体而言，对于每个当前记录，算法计算其与包含其KNN记录的候选聚类的多模态相似性。如果最大相似度大于预定义阈值，则将记录添加到具有最大相似度的聚类；否则，将生成仅包含此记录的新群集。

图2 车辆聚类流程图

3.时空车辆轨迹恢复

在现实世界的交通系统中，并非所有十字路口都安装了交通摄像头，也不是每次车辆经过摄像头时都能捕捉到。因此，仅使用车辆的记录不足以完全确定其轨迹。为了解决这个问题，论文使用时空车辆轨迹恢复模块来恢复连续记录之间的最可能轨迹。给定起点r_s，开始时间t_s，终点r_e和结束时间t_e，论文将连接两点的轨迹表示为：p = {s₁⋯s_n}。定义Δt = t_e- t_s，给定上述信息的轨迹后验概率可分解为两部分：

对于第一部分，论文假设从一个路段到另一个路段的过渡与起点r_s无关，并且满足给定终点r_s的马尔可夫性。对于第二部分，论文量化t_e分为24个时隙，长度为1小时，并按时隙计算每条道路上的平均行驶速度。论文还采用了矩阵分解方法来解决数据稀疏性问题。

为寻找最优的p^*使上述等式最大化，论文使用贪婪搜索算法，从r_s，向外扩展，最多维护一组𝑘最佳轨迹直到r_e到达。

4.车辆重新识别和轨迹恢复的合作

轨迹恢复模块将聚类结果作为输入，并恢复最大后验轨迹。一方面，恢复轨迹的最佳可实现精度受聚类结果的质量限制。具体而言，错误聚类记录（噪声）应尽可能少，以便准确反映单个车辆的真实轨迹来恢复轨迹。另一方面，恢复轨迹的不可行性可以作为潜在噪声和丢失记录的线索。因此，设计了一个迭代管道，以实现车辆重新识别和轨迹恢复的协同优化，如图3所示。

图3 迭代流程

论文将时空信息结合到反馈模块中，检测噪声并恢复丢失的记录，以细化和补充聚类结果，其工作原理如图4所示。

图4 用于检测噪音和恢复缺失记录的反馈模块

三．实验结果

1.实验设置

本文提出的模型所对比的方法是一个再识别模型（BNN）和两个具有代表性的高性能模型（VeTrac、MMVC）。数据集采用D4M数据集（全量数据集）与D1M数据集（采样数据集）。

2.整体表现

车辆聚类的结果与轨迹恢复的结果分别如表1与表2所示。论文的方法在全量数据集D4M和采样数据集D1M上的各种指标上始终优于所有基线。由D1M数据集与D4M数据集的指标对比可以看出，由于D4M引入了大量车辆及其记录，车辆识别任务变得更具挑战性。在所有方法中都可以看到性能的明显下降。但是，与D1M相比，论文的方法在性能上获得了更大的增益，这表明论文的方法对噪声更具鲁棒性，可以更好地处理大规模数据集，因此更适合于实际应用。

表1 在聚类输出方面的性能比较

表2 在轨迹恢复方面的性能比较

3.参数分析

相似性阈值。论文将迭代次数固定为3，并将聚类相似性阈值从0.6更改为0.95。结果如图5所示。精度和扩展性随着相似性阈值单调增加，召回率按预期单调下降，F1值先上升然后下降。因此，相似性阈值有助于指导模型在精度和召回率之间的权衡，从而获得更好的F1值。

图5 相似性阈值的影响

迭代次数。论文将相似度阈值固定为0.8，并将迭代次数从0更改为7。从图6中可以看出，在前5次迭代中，精度、F1值和召回率总体保持上升，但第4次迭代中的精度和第5次迭代的召回率略有下降。曲线的趋势也表明前几次迭代是有益的。这证明了所提出的反馈模块和迭代框架的有效性。当F1值上升时，精度或召回率会出现轻微下降的原因是噪声检测和缺失补码步骤都会出错。一般来说，噪声检测步骤以召回为代价提高了召回率，而缺失补码步骤以召回率为代价提高召回率，但两者都提高了F1分数。例如，在第四次迭代中，召回率大幅上升，因此精度略有下降。另一个观察是，当迭代次数过大时，所有度量都会变差，这是因为存在一些过于复杂的情况，因此无法检测到相应的噪声或丢失的记录，并且这些可检测的记录在前几次迭代期间已经固定。

图6 迭代次数的影响

四．总结

本文提出了一个新型系统，可以根据广泛部署的交通摄像机的视频数据恢复车辆轨迹。论文系统的核心是一个迭代框架，可以将车辆的重新识别和轨迹恢复任务进行优化。具体而言，车辆的重新识别任务可根据车辆的视觉特征和动态时空约束特征在交点上提供基本轨迹点。轨迹恢复任务采用了一种概率方法来模拟轨迹恢复的时空依赖性和车辆错过问题，并为车辆重新识别任务提供了时空信息。论文进行了广泛的实验来评估框架的有效性，结果表明，所提出的模型的性能优于最新方法。重要的是，论文还将系统部署在Sensetime的实际应用中。该系统可以为车辆重新识别和交叉级车辆轨迹恢复提供准确的结果，这使许多重要的应用受益，包括交通信号控制和拥塞分析等。

聚类迭代计算迭代模型

文章转载自时空实验室，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

KDD 2022 | 基于交通摄像头视频数据的路网时空车辆轨迹恢复

评论