暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据库与数据挖掘协会周刊第3期

时空实验室 2024-04-25
71

Academic Push

A Lightweight and Accurate Spatial-Temporal Transformer for Traffic Forecasting

链接:https://ieeexplore.ieee.org/abstract/document/10004027

作者:Guanyao Li, Shuhang Zhong, Xingdong Deng, Letian Xiang, S.-H. Gary Chan, Ruiyuan Li, Yang Liu, Ming Zhang, Chih-Chieh Hung, Wen-Chih Peng.

简介:交通预测是预测一个城市下一个时间段的流入(即单位时间到达对象的数量)和流出(即单位时间离开对象的数量)。对象可以是人、车辆、货物/物品等。交通预测在交通、零售、公共安全、城市规划等领域都有重要的应用。虽然有很多集中在深度学习提高预测精度的预测模型,但是性能的提升却伴随着参数的增加训练资源的增加,这就导致训练和部署大型深度学习模型的成本高昂,因此,一个轻量级且高效的模型对于快速交付和部署至关重要。此外,区域交通在空间上和时间上是相关的,这种依赖在不同的时间隙上是动态的,它可能具有时间周期模式。因此,为了准确预测区域交通,无论区域之间有多远,考虑区域之间的动态性和联合的时空(ST)依赖性是至关重要的。鉴于此,本文提出了一种新颖的、轻量级的、精确的、具有信息融合和区域采样功能的交通预测时空转换器ST-TIS。ST-TIS基于考虑区域之间的时空依赖关系,尤其是考虑了具有信息融合模块(IFM)的任意单个时间片的动态时空依赖性,以及使用注意力机制的多个时间片之间的时空依赖性可能周期性特征,提出了数据驱动的转换器方案。此外,本文提出了一种新的考虑到计算效率的区域采样策略,利用转换器框架来学习区域依赖关系,与此同时还采用了一种新的区域采样策略来生成连通区域图,并基于该图学习其依赖性。在ST-TIS中,通过信息传播保证考虑到任意一对区域之间的依赖关系(近距离和远处依赖关系)。


Contest Info

2024年全国大学生计算机系统能力大赛数据库管理系统设计赛现已开放报名,欢迎大家积极参赛!


Wiki

分布式数据库
分布式数据库是一种先进的数据库系统,其设计和架构旨在有效地处理大规模数据,并提供高度可靠性、高性能和可扩展性。其核心特征是数据的分布存储和处理,通过将数据分割成多个部分并存储在不同的计算节点上,以水平或垂直的方式进行划分。这样的分布式设计有助于实现负载均衡避免单点故障,并提高系统的整体性能。分布式数据库通常运行在大型集群上,通过网络连接进行通信和协调。尽管分布式数据库的实现和管理较为复杂,但它们为现代应用程序提供了强大的数据处理能力,能够满足日益增长的数据存储和处理需求,因此在大数据、云计算和企业级应用等领域得到了广泛应用。

Question

在数据挖掘中,K均值聚类是一种常用的无监督学习算法,用于将数据集分成不同的簇。以下哪个选项描述了K均值聚类的一个特点?
    A) 每个数据点只能属于一个簇,并且一个簇中的数据点彼此密集且分离明显。
    B) 算法的执行时间与数据集的大小成二次方关系,因此适用于小型数据集。
    C) 对初始聚类中心的选择非常敏感,不同的初始点可能导致不同的聚类结果。
    D) K值的选择越大,生成的聚类数量就越少,因此可以更好地识别数据集中的噪声。

上期问题:数据库与数据挖掘协会周刊第2期
上期答案:A) 索引会降低写操作的速度,因为每次写操作都要更新索引。
在数据库中创建索引时,索引会降低写操作的速度,因为每次写操作都必须更新索引以保持其正确性和一致性。这意味着在进行插入、更新或删除操作时,数据库管理系统需要额外的时间和资源来更新相关的索引,从而导致写入数据的速度变慢。因此,尽管索引可以加速读取操作,但在写入频繁或索引数量较多的情况下,这种影响可能会更加显著。


数据库与数据挖掘协会(DataBase & DataMining Association,简称DBDMA),一个致力于促进重庆大学数据库和数据挖掘领域发展的学生社团。其主要目的是为会员提供一个交流、学习和实践的平台,推广数据库和数据挖掘技术的应用,帮助学生了解数据库和数据挖掘领域的最新动态和技术应用,促进重庆大学数据库与数据挖掘领域的交流和合作,不断壮大我校在该领域的力量!

文章转载自时空实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论