暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据库与数据挖掘协会周刊第11期

时空实验室 2024-11-07
65

Wiki

时间序列数据
时间序列数据是指按照时间顺序收集的数据点序列,通常用于记录一个变量或多个变量在不同时间上的变化情况。它的特点是数据点之间存在时间上的关联性,每一个数据点都对应一个时间戳。这种类型的数据广泛存在于金融、气象、经济、医疗、交通等领域,例如股票价格的每日记录、气温的小时变化、心率的秒级监测等。
时间序列数据的分析通常关注趋势、季节性、周期性和噪声等因素,以便进行预测、异常检测或揭示数据的时间依赖结构。分析时间序列数据常用的统计方法包括:
自回归 (AR) 模型:假设当前时间点的数据与前几个时间点的值相关。AR模型通过选择一个“阶数” p 来决定回归的滞后步数,即回归到前 p 个时间点的数据。
滑动平均 (MA) 模型:假设当前时间点的数据是由白噪声与前几个时间点的误差项的加权组合。滑动平均模型也有一个阶数 q,表示使用 q 个滞后的误差项。
自回归滑动平均 (ARMA) 模型:结合了AR模型和MA模型,适用于平稳时间序列。ARMA模型通过两个参数(阶数 p 和 q)来捕捉数据的自相关性和噪声结构。
自回归积分滑动平均 (ARIMA) 模型:是ARMA模型的扩展,增加了差分处理,适用于非平稳时间序列。ARIMA通过阶数 p、差分次数 d 和阶数 q 捕捉数据的趋势性和季节性变化。
季节性ARIMA (SARIMA) 模型:是对ARIMA模型的进一步扩展,增加了季节性成分,以捕捉周期性趋势。SARIMA模型适用于具有明显周期性的时间序列(例如,每年或每季度波动的数据)。
统计方法在时间序列分析中十分有效,且便于解释。它们的局限性在于对数据的线性假设较多,且难以处理复杂的非线性序列和高维时间序列数据。

Academic Push

Spatial-Temporal Graph Boosting Networks: Enhancing Spatial-Temporal Graph Neural Networks via Gradient Boosting
来源:CIKM 2023 (CCF-B类)
链接:https://dl.acm.org/doi/abs/10.1145/3583780.3615066
作者:Yujie Fan, Chin-Chia Michael Yeh, Huiyuan Chen, Yan Zheng, Liang Wang, Junpeng Wang, Xin Dai, Zhongfang Zhuang, Wei Zhang

简介:时空预测在现实中有广泛的应用,如交通流量预测、网约车需求预测以及基于骨架的人体动作识别。随着图神经网络(GNNs)的发展,时空图神经网络(STGNNs)成为解决时空预测问题的有前景方法。STGNNs能够利用不同互连节点之间的空间依赖性以及节点时间序列数据的时间动态来进行预测。现有的STGNNs主要通过GNNs来表征空间域中的空间依赖性,同时通过循环神经网络(RNNs)或基于卷积的序列学习模型来描述时间维度中的时间动态。通过整合空间和时间域的输出,STGNNs能够共同捕获时空关联性。

本文提出了一种时空图提升网络(STGBN),通过梯度提升来增强STGNNs的性能。STGBN是一种加性模型,基于每次迭代中优化的轻量化基础学习器(即STGNN)进行更新。STGBN遵循传统梯度提升的训练流程,但通过两种独特的设计解决了在时空图上的训练效率问题。具体而言,传统的梯度提升在每次迭代中使用完整输入数据来构建不同的基础模型。相比之下,STGBN采用一种增量学习策略,逐步将时空数据加入训练过程。这一设计带来了两大优势:1.显著提高了训练效率,因为每次迭代的训练并未使用整个时空数据;2.通过利用新加入的时空数据来纠正前一轮提升迭代产生的预测误差,提高了模型性能。此外,STGBN在所有迭代中保持一致的基础学习器架构,每个基础学习器从前一轮学习器中继承初始状态,使其能够快速收敛,进一步加速训练过程。

为解决第二个局限性,STGBN的基础学习器需要在轻量化与捕捉全面的时空交互间取得平衡。为此,本文引入了一种“变压器三明治”设计。综上所述,本文的主要贡献如下:1.提出了一种新颖的学习架构STGBN,它以梯度提升方式训练STGNNs。这是首个探索梯度提升在提升STGNNs性能潜力的研究。2.在STGBN中设计了轻量化的三明治风格基础学习器,它包括两个时间变压器作为“面包”和一个空间变压器作为“夹心肉”。这一设计选择使它能够捕捉长距离的时间动态、全局的空间依赖性和丰富的时空交互。3.在时空图基准上进行了广泛实验。结果表明STGBN性能卓越。消融研究也证实了梯度提升训练方式和变压器三明治设计的贡献。


Question

上期链接:数据库与数据挖掘协会周刊第10期
上期答案:A) 唯一标识表中的每一行记录,且不允许为空
在关系型数据库中,主键(Primary Key) 的主要作用是唯一标识表中的每一行记录。主键列必须满足以下两个要求:
1. 唯一性:主键值必须在表中是唯一的,不能有重复。2. 非空性:主键值不能为空(NULL),因为每一行都需要一个唯一的标识。
其他选项的解释:
B) 定义表中的外键关系,确保数据的引用完整性:这是外键(Foreign Key)的作用。外键用于建立不同表之间的关系,确保数据引用的完整性。
C) 用于存储表中的非结构化数据,如图像或文档:非结构化数据的存储通常不使用主键,而是使用BLOB、JSON等数据类型。
D) 定义表中的默认排序顺序,用于快速查询:默认排序顺序与主键无关,通常可以通过索引来加速查询。


数据库与数据挖掘协会(DataBase & DataMining Association,简称DBDMA)一个致力于促进重庆大学数据库和数据挖掘领域发展的学生社团,我们的目标是让世界了解重大数据库,让重大数据库走向世界!

文字:DBDMA-尚游
编辑:DBDMA-王伟俨
校对:DBDMA-王伟俨

文章转载自时空实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论