
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2020,31(3):726−747 [doi: 10.13328/j.cnki.jos.005907] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
基于相关性分析的工业时序数据异常检测
∗
丁小欧
,
于晟健
,
王沐贤
,
王宏志
,
高
宏
,
杨东华
(哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001)
通讯作者: 王宏志, E-mail: wangzh@hit.edu.cn
摘 要: 多维时间序列上的异常检测,是时态数据分析的重要研究问题之一.近年来,工业互联网中传感器设备采
集并积累了大量工业时间序列数据,这些数据具有模式多样、工况多变的特性,给异常检测方法的效率、效果和可
靠性均提出更高要求.序列间相互影响、关联,其隐藏的相关性信息可以用于识别、解释异常问题.基于此,提出一种
基于序列相关性分析的多维时间序列异常检测方法.首先对多维时间序列进行分段、标准化计算,得到相关性矩阵,
提取量化的相关关系;然后建立了时序相关图模型,通过在时序相关图上的相关性强度划分时间序列团,进行时间序
列团内、团间以及单维的异常检测.在真实的工业设备传感器数据集上进行了大量实验,实验结果验证了该方法在
高维时序数据的异常检测任务上的有效性.通过对比实验,验证了该方法从性能上优于基于统计和基于机器学习模
型的基准算法.该研究通过对高维时序数据相关性知识的挖掘,既节约了计算成本,又实现了对复杂模式的异常数据
的精准识别.
关键词: 异常检测;多维时间序列;时序数据分析;工业大数据;机器学习
中图法分类号: TP18
中文引用格式: 丁小欧,于晟健,王沐贤,王宏志,高宏,杨东华.基于相关性分析的工业时序数据异常检测.软件学报,2020,31(3):
726−747. http://www.jos.org.cn/1000-9825/5907.htm
英文引用格式: Ding XO, Yu SJ, Wang MX, Wang HZ, Gao H, Yang DH. Anomaly detection on industrial time series based on
correlation analysis . Ruan Jian Xue Bao/Journal of Software, 2020,31(3):726−747 (in Chinese). http ://www.jos.org.cn/1000-9825/
5907.htm
Anomaly Detection on Industrial Time Series Based on Correlation Analysis
DING Xiao-Ou, YU Sheng-Jian, WANG Mu-Xian, WANG Hong-Zhi, GAO Hong, YANG Dong-Hua
(School of Computer Science and Technology, Harbin In stitute of Technology, Harbin 150001, China)
Abstra ct : Anomaly detection on multi-dimensional time series is an important research problem in temporal data analysis. In recent
years, large-scale industrial time s eries data have been collected and accumulated by equipment s ensors from Industrial Int ernet of Things
(IIoT). These data show the feature of diversity data patterns and workflows, which requires high performance of anomaly detection
methods in efficiency, effectiveness, and reliability. Besides, there exists latent correlation between sequences from different dimensions.
The correlation information can be us ed to id entify and explain anomalies i n data. Based on th is, this study propo ses a correlation anal ysi s
based anomaly detection on multi-dimension al time series data. It first computes correlation values among sequences after standardization
steps, and a time series correl ation graph model is constru cted. Time series cliques are constructed according to correla tion degree in the
∗ 基金项目: 国家重点研发计划(2016YFB100703); 国家自然科学基金(U1509216, U1866602, 61602129); CCF-华为数据库创新
研究计划(CCF-Huawei DBIR2019005B)
Foundation item: National Key Research and Development Program of China (2016YFB100703); National Natural Science
Foundation of China (U1509216, U1866602, 61602129); CCF-Huawei Database System Innovation Research Plan (CCF-Huawei
DBIR2019005B)
本文由人工智能赋能的数据管理、分析与系统专刊特约编辑李战怀教授、于戈教授和杨晓春教授推荐.
收稿时间: 2019-07-20; 修改时间: 2019-09-10; 采用时间: 2019-11-25; jos 在线出版时间: 2020-01-10
CNKI 网络优先出版: 2020-01-10 13:34:43, http://kns.cnki.net/kcms/d etail/11.2560.TP.20200110.1334.008.html
评论