暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
基于相关性分析的工业时序数据异常检测-丁小欧 , 于晟健 , 王沐贤 , 王宏志 , 高宏 , 杨东华.pdf
564
22页
1次
2022-05-24
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2020,31(3):726747 [doi: 10.13328/j.cnki.jos.005907] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
基于相关性分析的工业时序数据异常检测
丁小欧
,
于晟健
,
王沐贤
,
王宏志
,
,
杨东华
(哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001)
通讯作者: 王宏志, E-mail: wangzh@hit.edu.cn
: 多维时间序列上的异常检测,是时态数据分析的重要研究问题之一.近年来,工业互联网中传感器设备采
集并积累了大量工业时间序列数据,这些数据具有模式多样、工况多变的特性,给异常检测方法的效率、效果和可
靠性均提出更高要求.序列间相互影响、关联,其隐藏的相关性信息可以用于识别、解释异常问题.基于此,提出一种
基于序列相关性分析的多维时间序列异常检测方法.首先对多维时间序列进行分段、标准化计算,得到相关性矩阵,
提取量化的相关关系;然后建立了时序相关图模型,通过在时序相关图上的相关性强度划分时间序列团,进行时间序
列团内、团间以及单维的异常检测.在真实的工业设备传感器数据集上进行了大量实验,实验结果验证了该方法在
高维时序数据的异常检测任务上的有效性.通过对比实验,验证了该方法从性能上优于基于统计和基于机器学习模
型的基准算法.该研究通过对高维时序数据相关性知识的挖掘,既节约了计算成本,又实现了对复杂模式的异常数
的精准识别.
关键词: 异常检测;多维时间序列;时序数据分析;工业大数据;机器学习
中图法分类号: TP18
中文引用格式: 丁小,于晟健,王沐贤,王宏志,高宏,杨东华.基于相关性分析的工业时序数据异常检测.软件学报,2020,31(3):
726747. http://www.jos.org.cn/1000-9825/5907.htm
英文引用格式: Ding XO, Yu SJ, Wang MX, Wang HZ, Gao H, Yang DH. Anomaly detection on industrial time series based on
correlation analysis . Ruan Jian Xue Bao/Journal of Software, 2020,31(3):726747 (in Chinese). http ://www.jos.org.cn/1000-9825/
5907.htm
Anomaly Detection on Industrial Time Series Based on Correlation Analysis
DING Xiao-Ou, YU Sheng-Jian, WANG Mu-Xian, WANG Hong-Zhi, GAO Hong, YANG Dong-Hua
(School of Computer Science and Technology, Harbin In stitute of Technology, Harbin 150001, China)
Abstra ct : Anomaly detection on multi-dimensional time series is an important research problem in temporal data analysis. In recent
years, large-scale industrial time s eries data have been collected and accumulated by equipment s ensors from Industrial Int ernet of Things
(IIoT). These data show the feature of diversity data patterns and workflows, which requires high performance of anomaly detection
methods in efficiency, effectiveness, and reliability. Besides, there exists latent correlation between sequences from different dimensions.
The correlation information can be us ed to id entify and explain anomalies i n data. Based on th is, this study propo ses a correlation anal ysi s
based anomaly detection on multi-dimension al time series data. It first computes correlation values among sequences after standardization
steps, and a time series correl ation graph model is constru cted. Time series cliques are constructed according to correla tion degree in the
基金项目: 国家重点研发计划(2016YFB100703); 国家自然科学基金(U1509216, U1866602, 61602129); CCF-华为数据库创新
研究计划(CCF-Huawei DBIR2019005B)
Foundation item: National Key Research and Development Program of China (2016YFB100703); National Natural Science
Foundation of China (U1509216, U1866602, 61602129); CCF-Huawei Database System Innovation Research Plan (CCF-Huawei
DBIR2019005B)
本文由人工智能赋能的数据管理、分析与系统专刊特约编辑李战怀教授、于戈教授和杨晓春教授推荐.
收稿时间: 2019-07-20; 修改时间: 2019-09-10; 采用时间: 2019-11-25; jos 在线出版时间: 2020-01-10
CNKI 网络优先出版: 2020-01-10 13:34:43, http://kns.cnki.net/kcms/d etail/11.2560.TP.20200110.1334.008.html
丁小欧 :基于相关性分析的工业时序数据异常检测
727
time series correlation graph. Anomaly detection is processed within and out of a cliqu e. Experimental results on a real industrial sensor
data set show that the proposed method is effective in anomaly detection tasks in high dimensional time series data. Through contrast
experiments, the proposed method is verified to have a better performance than both the statistic-based and the machine learning-based
baseline methods. Research in this study achieves reliable correlation knowledge mining between time series, which not only saves time
costs, but also identifies abnormal p atterns form co mplex conditions.
Key words: anomaly detection; mu lti-dimension al ti me series; temporal data analys is; indu strial big d ata; mac hine learn ing
数十年来,随着工业化和现代化进程的推进,我国制造业持续快速发展.智能制造作为工业大数据的重要应
用场景,既是数据的载体和产生来源,也是工业大数据形成的数据产品最终的应用场景和目标
[13]
.随着制造业
数字化的快速发展,现代化制造生产线、智能产品通过传感器、控制器、智能仪表等
[4]
,实现了对生产运行状态
和运行环境的实时记录和感知,已经积累并正在产生大量的工业时序数据.通过对基于采集时间点的多维时间
序列数据的分析和挖掘,能够得到宝贵的领域知识,能够对系统的运行状态实现控制、分析、决策和规划
[5]
,
及对被监测到的故障问题和被预测计算到的隐患问题进行诊断、预警、处置、修复.上述过程形成了有效的工
业知识产生、提取、应用的积极循环,进而实现了对工业大数据的智能分析.
由于制造系统中存在产品质量缺陷、设备故障、性能下降、外部环境变化等异常问题
[6,7]
,异常工况检测、
故障监测、设备健康状态分析等是实现精益生产和智能制造的重要的具体任务,也是工业大数据分析中的重要
研究问题
[5]
.如果工业产生中的异常、故障、危机情况不能及时地被有效识别,将导致生产环境存在隐性安全隐
,很可能给整个制造体系带来连带的损失.目前,在高维时间序列数据中的复杂异常状况也逐渐引起重视,
处异常情况的发生往往与多维序列相互影响、产生作用,这些异常模式更难以检测识别.而工业大数据具有大
体量、多源异构性强、连续采样、价值密度低、动态性强等特点
[1,3,4]
,这为工业大数据的异常故障检测问题带
来了难度和挑战.通过调研,工业时间序列异常检测的研究难点总结如下.
(1) 工业机器设备传感器所采集的时间序列记录了模式多样、多变的工况数据,其数据特点导致了传统
时间序列异常检测模型不能很好地适用于工业时序数据异常检测;
(2) 工业时序数据与行业领域联系紧密,难以建立通用的理论计算模型框架,不同类型的工况序列数据模
式缺少合理建模方法,时间序列中的值异常、区间异常、模式异常等问题难以有效地描述和量化评
,异常问题容易被误判;
(3) 工业数据采集平台往往包含各类模块化协同工作的传感器设备组,同组的传感器所采集的数据可能
模式相似,同时,不同组传感器之间的数据可能存在模式相关关系.这种多维时间序列的相关关系挖
掘存在难度,导致存在组内、组间的异常数据容易被漏判、错判;
(4) 已有的大部分多维时间序列的异常检测方法通常时间开销大,方法难以在准确性和效率之间找到有
效的平衡,难以满足工业大数据分析对异常检测精度、效率以及可靠度的要求.
而纵观目前已有的时间序列异常检测方法,大部分都专注于解决单维度有周期性或者简单模式时间序列
上的异常识别,难以对异常模式和正常模式进行有效的建模区分,不能满足模式多样、工况多变的工业时序数
据上的异常监测与检测的需求.此外,由于多维时间序列之间存在一定的相关关系,有助于提高异常检测任务的
判别准确性,但复杂的相关性关系难以有效地被建模计算.虽然已有一些基于机器学习的模型可对高维时序数
据进行处理,但其计算通常缺乏可解释性,且其计算结果的可靠性难以满足工业时序数据异常检测的需求.已有
工作未能实现对多维序列的相关性信息的挖掘和利用,大量错判、漏判的情况导致异常检测方法性能的降低.
基于此,根据真实的制造业数据分析背景,本文研究了基于相关性分析的智能化时序数据异常检测方法.
文的主要贡献总结如下.
(1) 提出了多维时间序列相关性计算方法,并建立时间序列相关图模型,实现对工业时序数据相关机理的
深入挖掘,实现了从
工业大数据中提取信息进行知识推理.该模型有助于工业知识被高效、自发地提
取和应用;
(2) 提出了基于相关性分析的多维时间序列数据异常检测方法,在训练过程中,有效挖掘各个维度上序列
of 22
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜