暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
基于人工智能方法的数据库智能诊断-金连源/李国良.pdf
1011
15页
15次
2021-01-29
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW
Journal of Software, [doi: 10.13328/j.cnki.jos.006177]
©国科学院软件研究所版权所.
基于工智能方法的数据库智能诊
连源
,
(华大 计算机科学与技术,北京 100084)
通讯作者: , E-mail: liguoliang@tsinghua.edu.cn
:
数据库是一种非常重要和基础的计算机系统软
始关注数据库运行的稳定性.
由于各种各样内部或是外部作用的影响
而这可能会带来巨大的经济损失.
人们大多通过观察监控指标信息来进行数据库异常诊断
标有数百个,
普通的数据库使用者根本无法提取出有价值的信息
这种成本会是很多公司难以接受的.因此,
如何用较低的成本完成对数据库的自动监控和诊断是一个具有挑战性的
问题.现有的 OLTP
数据库自动异常诊断方法往往存在着监控信息收集成本过高
问题.在这篇论文里我们提出了一种智能
的数据库异常诊断框架
取和根因分析这三个模块,这三
个模块分别使用了基于
验、和优化的 K 近邻算法.
整个框架分成离线训练和在线诊断这两个阶段
据库,
通过实验表明该框架对于异常诊断具有较高的精确程度
关键词: OLTP 型数据库;异常诊断;人工智能
图法类号: TP311
AI-Based Database Performance Diagnosis
JIN Lian-Yuan, LI Guo-Liang
(Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China)
Abstract:
Database is a kind of important and fundamental computer system software. With the
all walks of life, a growing number of people
begin to concern the stability of the database. Because of the numerous internal of
effect, performance anomaly may emerge when the Database running and it
database anomaly by analyzing monitoring metrics. However, there are hundreds of metrics in the system and
unable to extract valuable
information from them. Some major companies employ DBA to manage the
unacceptable for many other companies. Achieving automatic
database monitor and diagnose with low cost is a challenging problem.
Current methods have many limitations, including high cost of metrics information collection, narrow
In this paper, we propose an anomaly diagnose framework
AutoMonitor
contains LSTM-based anomaly detection
module and modified
framework consists of an offline training and an online diagnose stage. Our
diagnose accuracy with minor overload to system performance
Key words: OLTP Database; Anomaly Diagnosis; Artificial
intelligence
IT ,指的 IT
服务理相的人及管理过
且使务达用户付款的预.
维在人类来的产生活中作用越来越重
500 亿 1000 亿 IT ,
些设备会载无的服
金项: 国家自然科学基金(61925205, 61632016)
Foundation item: National Natural Science Foundation of China (61925205, 61632016
收稿时间: 2020-07-19; 修改时间: 2020-09-03; 改时
: 2020
E-mail: jos@iscas.ac.cn
http://www.jos.org.cn
Tel: +86-10-62562563
基于工智能方法的数据库智能诊
数据库是一种非常重要和基础的计算机系统软
,着数据库在各行各业的广泛应,来越多的人
由于各种各样内部或是外部作用的影响
,数据库在实际运行的过程中会出现性能异常,
人们大多通过观察监控指标信息来进行数据库异常诊断
,但是关于数据库监控指
普通的数据库使用者根本无法提取出有价值的信息
.一些传统的公司会聘用专业的人员管理数据库,
如何用较低的成本完成对数据库的自动监控和诊断是一个具有挑战性的
数据库自动异常诊断方法往往存在着监控信息收集成本过高
适用范围小抑或是稳定性较差等
的数据库异常诊断框架
AutoMonitor,提供了数据库异常监测、异常指标提
个模块分别使用了基于
LSTM 的时间序列异常诊断模型、Kolmogorov-Smirnov
整个框架分成离线训练和在线诊断这两个阶段
.我们将提出的系统部署在 PostgreSQL
通过实验表明该框架对于异常诊断具有较高的精确程度
,并且不会对系统性能造成太大的影响.
(Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China)
Database is a kind of important and fundamental computer system software. With the
development of database application in
begin to concern the stability of the database. Because of the numerous internal of
external
effect, performance anomaly may emerge when the Database running and it
may cause huge economic loss. People usually diagnose
database anomaly by analyzing monitoring metrics. However, there are hundreds of metrics in the system and
ordinary database users are
information from them. Some major companies employ DBA to manage the
databases but this cost is
database monitor and diagnose with low cost is a challenging problem.
Current methods have many limitations, including high cost of metrics information collection, narrow
range of application or poor stability.
AutoMonitor
which deployed on the PostgreSQL database. The framework
module and modified
K Nearest-Neighbor algorithm-based root cause diagnose module. The
framework consists of an offline training and an online diagnose stage. Our
evaluations on the datasets show that our framework has high
intelligence
服务理相的人及管理过
,IT 运维可以公司供的服务持良的质,
维在人类来的产生活中作用越来越重
. 2020 球将
些设备会载无的服
,互联网、金制造、电信、电力
Foundation item: National Natural Science Foundation of China (61925205, 61632016
)
: 2020
-11-06; jos 线出版时: 2021-01-20
2
络、府等生产活的面面.
在运展的程中
的手操作码化,
基于量脚的自动化维就始流了起
运维,指的是使大数、机器学技术支持 IT
能力.
已经和研使用技术
服务量分
[11]
,故障预测
[1]
,
微服故障定位
数据是各企业常用系统,
根据执行务的不同以将据库分为行大简单务的
型数库、行复分析 OLAP
型数库和顾执行上两种务的
软件,
年来了许人工技术数据的工
具有加强的综合能,
能运维技在数库领域也着广的应场景
本研聚焦智能运维 OLTP 环境
据库性能
题发的根,问题如下几个:
出现,
个监异常不同所导
采用单的则来进行据库常诊精确度不
OLTP
环境的数据库行的大量单的事务
的事变慢,数据性能下降问题;
由于 OLTP
任务求的稳定性以操作
类监指标提取有用息难较大;
下面关于一个难点一个体案
我们执行据库份操的时候我观察了很指标均产
生了,其中括了 CPUI/O断计,
据库等待程等
(a) CPU (b)
Fig.1
Anomaly metrics triggered by database backup
1
数据备份发的监控标异
个指是由成的
CPU
数据备份数据库外文件入这三个因下
发的 CPU 变化的示,
这是为以三个行为需要算机提供高的算资
多的,
很难库性常问
.
Journal of Software 软件学报
在运展的程中
,最先现的靠手的运;人们重复
基于量脚的自动化维就始流了起
;又出 DevOps 智能
[14]
.智能
.学习以处理海的监数据且提供强的推
已经和研使用技术
许多得了进展,括云
微服故障定位
[2]
.
根据执行务的不同以将据库分为行大简单务的
OLTP
型数库和顾执行上两种务的
TATP 型数.作为种传的系
年来了许人工技术数据的工
[12]
,可以人工术赋数据
能运维技在数库领域也着广的应场景
.
据库性能
异常测诊,数据性能下降发现题并诊断
,
个监异常不同所导
,统中个指,
采用单的则来进行据库常诊精确度不
;
环境的数据库行的大量单的事务
,如果监控标数成本较大,会使执行间较
任务求的稳定性以操作
库系的复杂性,监控指标会有多噪,在这
我们执行据库份操的时候我观察了很指标均产
据库等待程等
,如图 1 .
I/O (c) 据库程异
Anomaly metrics triggered by database backup
数据备份发的监控标异
个指是由成的
,们以 CPU 指标,看到
数据备份数据库外文件入这三个因下
CPU 的指均产了异, 2 示了三种异常
这是为以三个行为需要算机提供高的算资
.通过可视我们
很难库性常问
of 15
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜