1 .一种系统日志异常检测方法,其特征在于,所述方法包括:
对日志文本进行语义分析,提取出所述日志文本中的近、反义词对;
基于所述近、反义词对的词对信息对所述日志文本进行模板解析,生成日志模板;
基于所述近、反义词对微调句向量生成模型,使用微调后的句向量生成模型生成所述
日志模板对应的句向量;
基于所述句向量初始化预设预测模型,根据初始化之后的预测模型检测所述日志文本
中的异常。
2.如权利要求1所述的系统日志异常检测方法,其特征在于,所述基于所述近、反义词
对的词对信息对所述日志文本进行模板解析的步骤之前,还包括:
使用正则匹配方式对日志文本进行降低模板解析难度的预处理;
所述基于所述近、反义词对的词对信息对所述日志文本进行模板解析的步骤,包括:
对经过所述预处理之后的日志文本进行模板解析;
其中,所述近、反义词对的词对信息为防止具有相反语义的日志被合并成为同一条日
志模板以及具有相似语义的日志被分裂为不同的日志模板。
3 .如权利要求1所述的系统日志异常检测方法,其特征在于,所述基于所述近、反义词
对微调句向量生成模型的步骤,包括:
生成所述近、反义词对对应的标注数据,基于所述标注数据微调句向量生成模型。
4 .如权利要求3所述的系统日志异常检测方法,其特征在于,所述生成所述近、反义词
对对应的标注数据的步骤,包括:
使用所述近、反义词对生成日志语料;
对包含近义词对的日志语句赋予高评分标签,对包含反义词对的日志语句赋予低评分
标签;
通过所述日志语料和所述评分标签生成所述近、反义词对对应的标注数据。
5 .如权利要求1所述的系统日志异常检测方法,其特征在于,所述预设预测模型为GPT‑
2模型,所述基于所述句向量初始化预设预测模型的步骤,包括:
使用所述句向量的拼接矩阵代替所述GPT‑2模型的标记嵌入矩阵,完成对所述GPT‑2模
型的初始化。
6 .如权利要求1所述的系统日志异常检测方法,其特征在于,所述根据初始化之后的预
测模型检测所述日志文本中的异常的步骤之后,还包括:
对初始化之后的预测模型检测到的异常日志进行过滤,确定得到所述异常日志中的真
实异常日志。
7 .如权利要求6所述的系统日志异常检测方法,其特征在于,所述对初始化之后的预测
模型检测到的异常日志进行过滤的步骤,包括:
将异常日志模板以及异常日志规律记录为匹配规则,确定正常日志的统计学特征的特
征上下限;
确定与所述匹配规则一致的日志、以及不符合所述特征上下限的日志为真实异常日
志。
8.一种系统日志异常检测装置,其特征在于,所述系统日志异常检测装置,包括:
语义分析模块,用于对日志文本进行语义分析,提取出所述日志文本中的近、反义词
权 利 要 求 书
1/2 页
2
评论