1 .一种基于两阶段筛选和分类的关系抽取方法,其特征是包括以下步骤:
S1:生成实体对的上下文词法特征向量;
S2:训练基于逻辑回归的关系存在性判定模型,具体包括:
S21:对上下文词法特征向量进行降维,
S22:生成实体对关系存在标识,
S23:初始化逻辑回归模型的参数,
S24:将所有实体对上下文词法特征向量的降维结果送入逻辑回归模型的输入端,
S25:将所有实体对关系存在标识送入逻辑回归模型的输出端,
S26:根据收敛条件训练逻辑回归模型,
S27:返回逻辑回归模型的参数;
S3:使用模型筛选可能存在关系的实体对和句子;
S4:生成“实体对‑句子”特征向量序列集合;
S5:生成关系类型向量;
S6:训练基于卷积神经网络的关系分类模型;
S7:使用关系分类模型预测实体对的关系类型。
2.根据权利要求1所述的一种基于两阶段筛选和分类的关系抽取方法,其特征是所述
步骤S1中,具体包括:
S11:生成词汇的静态词嵌入;
S12:生成词汇的静态词性嵌入;
S13:合成上下文词法特征向量;
S14:返回上下文词法特征向量。
3.根据权利要求2所述的一种基于两阶段筛选和分类的关系抽取方法,其特征是所述
步骤S11中,以下描述:用(E
A
,E
B
)表示句子S中的任意两个实体E
A
和E
B
构成的实体对,W
A_Pre
和
W
A_Aft
是E
A
两侧的词汇,W
B_Pre
和W
B_Aft
是E
B
两侧的词汇,W
AB_Hyper
是E
A
和E
B
的上位词,词汇W
A_Pre
、
E
A
、W
A_Aft
、W
B_Pre
、E
B
、W
B_Aft
的词性是S
A_Pre
、S
A
、S
A_Aft
、S
B_Pre
、S
B
和S
B_Aft
,构成实体对(E
A
,E
B
)的上
下文;
S11具体包括:
S111:读取用于静态词嵌入的预训练模型Model
Sta_Emd_W
;
S112:使用Model
Sta_Emd_W
计算词汇W
A_Pre
、E
A
、W
A_Aft
、W
B_Pre
、E
B
、W
B_Aft
的静态词嵌入
E
Sta_WA_Pre
、E
Sta_WA
、E
Sta_WA_Aft
、E
Sta_WB_Pre
、E
Sta_WB
、E
Sta_WB_Aft
;
S113:拼接词嵌入结果,得到词汇的静态词嵌入E
Sta_AB_Cont_W
=[E
Sta_WA_Pre
,E
Sta_WA
,
E
Sta_WA_Aft
,E
Sta_WB_Pre
,E
Sta_WB
,E
Sta_WB_Aft
];
S114:返回词汇的静态词嵌入;
所述步骤S12中,具体包括:
S121:训练用于词性嵌入的预训练模型Model
Sta_Emd_S
;
S122:加载用于词性嵌入的预训练模型Model
Sta_Emd_S
;
S123:使用Model
Sta_Emd_S
计算词性S
A_Pre
、S
A
、S
A_Aft
、S
B_Pre
、S
B
、S
B_Aft
的静态词性嵌入
E
Sta_SA_Pre
、E
Sta_SA
、E
Sta_SA_Aft
、E
Sta_SB_Pre
、E
Sta_SB
、E
Sta_SB_Aft
;
S124:拼接词性嵌入结果,得到词汇的静态词性嵌入E
Sta_AB_Cont_S
=[E
Sta_SA_Pre
,E
Sta_SA
,
权 利 要 求 书
1/3 页
2
评论