1 .一种基于强化学习的数据筛选方法,用于对目标数据进行数据筛选,并判断其筛选
得到的目标数据是否为有效数据,其特征在于,包括:
获取所述目标数据,并确定所述目标数据的数据属性,其中,所述数据属性为所述目标
数据内的谓词;
依据所述数据属性确定待选谓词集合和被选择谓词集合,其中,所述待选谓词集合内
包括若干个待选谓词,所述被选择谓词集合为空集;
依据所述待选谓词和所述被选择谓词集合构建谓词分类模型,并通过所述谓词分类模
型确定所述待选谓词中的有效谓词;
将所述有效谓词添加至所述被选择谓词集合内,当所述被选择谓词集合内的所有所述
有效谓词和所述被选择谓词集合均与所述所述谓词分类模型相关时,则确定带有所述有效
谓词的所述目标数据为所述有效数据。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标数据,并确定所述目标
数据的数据属性,其中,所述数据属性为所述目标数据内的谓词的步骤,包括:
获取所述目标数据;
依据所述目标数据确定对应的数据库;
依据所述数据库和所述目标数据生成数据关系表;
在所述数据关系表内确定所述目标数据对应的所述数据属性。
3.根据权利要求1所述的方法,其特征在于,所述依据所述待选谓词和所述被选择谓词
集合构建谓词分类模型,并通过所述谓词分类模型确定所述待选谓词中的有效谓词的步
骤,包括:
依据所述待选谓词和所述被选择谓词集合通过前馈神经网络构建谓词分类模型;
依据所述谓词分类模型、所述待选谓词和所述被选择谓词集合确定所述有效谓词。
4 .根据权利要求3所述的方法,其特征在于,所述依据所述待选谓词和所述被选择谓词
集合通过前馈神经网络构建谓词分类模型的步骤,包括:
依据所述待选谓词和所述被选择谓词集合进行深度强化学习处理构建强化学习策略;
依据所述强化学习策略、所述待选谓词和所述被选择谓词集合生成训练数据;
依据所述训练数据和所述强化学习策略构建所述谓词分类模型。
5.根据权利要求4所述的方法,其特征在于,所述依据所述待选谓词和所述被选择谓词
集合进行深度强化学习处理构建强化学习策略的步骤,包括:
构建当前网络和目标网络,并标记所述待选谓词为执行动作以及标记所述被选择谓词
集合为当前状态;
依据所述当前网络、所述当前状态和所述执行动作生成奖励值;
依据所述奖励值构建所述强化学习策略,其中,所述强化学习策略包括当所述奖励值
为正时,则认定所述待选谓词和所述被选择谓词集合之间相关;或,当所述奖励值为负时,
则认定所述待选谓词和所述被选择谓词集合之间不相关。
6.根据权利要求3所述的方法,其特征在于,所述依据所述谓词分类模型、所述待选谓
词和所述被选择谓词集合确定所述有效谓词的步骤,包括:
依据所述谓词分类模型和所述待选谓词确定所述待选谓词的估计值;
当所述待选谓词的所述估计值大于或等于预设阈值时,确定所述待选谓词为所述有效
权 利 要 求 书
1/2 页
2
评论