1 .一种分布式大数据有序智能分管方法,其特征在于,包括如下步骤:
采集大数据并发送至分布式文件系统HDFS;
分布式文件系统HDFS对所述大数据进行批处理,并将批处理的所述大数据进行分布式
储存;
大数据AI分管平台接收用户输入的大数据分管指令,并进行响应,通过大数据AI分管
平台上预设的AI分管模型,基于AI分管策略对所述分布式文件系统HDFS中呈分布式储存的
所述大数据进行有序分管和调取;
将调取的所述大数据缓存在分布式数据存储数据库中指定的Nosql模型中,等待用户
从所述Nosql模型中查看所调取的所述大数据。
2 .根据权利要求1所述的一种分布式大数据有序智能分管方法,其特征在于,分布式文
件系统HDFS对所述大数据进行批处理,并将批处理的所述大数据进行分布式储存,包括:
批量对所述大数据进行预处理和清洗;
对批量处理后的所述大数据,按照数据属性进行数据分类,得到由若干数据m组成的数
据集M:
M={文本数据m1,图像数据m2,时间序列数据m3};
将所述数据集M中的若干数据m分布式储存于所述分布式文件系统HDFS的各个存储节
点;
将各个所述数据m的数据属性,绑定在对应的所述存储节点的节点身份ID之下,用于分
布式存储管理。
3 .根据权利要求2所述的一种分布式大数据有序智能分管方法,其特征在于,在大数据
AI分管平台接收用户输入的大数据分管指令之前,还包括:
将所述分布式文件系统HDFS的各个存储节点的节点身份ID,发送至所述大数据AI分管
平台;
所述大数据AI分管平台接收各个存储节点的节点身份ID,并对各个存储节点的节点身
份ID进行身份ID登记。
4 .根据权利要求3所述的一种分布式大数据有序智能分管方法,其特征在于,所述AI分
管模型的生成方法,包括:
获取对应各个所述数据m的历史数据,并根据所述历史数据选择对应的AI模型;
使用所述历史数据对所述AI模型进行模型训练,生成识别和分管所述历史数据的所述
AI分管模型,包括:
用于识别并分管所述文本数据m1的第一AI分管模型,以及
用于识别并分管所述图像数据m2的第二AI分管模型,以及
用于识别并分管所述时间序列数据m3的第三AI分管模型;
将所述AI分管模型部署于所述大数据AI分管平台,并进行模型工作参数配置。
5 .根据权利要求4所述的一种分布式大数据有序智能分管方法,其特征在于,所述AI分
管策略的配置方法,包括:
设置优先级排序规则,所述AI分管模型按照所述优先级排序规则,对所述数据m中的各
项数据进行优先级排序,按照优先级排序进行有序分管;
设置节点属性匹配规则,所述AI分管模型按照所述节点属性匹配规则,将所述数据m中
权 利 要 求 书
1/2 页
2
评论