VERTICA ⎪ 你的数据「冷浪漫」
掀开预测性维护的「盖头」来~让我看看你的脸~
咦,原来高深莫测的 IoT 用例,背后也离不开你机器学习的功劳!
来源 ⎪ Jeff Healey, Jawahar Annaldasula, Tim Donar
编辑 ⎪ Lu,Vertica 中国
1
嗨,
我是 Vertica。
Vertica 是湖仓一体的统一分析平台,随时随地可部署并分析海量数据中隐匿的核心洞察
在云端
在本地
在 Hadoop 上
2
我是核心分析引擎。
Vertica 比传统数据库快至少 50-1,000 倍,基于行业标准的硬件可将数据规模从 TB 级扩展至 PB 级,并符合 SQL-99+ 标准以及满足 24/7 全天候的工作负载需求
充分利用对 BI, ETL, Hadoop/MapReduce 和 OLTP 等技术的投资
内置冗余可加速查询
没有磁盘 I/O 瓶颈,同时加速数据加载及查询
用于大规模的预测分析
基于低成本的 x86 Linux 节点提供本地的 DB 集群
通过 10 种以上的不同算法,最多缩减 90% 的空间
3
我为 IoT 而生。
用于 Kafka 分析的流数据 API
时间序列管理
管理半结构化数据
地理空间分析
丰富的开源集成项目
最重要的是,
库内机器学习之力 !!!
Vertica
预测性维护实例
设备制造和维护环境用例
从冷却塔收集传感器数据
传感器
类型
描述
温度传感器
记录冷却温度
功率传感器
记录消耗功率读数
气流传感器
验证设备气流状态
压力传感器
记录读数压力
振动传感器
记录设备振动大小
使用统计模型预测设备最佳维修时间
提升正常运行比例以确保客户满意度
预测性维护 Demo
下图分别为“某制造客户用例流程图”及“数据模型示意图”。以 Vertica 作为核心分析引擎,处理流数据以反哺机器学习模型及数据模型,并为 BI 分析工具模拟提供见解:
数据模型及逻辑回归算法
# PREDICT_LOGISTIC_REG
流行的机器学习算法
主要用于二进制分类
函数类型为响应 & 概率:
响应 - 预测值为 1 或 0
概率 - 预测值在 0 和 1 之间(可认为即将发生的故障是一个二进制结果)
4
预测性分析的机器学习能力
平衡类别分布
移除异常值
归一化数据,将不同尺度的数据重新梳理为等效尺度
填补数据集的缺失值
利用回归算法进行预测
利用分类算法将数据集项目分配到不同的类别
使用聚类算法,比如用 K-Means 划分数据
Vertica 精品资源库
免费获取精品白皮书
Vertica 大数据学堂
引领世界之分析风潮
猛戳「阅读原文」
VERTICA 免费版等着你