暂无图片
暂无图片
7
暂无图片
暂无图片
暂无图片

Vertica7年使用总结

原创 wzr404 2021-12-31
3376

    因业务需要,已使用Vertica近7年,它是基于X86的MPP数据库,具有低成本、高效率分析的特点,能够满足低成本存储海量数据,并支持高速数据分析查询的要求。随着业务的发展,Vertica集群逐步壮大,2020MPP数据主仓库节点已扩容至138台,成为行业内最大单集群节点。现有系统功能架构图,如下:

一.项目背景

    在Vertica数据库之前,数据仓库采用多台小型机RAC和SAN存储的架构,数据仓库随着多年业务发展也不断进行扩容升级,但该架构下横向扩容也存在扩展能力不足以满足业务需求的问题,共享RAC方式也带来了节点间通信流量的指数增长和面临着无法继续扩容的问题,同时数据上报及时性、报表分析计算性能无法满足业务要求,急需一种性能更好、成本更低、扩展性更好,以及可维护性更好的方案。传统数据库下构如下:


二.Vertica数据库的优势

    1.列式存储和计算:通过列式计算和强大的主动数据压缩,大幅降低成本高昂的磁盘 I/O(主要是传统的以行为存储单位的 SQL 数据库使用),执行查询的速度可提升 50 到1000 倍,存储成本最高削减 90%。


    2.无共享大规模并行处理:基于无共享的 MPP 架构,支持在线添加数量不限的 X86 工业标准服务器,可根据需求任意扩展解决方案。


    3.分钟级故障节点修复、弹性扩展和高并发弹性负载:可选的 MPP 结合存储和计算分离部署架构,支持分钟级在线扩展或收缩集群规模,通过“子集群”隔离负载提供高并发、高吞吐的弹性负载和多租户支持能力。


    4.实时分析:支持主流的CDC工具,原生支持kafka消息系统的连接,支持数据实时装载和分析。


    5.完整的关系数据库功能和 SQL 标准支持:Vertica 支持关系数据库事务处理和 ACID 规范,支持 SQL-92/SQL-99标准,提供 ODBC、JDBC、ADO.NET 接口规范驱动。

    6.基础设施透明的开放统一分析平台:原生支持与Hadoop、Spark和Kafka等开放生态无缝集成,支持X86开放架构企业内部、主流公有云和 VMware 虚拟化平台和主流Hadoop发行版本部署,采用统一的SQL引擎分析高性能、就地分析Vertica和其他开放格式数据。


三.Vertica数据库技术支持

    Vertica数据库拥有一支技术水平过硬、服务态度优良的支撑团队。Vertica主库扩容工程中,技术团队积极参与方案制定,技术专家入驻现场,24小时现场支撑扩容工作。在数据迁移、扩容过程中Vertica技术团队给予了我们非常有力的支撑和保障,集中展现出高度的敬业和专业精神,系统响应效率也得到提升,针对一些突发状况,曾连续多日奋战到凌晨,让我们十分感动并给予高度的认可和好评。

四. Vertica数据库的使用效果

    通过持续建设和分布式数据库改造,解决了原来基于传统数据库、小型机和SAN存储传统架构无法支撑PB数量级数据仓库的性能和扩展能力不足的问题。目前已承载三大市场各个专业经营决策数据服务支撑。采用Vertica数据库大幅提升系统性能、数据分析能力的同时实现降本增效。以用户表为例,传统数据库汇总分析用时1835秒;Vertica汇总分析用时299秒。汇总分析用时降低降低1536秒,数据分析能力得到很大提升。Vertica数据库整体较传统数据库提前2个小时,集团考核上报、关键业务指标的及时性得到有效保障。

五.相关使用经验和建议

    1.传统数据库向Vertica迁移:面临的主要瓶颈集中在外部系统数据如何快速加载到Vertica库、Vertica库如何实现对其他集群的数据快速下发两个方面。在Vertica数据库之间进行数据同步可采用数据库自带的export to vertica或copy from vertica 功能直接进行数据同步,数据无需落地;Vertica与其它数据库之间进行数据同步,可采用并行导出parquet格式文件或文本文件HDFS,再通过HDFS进行数据分发。可大幅节省数据同步时间。

    2.Vertica数据库恢复:数据库恢复时需要对每个节点的元数据进行比较,这个过程是比较耗时的,降低数据库catalog日志大小和表模型分区,合理使用分区表和临时表,可减少数据库节点故障时的数据恢复时间。

    3.Vertica新一代架构(Eon)探索:从目前的使用经验来看,Eon架构可实现节点快速扩容、故障节点快速恢复,在增加子集群的情况下,可增加并发能力,同时子集群之间的计算资源完全隔离,数据集中存储在公共存储中,可快速实现数据共享,无需进行数据同步。

    4.Vertica缺乏成熟的外围适配开发工具:当前选型razorsql作为Vertica的开发工具,且已经纳入4A安全管控,但在金库模式触发、程序运行调试等方面与PLSQL仍然存在差距,需进一步提升开发工具的便捷性。

最后修改时间:2022-01-12 13:00:48
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论