暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

ClkLog基于阿里云ClickHouse企业版的日活测试结果分享

ClickHouseInc 2024-11-26
324



本文字数:3715估计阅读时间:10 分钟


Meetup活动


ClickHouse Beijing User Group第2届 Meetup火热报名中,详见文末海报!

客户介绍

ClkLog是上海至存网络科技有限公司开发的一款记录用户行为、提供用户分析和画像的成熟商业化软件产品,同时支持提供源码定制开发。通过ClkLog可以轻松获取用户的画像与行为特点,全面了解不同类别用户在网页、APP、小程序等多渠道的特征表现,支持对用户浏览任意页面级的分析及自定义用户行为数据的分析,实现精细化的用户行为分析。



早期业务架构痛点

ClkLog基于神策SDK,使用ClickHouse数据库存储采集日志数据,内置十几种业内主流模型对数据进行分析展示,大幅度提高用户分析系统的开发与部署效率.ClkLog在云上有着广泛的客户,其底层的ClickHouse开源版本虽然相对稳定高效,但是依然有如下几个痛点:

  1. ClickHouse版本迭代快,客户希望尝试新的功能就要不断升级版本,可能带来数据迁移风险、兼容性问题、维护成本增加等挑战。

  2. 为了对日志数据进行深入分析并进行有效决策,希望在底层数据支撑平台留存更多的历史数据,但会增加存储成本。

  3. 应对业务的波峰波谷,需要扩大计算资源以及后续手工释放,操作流程复杂,无法灵活应对突发情况,增加资源成本和运维成本。


升级阿里云ClickHouse企业版

2023年ClickHouse.Inc与阿里云达成商业合作,联合研发阿里云数据库 ClickHouse企业版,其功能和架构与全球ClickHouse云服务同步,并于2024年4月正式商业化。ClickHouse企业版对比社区版是里程碑的升级,从传统的存算一体架构全面升级为云原生架构,支持云原生按需弹性 Serverless能力,解决了长期困扰用户的集群扩展效率和平滑性问题。同时升级支持 lightweight update&delete, 数据更新实时可见,且执行成本更低,效率更高。

上述业务挑战,都可以通过升级阿里云ClickHouse企业版得到解决:

  1. 阿里云ClickHouse企业版为托管产品,客户可以直接使用,不需要安装维护;产品在后台定期滚动式升级,兼容性由厂家保证,做到升级无感知。

  2. 使用OSS作为存储,1GB月价低至0.12元,客户无需对于不断增长的历史数据付出高额的存储成本,有效降低整体业务成本。

  3. 应用了全新的sharemergetree架构,实现了基于读写分离高效弹性架构,根据客户的CPU和内存使用率秒级扩缩容,同时按照实际使用计费,在各种情况下都能保证系统正常负载的同时,又极大降低了云上资源使用成本和运维成本。

  4. 为了保证数据安全,在需要使用双副本的场景下,ClickHouse开源版成本加倍。而企业版架构无需副本,承诺5个9的可用性,既节省成本又安全可靠。


性能测试

升级阿里云ClickHouse企业版,ClkLog还是存在如下顾虑:第一,使用OSS作为存储,写入效率和查询效率是否可以匹配本地盘?第二,是否可以和ClkLog产品完全兼容?第三,究竟可以省多少成本?

为了给ClkLog的用户提供最好的解决方案,ClkLog对阿里云ClickHouse企业版做了详细的测试。本次测试主要是测试在不同量级(一万、十万、百万)的日活(每天使用某个产品或网站的用户数量)下,ClkLog使用阿里云ClickHouse企业版作为埋点系统数据库的各项处理能力,尤其是针对百万级的日活性能测试。

大家可以参考测试结果,根据自己应用的实际日活情况、成本、性能要求等条件来选择合适的服务器硬件配置和部署策略。


测试内容

ClkLog用户行为分析系统主要使用了23个统计脚本对原始采集数据进行多维计算,以此获得各维度上的统计报表,所以本次测试是测试日活(1万/10万/100万)的日志数据存储、数据库表存储的容量、统计数据更新时间延迟(依次计算23个统计脚本的总耗时) 和前端接口的性能。


测试方法

硬件以4Core CPU、8G内存为起点,日活以1万起点,分别测试1万/10万/100万,在阿里云服务器上对ClkLog日活数据的Clickhouse社区自建版和Clickhouse企业版在单机和集群模式下进行螺旋上升式测试。


数据准备

本次测试按照每人每天100条日志来估算日志量,并以1天的日志模板复制出1月、1年的数据。

我们准备各种日活情况下1天的日志数据据,导入clickhouse中log_analysis(原始日志表),log_event(事件表),log_user(用户表)。其中原始日志包含100个不同页面,1000个不同设备型号。


测试场景

在各种日活情况下,测试以下内容:

  • 日志文件容量、数据库表容量。

  • 后端统计数据更新时间延迟,涉及浏览量、访客、设备、页面、地域、用户画像等中间统计结果的23个统计脚本的执行总耗时。

  • 前端接口在一天、一周、一个月、一年等时间跨度的耗时。


测试结果

1)Clickhouse社区版单机 

2)Clickhouse社区版集群(2个节点)

3)Clickhouse企业版集群(2个节点), 100万日活(人均100条日志)


汇总分析

1)1万/10万/100万日活数据,按每日人均100条日志采集,采集日志文件在1天、1个月、1年下的占用的空间存储总量如下图所示:

2)1万/10万/100万日活数据,按每日人均100条采集日志日库,数据库文件在1天、1个月、1年下的相关表的记录总数核各个表的占用的空间总量如下图所示:

3)23个统计脚本总耗时(单位:毫秒)

*说明:我们只在ClickHouse企业版集群下做了100万日活的测试。

4)集群版统计脚本总耗时对比


业务价值

根据上述测试结果可得出以下结论:

  1. Clickhouse社区版,相同服务器配置,2个节点集群模式比单机模式下,统计脚本总耗时减少80%以上。

  2. Clickhouse企业版集群在最低可选配置4核16GB无弹性扩容的2个节点上,100万的测试结果已近似社区版2节点每节点16核32GB内存的结果。

  3. Clickhouse企业版集群单节点起步4核可弹升至8核的2个节点上,100万的测试结果对比社区版2节点每节点16核32GB内存,效率可提升30%。

  4. 企业版集群测试,随着最大可弹升CCU配置的提升,查询效率可继续提升。

  5. 成本测算:本次测试Clickhouse社区版使用ecs.u1-c1m2.4xlarge机型,存储选择ESSD 20GB PL0,双节点加存储(3T)包月成本为:1348 * 2(计算) +1588(存储) = 4280元。而企业版选择8-16CCU,预付资源包成本为:16*184.6*0.7+3*1024*0.12=2400 元,轻松节省40%+成本!

    (*说明:184.6为企业本每CCU预付单价每月,实际CPU使用在min(8)和max(16)之间波动,0.7为一般客户弹性系数;0.12为对象存储企业版每GB预付单价每月)


总结与展望

为了进一步优化用户的使用体验,ClkLog升级阿里云ClickHouse企业版服务,测试发现通过企业版的存算分离以及serverless特性,可以极大程度地提升ClkLog的性能,同时通过使用OSS存储和根据业务忙闲时的资源自动增减,为ClkLog的客户轻松节省40%+的云上开销。

欢迎大家试用ClkLog产品,可以浏览www.clklog.com获取更多产品信息并联系我们。

优惠来袭阿

ClickHouse 企业版架构全新升级,指定规格资源包(计算包+存储包)首购超优惠折扣!!首次购买9500CCU*H的计算包,以及首次购买1个月450G及以下规格的存储包,均可享 0.4折的超优惠价格!计算和存储资源组合购买不超过 99.58 元,诚邀您参与100元指定规格测一个月的活动,体验在ClickHouse企业版超低存储成本优势下的查询性能表现!

欢迎点击链接:ClickHouse企业版主页或扫码下方二维码,登录阿里云ClickHouse企业版主页进行选购吧!



Meetup 活动报名通知

好消息:ClickHouse Beijing User Group第2届 Meetup 已经开放报名了,将于2024年11月30日在北京朝阳区科荟路33号4幢1层 清泉(奥林匹克森林公园店)举行,扫码免费报名


注册ClickHouse中国社区大使,领取认证考试券

ClickHouse社区大使计划正式启动,首批过审贡献者享原厂认证考试券!


试用阿里云 ClickHouse企业版


轻松节省30%云资源成本?阿里云数据库ClickHouse架构全新升级,推出和原厂独家合作的ClickHouse企业版,在存储和计算成本上带来双重优势,现诚邀您参与100元指定规格测一个月的活动,了解详情:https://t.aliyun.com/Kz5Z0q9G


征稿启示

面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出&图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:Tracy.Wang@clickhouse.com

文章转载自ClickHouseInc,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论