暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

0107.C CMS(RM SM) JAVA Heap Size参数优化

rundba 2021-12-04
1722


1. 问题现象

1) Reports Manager告警

查看Reports Manager历史告警,unknow health时有发生。


2) Service Monitor告警

Service Monitor 运行状况 存在隐患
1 变成存在隐患
The health test result for MGMT_SERVICE_MONITOR_HEALTH has become concerning: The health of the Service Monitor is concerning. The following health tests are concerning: heap size.


3) 查看报错频率

在CMS界面 -> 扩展"运行状况" -> 选择时间长度(如1天),点击图例中的"concerning health",查看告警发生频率,一天发生数次,则告警频率较高,则建议优化。



2. 问题处理

下面根据CM主机整体资源,粗略调整RM和SM值。

Cloudera Management Service -> 配置 -> 搜索"heapsize",调整经常告警的两项:

1) Reports Manager 的 Java 堆栈大小(字节)[headlamp_heapsize]

由2G调整为4G;


2) Service Monitor 的 Java 堆栈大小(字节)[firehose_heapsize]

由2G调整为4G,有报错,后续继续调整为8G。


调整完,重启服务,重启服务对现有运行业务不影响,重启后,impala、zookeeper等服务可能存在短暂告警,正常现象。

观察运行一段时间后,RM、SM服务再无告警。



3. 精确计算Java 堆栈大小值

可以通过查看RM、SM当前内存使用情况,根据告警阈值90%,精细调整RM和SM的值。


查看Service Monitor的Java内存使用:

CM -> Cloudera Management Service -> Service Monitor[状态摘要栏下] -> 图表库 -> 状态页面图表[或进程资源] -- JVM 堆内存使用情况


可看到当前使用内存和最大使用内存,根据告警90%告警阈值,可通过最内使用内存和告警阈值精细估算SM java堆栈大小的设置值。


也可以在"图标生成器"中使用tsquery语句查看SM当前内存使用情况:

select jvm_max_memory_mb, jvm_heap_used_mb where entityName="mgmt-SERVICEMONITOR-3ab5e398455d6db440ba5b540c7ce1a4"


同样的RM JAVA内存使用也可以参考上述方式进行计算设置,也可以使用tsquery语句RM当前内存使用情况:

select jvm_max_memory_mb, jvm_heap_used_mb where entityName="mgmt-REPORTSMANAGER-3ab5e398455d6db440ba5b540c7ce1a4"


Java 堆栈大小可由小调大,也可由大调小,调整时但不要低于现有使用内存大小,图标监控时间间隔10分钟。



4. 小结

在一定规模集群,CMS各组件默认的java heap size参数设置较低,可根据当前资源使用需要适当调大参数,避免频繁告警。


-- 完 --


::rundba

wx: landnow




                                  长按二维码                                   


  欢迎加入>>国产DB学习交流群


       

   请注明:来自rundba,加入国产DB学习交流群                

             

往期推荐

0106.C CDP716更改集群名称

0105.C CDP升级后Hive Metastore Server宕机(OOM)处理记录

0104.C CDH & HDP 即将EoS

0103.C CDP中Hive委托令牌存储优化_HMS高可用设置

0091.C CentOS7上安装CDP7.1.4(1/2)

0092.C CentOS7上安装CDP7.1.4(2/2)

0088.C CDP平台配置邮件告警

0087.C hue中hive创建含中文注释的表报错'ascii' codec can't decode byte 0xe5

0086.C CDP中hive describe表结构中文注释乱码解决

0083.C cloudera中hive创建hbase表报错connection is closed处理过程

0082.C cloudera中impala删除kudu外表_kudu上信息同步更新

0081.C kerberos环境下hbase权限控制

0078.C CDP平台hive表和impala表关系及如何确认impala所创建表为普通表还是kudu外表

0077.C kerberos环境下如何允许用户创建数据库

0066.C impala创建kudu表报错User does not have privileges to access

0063.C kerberos环境下hbase登录hbase shell简单操作

0059.C kerberos环境下hive创建外部表V1.0

0056.C hue连接hbase报错 Api错误(Max retries exceeded with url)解决方法

0054.C 使用offset explorer 2.1连接kerberos加密kafka

0053.C cloudera quickstart启用kerberos

0051.C Cloudera QuickStart安装配置

0046.C cloudera被CD&R和 KKR 两家公司收购

0044.C DbVisualizer通过kerberos连接CDP hive组件

0043.C CDP(CDH)安装报错-主机运行状况不良

0042.C dbeaver sqldeveloper通过kerberos连接CDP hive、impala组件(5/5)

0041.C dbeaver sqldeveloper通过kerberos连接CDP hive、impala组件(4/5)

0040.C dbeaver sqldeveloper通过kerberos连接CDP hive、impala组件(3/5)

0039.C cloudera订阅及许可说明

0038.C dbeaver sqldeveloper通过kerberos连接CDP hive、impala组件(2/5)

0037.C dbeaver sqldeveloper通过kerberos连接CDP hive、impala组件(1/5)

0010.C CDP7.1.6发布(2021-03)

8.C  CDH中zookeeper简介


文章转载自rundba,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论