暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【8月开源社区答疑集锦】 Zabbix实操技术问题30例

Zabbix开源社区 2024-08-29
175


一个人走得快,一群人走得远” 这是Zabbix中国开源社区的口号。自2016年成立中国开源社区,每位Zabbixer犹如星星之火在中国点燃,Zabbix开始在中国绽放魅力。社区是开源项目赖以生存的基础,加入中国Zabbix社区完全免费。Zabbix开源社区倡导开源、共享、成长的主题,通过各类学习资料(如中文操作手册、工具书籍、在线课程等)、社群问答、技术文章、福利、技术交流活动等方式,陪伴Zabbixer共同成长。


【社区答疑】是给Zabbixer的社区福利之一,在日常社区内的技术交流和互助的基础上,每周四下午会抽出1小时的时间,安排1位Zabbix技术专家集中答疑,解决群友的技术问题,帮助大家更好地使用Zabbix,应对职场。本篇是8月开源社区的答疑集锦,希望对你有帮助~


Q1:有个采集频率设置了1小时,但实际采集频率是12小时,有没有排查思路?

A1:预处理使用了节流心跳规则导致的,可以删除预处理规则就会恢复。



Q2:Zabbix 怎么监控k8s?

A2:https://www.zabbix.com/integrations/kubernetes



Q3:银河麒麟4 k10,想部署zabbix7,按照哪个文档最贴近?

A3:可以参考官方文档编译安装部分内容。



Q4:Zabbix的queue队列堆积,把监控项的获取时间调大就好了一些。还有别的方法么?

A4:一般5分钟以下的队列属于数据延迟,10分钟以上有可能就是获取不到数据。需要查看细节,具体分析一下没采集到数据的原因。


Q5:企业微信告警信息,我在用户组区分了用户,但是告警信息是所有人都能收到,没办法按照group来区分,这个要怎么解决?

A5:Zabbix可以根据主机群组和用户群组发送告警信息,如果未达到预想效果,需要查看是否配置正确。



Q6:Zabbix服务器中存放mysql的盘空间有点吃紧,想要删掉history和trends表一些分区,用的命令是alter table 表名 drop partition 分区名;但是发生个问题: 分区删除后,系统空间并没有下降,所以用optimize table 表名;来降低索引碎片,但是还是没解决,空间还是没有下降,请问有什么好办法吗?

A6:这个问题最好找专业的DBA看一下。是不是使用的共享表空间。如果是共享表空间就算你删了数据。空间依然不会释放。



Q7:通过api拉取problem.get获取问题项时把已经停用的触发器的项也给拉取出来了,我只想显示咱zabbix仪表板中展示出来的问题项,这个是我获取的方法不对么?

A7:调用api拉取问题时可以加上部分参数过滤指定数据,具体参数请查看官方文档。 



Q8:Zabbix 能看单核CPU 的最大利用率么?

A8:默认模板是获取所有核CPU的使用率,单核CPU可以在键值中指定CPU的序号,例如:system.cpu.util[0,user,avg5]



Q9:请问Zabbix支持麒麟和龙蜥操作系统吗?

A9:支持,Zabbix与多个主流国产操作系统都兼容。



Q10:请问Zabbix7用timescaledb是不是必须要community edition,好像centos stream 9上按timescaledb官网步骤安装后是apache edition。

A10:鉴于pgsql的不同版本可能会对应不同的timescale的版本。详细内容请参考pgsql的官方文档。



Q11:网络经常需要SNMP监控设备,有没有写监控的文档?

A11:https://www.zabbix.com/documentation/5.0/en/manual/config/items/itemtypes/snmp



Q12:Zabbix housekeeper processes more than 75% busy 一天几次报错,网上调整这个HousekeepingFrequency和MaxHousekeeperDelete参数多少合适?

A12:如果使用mysql建议数据库做表分区,然后停止使用housekeeper清理历史数据趋势数据



Q13:proxy设置了snmptrap,测试本地可以有返回值,但网络设备不行,能确定是设备oid问题吗?

A13:从监控逻辑上来讲 snmptrap 属于主动模式,也就是网络设备捕获到错误时,将故障消息发送给Zabbix server/proxy。



Q14:自带模板template会随着版本更新而更新,有什么办法可用拿到一个最新版本全部模板一次性导致,当前是每个版本单独文件,单独导入,有可以一次性导入最新版本所有自带模板不?

A14:推荐单个模板单个文件,这样比较好管理。选择多个模板导出,导入时就会创建/更新多个模板,但可能因修改的数据量太多导致失败。



Q15:CVE-2024-22116 这个漏洞Zabbix agent也需要升级吗?

A15:不需要,这个漏洞主要针对的是Zabbix server



Q16:zabbix7监控tidb是不是创建主机用自带的TiDB by HTTP模板,然后设置URL和port的参数,就可以监控了?需不需要tidb的账号密码?

A16:https://git.zabbix.com/projects/ZBX/repos/zabbix/browse/templates/db/tidb_http/tidb_tidb_http/README.md?at=refs%2Fheads%2Frelease%2F6.0 请详细阅读一下tidb监控的使用文档



Q17:Zabbix监控k8s 出现这个怎么解决?

A17:这个问题主要是返回的数据,跟预处理的JSON解析不匹配导致的。这个需要结合返回的数据进行分析。



Q18: 这里的参数怎样调大小?

A18:在主机宏里



Q19:Windows server2008r2怎么安装?agent2客户端?

A19:先从高版本的测,依次向低版本测试。agent 和 agent2 从采集功能上是一样的。


Q20:Zabbix 6.4 的默认图形样式如何更改?

A20:那个是固定的,除非你自己改php源码。



Q21:为啥我的7.0LTS的server监控5.0版本的agent会有非常多监控项禁用?

A21:建议升级 agent。低版本可能导致有些监控键不支持



Q22:对交换机类设备的syslog日志接收和告警 ,Zabbix有什么好的对接方案?最好能像snmptrap一样,落在某个host上,Zabbix在snmptrap日志检索功能上感觉不是很强大,有没有扩展方案?

A22:其实原理一样的。syslog也是写到某台服务器上的文件当中,无非zabbix监控的是文件。只能说zabbix是监控平台,不是日志处理平台。Zabbix有监控日志的功能。但是不建议当elk来用。



Q23:最近在使用Zabbix7.0.2时遇到Poller并发数的问题

A23:首先调大Poller的数量后,查看状态,大部分Poller是处于空闲状态,进程大部分都会集中在一两个poller上;其次在Web上查看该poller对应的监控,发现“最近检查记录”里的时间比预设的刷新间隔多出3秒左右,但是在“值”里显示的间隔是准确的。



Q24:请问关于Poller的并发数能自行调整吗?

A24:这个具体用哪个进程都是随机的。一般配置poller,都是根据自监控的数据来判断。如果本身负载不高,就没必要配太多的poller合理针对性的配置。



Q25:我遇到了zabbix6的问题,它会每天晚上12点40到1点左右就会产生大量的 服务器不可达告警,server也会报 zabbix history syncer processes more than 75 busy,数据库也没有定时任务。

A25:这是数据库的同步进程负载比较忙,需要查一下数据库的性能。


Q26:我是要完全定制一套CSS如何做啊?不是选择已经做好的CSS

A26:这种您可以考虑使用grafana,或者自己写个前端。如果你会php也可以自己修改。而且,Zabbix前端也提供了编写模块的方法。



Q27:请问这个SQL是做什么的?

A27:看语句是查询事件,问题的语句。


Q28:问题产生后,配置的触发器动作,怎么发送触发动作,如果一个问题已经发送告警邮件,是否可以设置一定时间期限没解决,再次发告警邮件?

A28:可以,设置多个操作,通过一些判断进行告警升级。



Q29:Zabbix的7.0 高可用时,可以让主备的端口都起来吗

A29:zabbix server高可用,是一个集群。集群中只有一台是Server是Active(活动)状态。其他节点都是Standby(备用)状态。



Q30:有没有办法实现主机组资源统计显示,类似报表类?

A30:可以通过调用zabbix api 或 直接查数据库进行统计计算出报表。



—END—

最后修改时间:2024-08-30 10:02:20
文章转载自Zabbix开源社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论