
在使用 Apache Doris 时,磁盘相关的问题时有发生。今天,我们就来系统地梳理一下常见的 Doris 磁盘问题,以及对应的解决方案,帮助大家快速定位并处理问题!

1
磁盘异常状态
1.1 磁盘总容量为 0
问题原因: 磁盘总容量为 0,available capacity = 1B。这通常意味着磁盘已经挂了。你可能会看到 replica 被标记为 bad,或者磁盘直接被标记为 offline。
解决方案:
1.2 磁盘空间满了
问题现象: Doris BE 的磁盘空间告急,可能是 Trash 或 catalog recycle bin 没有被及时清理。
解决方案:
参考 "磁盘均衡问题排查手册",进行清理。 配置 be.conf
中的trash_file_expire_time_sec = 0
,让 Trash 彻底失效。
注意: Trash 是废弃数据,无法恢复,FE 和 BE 都已经删除了它的元数据。因此,彻底关闭 Trash 也不会对系统造成影响。
1.3 Truncate Table 后磁盘数据未清理
问题描述: Truncate Table 之后,发现磁盘上的数据文件仍然存在。
相关案例: Spark Load 导入后,执行 Truncate Table 但数据未清理的问题。
解决方案:
1.4 删除 Tablet 后,磁盘空间未释放
问题现象: 可能在 Doris 2.0.3 和 2.1.7 版本中遇到该问题。
解决方案:
1. Doris 2.0.3 版本 bug(已在 2.0.5 修复)

2
磁盘 I/O 错误
2.1 IO_ERROR 及副本标记为 bad
问题现象: 查询报错:failed to initialize storage reader,通常是磁盘 I/O 失败导致的。
解决方案:
be.conf中配置
max_tablet_io_errors > 0进行开启。参考修复 PR:https://github.com/apache/doris/pull/42208
SET REPLICA DROP清理异常副本。

3
存储介质问题
3.1 Dynamic Partition 的存储介质问题
问题现象:用户设置 dynamic_partition.storage_medium = SSD
,导致 hot_partition_num
失效。
解决方案:

3.2 Doris 默认存储介质逻辑异常
问题现象:Doris 默认存储介质为 HDD,但如果系统中只有 SSD,可能导致建表时报错。报错信息:
RROR 1105 (HY000): errCode = 2, detailMessage = errCode = 2, detailMessage = errCode = 2, detailMessage = Failed to find enough backend, please check the replication num,replication tag and storage medium and avail capacity of backends or maybe all be on same host.Create failed replications:replication tag: {"location" : "default"}, replication num: 3, storage medium: HDD,
解决方案:
3.3 冷热存储数据未下沉
问题现象: 用户配置了冷热介质 ssd -> hdd,冷却时间到之后数据一直保留在ssd,原因是用户一直有导入,而导入会把磁盘挪动任务失败的。
解决方案:
3.4 Auto Partition 表存储介质未生效
问题现象:Doris 2.1.8 之前的版本,Auto Partition 机制可能导致 storage_medium
配置失效。
解决方案:
4
总结
Doris 的磁盘问题涉及存储异常、磁盘清理、I/O 错误、冷热存储等多个方面。对于常见问题,我们可以采取以下策略:
磁盘异常时,优先检查 BE 是否存活,并查看 Replica 状态。 磁盘空间满时,及时清理 Trash 并调整 trash_file_expire_time_sec
配置。删除 Tablet 后未释放空间,可能是 Doris 版本问题,建议升级或重启 BE。 遇到 I/O 错误,可考虑启用 max_tablet_io_errors
自动标记 bad。存储介质问题通常与 Doris 版本相关,建议关注最新修复方案。
Doris 仍在持续优化磁盘管理逻辑,如果你在生产环境遇到问题,可联系社区同学协助解决!🚀

往期推荐
完
Apache Doris社区是目前国内最活跃的开源社区(之一)。Apache Doris(Apache 顶级项目) 聚集了世界全国各地的用户与开发人员,致力于打造一个内容完整、持续成长的互联网开发者学习生态圈!
如果您对Apache Doris感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:
PowerData是由一群数据从业人员,因为热爱凝聚在一起,以开源精神为基础,组成的数据开源社区。
社区群内会定期组织模拟面试、线上分享、行业研讨、线下Meetup、城市聚会、求职内推等活动,同时在社区群内你可以进行技术讨论、问题请教,结识更多志同道合的数据朋友。
社区整理了一份每日一题汇总及社区分享PPT,内容涵盖大数据组件、编程语言、数据结构与算法、企业真实面试题等各个领域,帮助您提升自我,成功上岸。
可以加作者微信(Faith_xzc)直接进PowrData官方社区群
叮咚✨ “数据极客圈” 向你敞开大门,走对圈子跟对人,行业大咖 “唠” 数据,实用锦囊天天有,就缺你咯!快快关注数据极客圈,共同成长!

点击上方公众号关注我们




