大家好,这里是 DBA 学习之路,专注于提升数据库运维效率。
前言
某客户生产环境 Oracle 19c RAC 集群突发磁盘空间告警,经排查发现 Grid 审计日志占用了 30GB 磁盘空间,目录下堆积了520 万个审计文件:
SQL> show parameter audit
NAME TYPE VALUE
------------------- ----------- ----------------------------
audit_file_dest string /u01/app/12.2.0/grid/rdbms/audit
audit_sys_operations boolean TRUE
审计配置保留了默认设置,导致sys用户的每项操作都生成审计记录,在长期运行后产生了惊人的文件数量。
紧急处理过程
首次尝试:直接删除失败
rm -rf *.aud
-bash: /bin/rm: Argument list too long
Linux 系统限制单次命令参数长度约 2MB,当文件数量超过数万时,rm 命令直接失败。
应急方案:find -exec 删除
find /u01/app/12.2.0/grid/rdbms/audit -name "*.aud" -exec rm -f {} \;
此方案每删除一个文件就执行一次rm命令,520 万文件耗时超过 30 分钟,在争分夺秒的生产维护中效率不足。
性能优化探索
测试环境模拟
创建 500 万审计文件模拟生产环境:
## python 创建更快
import os
dir_path = "/u01/app/12.2.0/grid/rdbms/audit/"
os.makedirs(dir_path, exist_ok=True)
for i in range(5_000_000):
with open(os.path.join(dir_path, f"file_{i:07d}.aud"), 'w') as f:
pass
多种删除方案性能对比

性能王者:rsync 方案
mkdir empty_dir
time rsync -a --delete empty_dir/ /u01/app/12.2.0/grid/rdbms/audit/
2 分 10 秒完成 500 万文件删除,比find -delete快 60%!原理是利用 rsync 的增量同步算法,直接操作文件系统结构。
生产环境推荐
1. 紧急清理(最快)
mkdir /tmp/empty_dir
rsync -a --delete --progress /tmp/empty_dir/ /u01/app/12.2.0/grid/rdbms/audit/
2. 安全清理(保留目录结构)
find /u01/app/12.2.0/grid/rdbms/audit -type f -name "*.aud" -delete
3. 按时间清理(保留近期文件)
find /u01/app/12.2.0/grid/rdbms/audit -name "*.aud" -mtime +30 -delete
长效预防机制
1. 审计策略优化
ALTER SYSTEM SET audit_sys_operations=FALSE SCOPE=spfile; -- 关闭sys审计
ALTER SYSTEM SET audit_trail=NONE SCOPE=spfile; -- 关闭数据库审计
2. 定期清理脚本
#!/bin/bash
# 保留7天审计日志
find /u01/app/*/grid/rdbms/audit -name "*.aud" -mtime +7 -delete
3. 文件系统隔离
# 为审计日志创建独立文件系统
lvcreate -n audit_lv -L 50G vg_data
mkfs.xfs /dev/vg_data/audit_lv
echo "/dev/vg_data/audit_lv /grid_audit xfs defaults 0 0" >> /etc/fstab
mount -a
chown grid:oinstall /grid_audit
技术原理解析
为什么 find -delete 更快?
-
系统调用优化:直接使用
unlinkat()系统调用,避免进程创建开销; -
批量处理:内部缓存文件列表,减少上下文切换;
-
目录遍历优化:深度优先遍历减少磁盘寻道时间;
文件删除性能影响因素:
-
文件系统类型:XFS > EXT4 > BtrFS(海量小文件场景);
-
磁盘类型:NVMe SSD > SAS HDD(7200 转硬盘 500 万文件删除需 1 小时+);
-
inode 缓存:
vfs_cache_pressure参数优化可提升 20%性能; -
目录结构:扁平目录比深层目录快 3-5 倍;
经验总结
-
预防优于治疗:审计配置应纳入数据库部署检查清单;
-
空间隔离:关键组件(如 Grid)使用独立文件系统;
-
性能认知:海量小文件操作需特殊方法,常规命令可能适得其反;
-
工具选择:
-
万级文件:
find -delete -
十万级:
xargs批量处理 -
百万级:
rsync或专用工具
经此一役,该客户 Grid 审计目录已配置独立文件系统和自动清理策略。运维的本质不是救火,而是通过架构设计和自动化,将危机消灭在萌芽状态。




