驯服rsyslogd内存狂飙：从日志洪灾到精准限流的实战配置

张开发

• 2026/6/6 10:38:53 • 15 分钟阅读

分享文章

1. 当rsyslogd变成内存怪兽时发生了什么那天凌晨三点我的手机突然被报警短信轰炸——服务器内存使用率突破95%。连滚带爬爬起来SSH连上去top命令一看好家伙rsyslogd这个平时温顺的日志服务竟然吃掉了8G内存这场景就像小区里突然闯进一头哥斯拉把整个内存街区踩得稀烂。细看日志目录更吓人/var/log/messages已经膨胀到20GB打开一看全是容器疯狂输出的调试日志。这让我想起老家发洪水时的场景上游容器暴雨倾盆中游journald的蓄水池决堤下游rsyslogd的河道根本来不及泄洪最终淹没整个村庄服务器内存。典型症状其实很有规律内存使用曲线呈阶梯式增长最终卡死系统/var/log/journal/目录下有损坏的日志文件dmesg里能看到journal校验失败提示容器越多问题爆发越快后来我发现这其实是现代日志系统的三体问题systemd-journald负责采集rsyslogd负责转发容器应用疯狂生产日志。当三者平衡被打破就会引发链式反应。就像洪水暴发要同时治理上游水土流失、中游水库调度和下游河道疏通我们也需要一套组合拳。2. 诊断工具揪出日志系统的病灶2.1 第一现场勘查先用这组命令快速定位问题源# 查看内存占用排行榜 top -o %MEM # 检查rsyslog进程实际内存注意VSZ和RSS的区别 ps aux | grep rsyslog | grep -v grep # 查看journal日志完整性 journalctl --verify | grep corrupt最近一次事故中我发现有3个journal文件报Invalid object header错误。这就像水库出现了管涌必须立即处理。2.2 日志洪水溯源重点检查这些位置# 查看各日志文件大小 ls -lh /var/log/{messages,secure,maillog} # 实时监控日志写入速度每秒刷新 watch -n 1 du -sh /var/log/messages # 统计日志来源容器日志通常带k8s标签 journalctl -o json-pretty | grep k8s_pod | wc -l有次发现某台机器上单个Pod每秒产生2000条调试日志这相当于在市政排水管上接了消防栓3. 紧急抢险给rsyslogd戴上紧箍咒3.1 内存限制三板斧修改/etc/systemd/system/rsyslog.service.d/memlimit.conf没有就新建[Service] MemoryAccountingyes MemoryHigh8M # 软限制类似水位警戒线 MemoryMax80M # 硬限制相当于防洪堤高度这组参数效果就像给长江分段设置汛限水位当内存使用超过8M系统会温和限流达到80M直接触发OOM killer重启服务时记得systemctl daemon-reload systemctl restart rsyslog3.2 日志分级过滤在/etc/rsyslog.conf中添加# 限制journal转发速率单位秒 $imjournalRatelimitInterval 0 $imjournalRatelimitBurst 0 # 只记录错误级别日志 *.err;mail.none;authpriv.none;cron.none /var/log/messages这相当于在日志管道上加装过滤器原本的消防水带变成了滴灌系统。实测能将日志量减少90%以上。4. 治本之策重建日志生态系统4.1 journald存储优化编辑/etc/systemd/journald.conf[Journal] Storagepersistent # 改内存存储为磁盘存储 Compressno # 关闭压缩避免bug SystemMaxUse1G # 磁盘配额1GB这就像把临时蓄水池内存改建成永久水库磁盘。记得同步操作mkdir -p /var/log/journal systemctl restart systemd-journald4.2 容器日志分流对于Kubernetes环境在docker配置中增加{ log-driver: json-file, log-opts: { max-size: 10m, max-file: 3 } }相当于给每个容器安装独立下水道避免都挤到主排水管。5. 长效防护机制5.1 监控预警配置Prometheus中添加这些监控项- name: rsyslog_memory rules: - alert: RsyslogMemoryHigh expr: process_resident_memory_bytes{jobrsyslog} 8 * 1024 * 1024 for: 5m labels: severity: warning5.2 定期维护脚本创建/etc/cron.weekly/log-maintenance#!/bin/bash # 清理30天前日志 find /var/log/journal -type f -mtime 30 -delete # 校验journal完整性 journalctl --verify记得给执行权限chmod x /etc/cron.weekly/log-maintenance经过这套组合拳治理后我们的服务器再没出现过日志洪水。现在rsyslogd的内存占用稳定在5-6MB就像驯服的野兽回到了笼子里。关键是要理解日志系统是个有机整体不能头痛医头脚痛医脚。就像治水需要全流域统筹日志治理也需要端到端的视角。

更多文章

前端开发 2026/4/20 16:19:40

从Faster RCNN到Mask RCNN：手把手教你理解RoIAlign如何解决小目标检测的‘像素偏差’问题

从Faster RCNN到Mask RCNN：RoIAlign如何突破小目标检测的精度瓶颈在目标检测领域，小目标检测一直是困扰工程师和研究者的难题。当你在COCO数据集上评估模型时，是否发现那些占据画面不到1%面积的物体总是难以被准确检测？这背后隐藏…

Rust-doom碰撞检测系统：玩家-墙壁-精灵交互的完整实现【免费下载链接】rust-doom A Doom Renderer written in Rust. 项目地址: https://gitcode.com/gh_mirrors/ru/rust-doom Rust-doom是一个用Rust编写的Doom渲染器，其核心功能之一是精确的碰撞…

张开发

前端开发 2026/4/20 3:35:45

TypeScriptToLua实战教程：10个真实项目案例教你高效转译

TypeScriptToLua实战教程：10个真实项目案例教你高效转译【免费下载链接】TypeScriptToLua Typescript to lua transpiler. https://typescripttolua.github.io/ 项目地址: https://gitcode.com/gh_mirrors/ty/TypeScriptToLua TypeScriptToLua是一款强大的T…

张开发

驯服rsyslogd内存狂飙：从日志洪灾到精准限流的实战配置

最新文章

Java Loom响应式迁移全链路拆解（从线程模型颠覆到Project Loom生产就绪）

从开发到分发：手把手教你用Inno Setup为Qt应用制作专业安装包（附脚本自定义技巧）

告别‘Hello World’就卡住：保姆级Android Studio安装与环境变量配置（Win/Mac通用）

保姆级教程：用STM32CubeIDE搞定STM32F407的USB虚拟串口（CDC）通信与速度测试

从老式工控机到树莓派：一文理清RS-232、RS-485和TTL电平的‘前世今生’与适用场景

Vitis自定义IP编译过了，Debug却卡在QEMU文件缺失？一个手动创建空文件的“土办法”救了我

推荐文章

相关文章

分享文章

更多文章

从Faster RCNN到Mask RCNN：手把手教你理解RoIAlign如何解决小目标检测的‘像素偏差’问题

终极Devise路由配置指南：自定义路径与命名的7个实用技巧

StructBERT中文语义匹配惊艳效果：短视频标题与脚本内容相关性打分真实案例

PySR完整指南：掌握高性能符号回归技术，从数据中发现可解释数学公式

blooket-hacks核心功能解析：从无限食物到即时胜利

Dynamic-DataSource配置文件加密终极指南：按环境密钥的安全配置方案

如何用roop-unleashed实现高效AI换脸：技术原理与工作流指南

CppJieba终极指南：快速掌握高性能中文分词利器

别再死记硬背了！用Python+NumPy手把手模拟AM/FM调制全过程（附代码）

【图像融合】动态阈值神经P系统和非亚采样环形变换的多模态医学图像的新型融合方法【含Matlab源码 15331期】

Rust-doom碰撞检测系统：玩家-墙壁-精灵交互的完整实现

TypeScriptToLua实战教程：10个真实项目案例教你高效转译