当前位置: 首页 > news >正文

CDH清理磁盘空间完全攻略和完整实现自动化脚本(大数据清除日志)

在CDH集群中,自动清除日志的意义非常重大。尤其是在内网环境下,运维人员无法随时登录服务器进行操作,或者是因为放长假等原因不能每天进行运维工作。这时,如果日志不自动清理,就会面临日志空间满了的问题,这可能造成CDH各组件无法正常工作,离线数仓计算完全停止。

考虑到运维人员不能时时刻刻地在现场进行操作的实际情况,自动清除日志显得尤为重要。比如,当运维人员因为放长假或其他原因暂时无法处理系统日志时,如果系统能够自动清理过期或不必要的日志,就能有效减少系统故障的风险。自动清除日志还能有效节省存储空间和维护成本。在大数据环境下,日志文件往往是占用大量存储空间的主要原因之一。如果这些日志文件不能及时清理,不仅会增加存储成本,还可能影响到整个集群的性能。通过自动清除日志,不仅能够及时释放存储空间,还能减少定期维护的工作量,降低维护成本,从而提升整个CDH集群的管理效率和经济效益。

1、如何防止日志文件占满磁盘空间

CDH的日志文件,大多默认是在根分区的/var/log,二根分区的磁盘空间通常不会太大,在不少公司服务器磁盘空间大的是数据盘/data分区,这时可以考虑把大数据组件的日志目录更改在/data分区。

1.1 更改CDH组件磁盘空间目录的例子

cdh的日志默认在/var/lib,由于根分区默认空间大小有限,数据盘是挂载在/data分区。在运行一段时间后,根分区磁盘空间严重不足。

停止服务,想改那个停那个,然后将老的数据文件mv到新的目录,我这里停了host monitor 和 service monitor

http://www.lryc.cn/news/412660.html

相关文章:

  • vulhub:Apache解析漏洞apache_parsing
  • Raspberry Pi Docker 运行 IRIS
  • 【SQL Server】默认端口与自定义端口
  • 【笔记】Android 驻网(网络注册)状态变化的代码实现
  • SAP执行董事会变动
  • css-grid布局之美
  • Python面试整理-异常处理
  • linux服务之DHCP(centos7.6)
  • 2024最新的软件测试面试八股文
  • C++ STL transform_reduce 用法
  • MySQL5.7 排序
  • 【Unity】3D功能开发入门系列(一)
  • 【Python体验】第五天:目录搜索、数据爬虫(评论区里写作业)
  • elasticsearch性能调优方法原理与实战
  • python print 函数参数:sep 自定义分隔符,end 自定义结尾符
  • git 使用场景
  • Ubuntu22.04 Docker更换阿里云镜像
  • Windows下Rust OpenCV环境配置
  • PostgreSQL(二十三)TOAST技术
  • 文章解读与仿真程序复现思路——电力系统自动化EI\CSCD\北大核心《海上风氢系统与沿海电网能量协同优化调度》
  • MySQL update set语句中 逗号与and的区别
  • C++面试---小米
  • Java 实现 AVL树
  • CNN卷积网络实现MNIST数据集手写数字识别
  • 深入理解Java中的时间处理与时区管理
  • 虚拟机windows server创建域
  • Java 集合框架:Java 中的 Set 集合(HashSet LinkedHashSet TreeSet)特点与实现解析
  • springboot智能健康管理平台-计算机毕业设计源码57256
  • LetterBox图像预处理方法
  • C++第五篇 类和对象(下) 初始化列表