看懂 Linux 硬件信息查看与故障排查
目录
1. 硬件信息查看的起点:为什么你得先摸清家底?
用 lscpu 看 CPU 的“身份证”
lsblk:磁盘和分区的“全家福”
dmidecode:硬件的“DNA 检测”
小技巧:别忘了 lspci 和 lsusb
实践案例:服务器卡顿,硬件信息怎么帮你?
2. 硬件监控的“眼睛”:实时掌握系统状态
top 和 htop:性能监控的入门级神器
iostat:磁盘性能的“心电图”
vmstat:系统资源的“全景图”
实践案例:排查高负载的“元凶”
3. 日志:硬件故障的“黑匣子”
dmesg:硬件初始化的“第一手资料”
journalctl:系统日志的“全能选手”
日志过滤技巧
实践案例:硬盘掉线的“侦探游戏”
4. 磁盘故障排查:从“慢”到“坏”的应对策略
用 fio 测试磁盘性能
smartctl:检查磁盘健康
fsck:修复文件系统
实践案例:磁盘读写慢的“急诊室”
5. 网络硬件排查:当“网速慢”不是运营商的锅
用 ethtool 摸清网卡状态
ip 和 ifconfig:网络接口的“体检表”
用 ping 和 iperf 测试网络性能
日志中的网络线索
实践案例:网速慢的“破案之旅”
6. CPU 故障排查:当“核心”不给力
检查 CPU 温度:别让“大脑”过热
频率异常:CPU 为啥“偷懒”?
用 stress 测试 CPU 稳定性
实践案例:CPU 性能“失踪”之谜
7. 内存故障排查:当“记忆”开始出错
用 memtester 测试内存
检查内存使用情况
日志中的内存线索
实践案例:随机崩溃的“幕后黑手”
8. 电源与散热:硬件健康的“幕后英雄”
检查电源状态
散热问题排查
日志中的电源与散热线索
实践案例:服务器莫名重启的“电源疑云”
9. BIOS 与固件:硬件的“底层逻辑”
用 dmidecode 查看 BIOS 信息
检查固件相关日志
更新 BIOS
实践案例:新硬盘不识别的“BIOS瓶颈”
10. 综合案例:从“玄学故障”到系统恢复
案例背景
排查步骤
经验总结
1. 硬件信息查看的起点:为什么你得先摸清家底?
想要在 Linux 系统里排查硬件问题,第一步不是直接修,而是搞清楚你手头的设备到底是个啥情况。硬件信息就像一张地图,告诉你 CPU、内存、磁盘、网络接口等每个部件的现状。没有这张地图,你就是在盲人摸象,修来修去可能越修越乱。
Linux 提供了不少工具帮你摸清硬件底细,比如 lscpu、lsblk、dmidecode 和 lspci,这些都是你的“探照灯”。