问题排查

命令列表

uptime
dmesg | tail 
vmstat 1
mpstat -P ALL 1 
pidstat 1
iostat -xz 1 
free -m
sar -n DEV 1
sar -n TCP,ETCP 1
top

uptime

快速查看平均负载,并通过1,5,15分钟的平均负载差大致猜测issue出现的时间

dmesg |tail

打印最后十条出错的系统日志,快速得到一些错误,并判断性能问题是否与其有关

vmstat 1

打印每秒vm性能,通过异常值来猜测性能问题

vmstat可得到intr和cs次数,过高的次数可以大概推迟性能问题出在哪里

通过对比cpu us和sy的差值,可以推测是不是因为内核态花费了太多时间

mpstat -p all 1

mp:microprocessors

列出所有处理器性能使用占比,分析是否为单线程占用问题

pidstat 1

列出进程所占资源,分析出问题的是哪个cpu

iostat -xz 1

disks参数

read/write request queued merged,显示等待的请求