一、排查步骤 1、使用top定位到CPU占用高的进程PID,然后按shift+p按CPU排序

top命令是Linux下常用的性能分析工具,可以实时显示系统中各个进程的资源使用状况,类似于任务管理器

cpu温度高cpu会100_cpu使用100玩游戏会卡_cpu使用率100怎么办

第一行,任务队列信息,与命令执行结果相同

系统时间:07:27:05
 
运行时间:up 1:57 min,
 
当前登录用户:  3 user
 
负载均衡(uptime)  load average: 0.00, 0.00, 0.00
 
     average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。
 
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。
如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了

第二行,Tasks——任务(进程)

进程总数:150,运行:1,睡眠:149,停止:0,僵尸进程:0

第三行,cpu状态信息

0.0%us【user space】— 用户空间占用CPU的百分比。
 
0.3%sy【sysctl】— 内核空间占用CPU的百分比。
 
0.0%ni【】— 改变过优先级的进程占用CPU的百分比
 
99.7%id【idolt】— 空闲CPU百分比
 
0.0%wa【wait】— IO等待占用CPU的百分比
 
0.0%hi【Hardware IRQ】— 硬中断占用CPU的百分比
 
0.0%si【Software Interrupts】— 软中断占用CPU的百分比

第四行,内存状态

总计、已用、可用、[缓存内存量]

第五行,swap交换分区信息

总计,已使用536k,免费,【缓冲交换区总量】

可用内存=free + buffer + cached
 
对于内存监控,在top里我们要时刻监控第五行swap交换分区的used,如果这个数值在不断的变化,
说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。
 
第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,
 
第四行中空闲内存总量(free)是内核还未纳入其管控范围的数量。
 
纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把
这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。

更多Linux内核视频资料可免费向后台【内核】私信自行获取。

cpu使用率100怎么办_cpu使用100玩游戏会卡_cpu温度高cpu会100

第六行,空行

第七行以下:各进程(任务)的状态监控

PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR — 共享内存大小,单位kb
S —进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)

详细解释

VIRT:virtual memory usage 虚拟内存
1、进程“需要的”虚拟内存大小,包括进程使用的库、代码、数据等
2、假如进程申请100m的内存,但实际只使用了10m,那么它会增长100m,而不是实际的使用量
 
RES:resident memory usage 常驻内存
1、进程当前使用的内存大小,但不包括swap out
2、包含其他进程的共享
3、如果申请100m的内存,实际使用10m,它只增长10m,与VIRT相反
4、关于库占用内存的情况,它只统计加载的库文件所占内存大小
 
SHR:shared memory 共享内存
1、除了自身进程的共享内存,也包括其他进程的共享内存
2、虽然进程只使用了几个共享库的函数,但它包含了整个共享库的大小
3、计算某个进程所占的物理内存大小公式:RES – SHR
4、swap out后,它将会降下来
 
DATA
1、数据占用的内存。如果top没有显示,按f键可以显示出来。
2、真正的该程序要求的数据空间,是真正在运行中要使用的。
 
top 运行中可以通过 top 的内部命令对进程的显示方式进行控制。内部命令如下:
s – 改变画面更新频率
l – 关闭或开启第一部分第一行 top 信息的表示
t – 关闭或开启第一部分第二行 Tasks 和第三行 Cpus 信息的表示
m – 关闭或开启第一部分第四行 Mem 和 第五行 Swap 信息的表示
N – 以 PID 的大小的顺序排列表示进程列表
P – 以 CPU 占用率大小的顺序排列进程列表
M – 以内存占用率大小的顺序排列进程列表
h – 显示帮助
n – 设置在进程列表所显示进程的数量
q – 退出 top
s – 改变画面更新周期

顶部使用方法:

 使用格式: 
top [-] [d] [p] [q] [c] [C] [S] [s] [n]
参数说明: 
d:指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。
 
p:通过指定监控进程ID来仅仅监控某个进程的状态。
 
q:该选项将使top没有任何延迟的进行刷新。如果调用程序有超级用户权限,那么top将以尽可能高的优先级运行。
 
S:指定累计模式。
 
s:使top命令在安全模式中运行。这将去除交互命令所带来的潜在危险。
 
i:使top不显示任何闲置或者僵死进程。
 
c:显示整个命令行而不只是显示命令名。

这时发现如果Java进程占用过多而无法下载,则需要检查是什么线程导致比例过高。 以图中进程为例,如果发现PID为31357的Java进程占用CPU比例较高,记录其PID

2、查看Java进程中线程的占用情况

top -H -p 31357 然后按shift+p按CPU排序

说明:-H指显示线程,-p指指定进程

cpu温度高cpu会100_cpu使用100玩游戏会卡_cpu使用率100怎么办

可以看到CPU占用率高的线程,记下它们的PID,这里假设31357的CPU占用率一直是50%

或者使用 ps -mp pid -o,tid,time 查询进程,哪个线程cpu使用率高并记住TID

cpu温度高cpu会100_cpu使用100玩游戏会卡_cpu使用率100怎么办

将上图中找到的占据最高tid 29108的线程转换成十六进制—71b4

cpu使用100玩游戏会卡_cpu温度高cpu会100_cpu使用率100怎么办

3、通过命令获取资源占用异常的线程堆栈,可以暂时保存到文件中以供查看

31357 > .31357.log

cpu使用率100怎么办_cpu使用100玩游戏会卡_cpu温度高cpu会100

上面可以看到指定线程的堆栈信息。如果想查看线程中锁的附加信息,可以添加-l参数

cpu使用率100怎么办_cpu温度高cpu会100_cpu使用100玩游戏会卡

4.以上方法用于正常工艺条件下的堆叠打印

-l 命令没有响应。 估计CPU已经站立,无法执行正常命令。 根据提示【没有的时候可以使用-F】,只能放大。

-F "PID" > ."PID".txt

实际吐出的日志结果如下:

cpu温度高cpu会100_cpu使用100玩游戏会卡_cpu使用率100怎么办

发现大量线程被阻塞,有用的结果在这里:

cpu温度高cpu会100_cpu使用100玩游戏会卡_cpu使用率100怎么办

显然,线程19576一直在运行,它一直在执行EXCEL导出的相关方法。 问题就出在这里。 接下来的任务就是检查这个地方的代码逻辑。

命令格式:

[ ] 进程号

参数说明:

-F [-l] 当 pid 无响应时强制打印 stack -ll 长列表。 打印有关锁的附加信息,例如属于 java.util 的列表。 -m 混合模式输出(包括java和本机c/c++片段)堆栈。 pid:java应用程序的进程号 5jps命令比较实用查看java进程的pid

cpu使用100玩游戏会卡_cpu温度高cpu会100_cpu使用率100怎么办

命令格式

jps [ ] [ ]

参数说明:

三个参数相加可以显示更详细的信息:

cpu使用100玩游戏会卡_cpu温度高cpu会100_cpu使用率100怎么办

发现这些Java进程的启动参数中都打开了JMX远程端口。 正常情况下,通过远程连接可以看到JVM的日常参数。 比如本地访问上图中的pay.war流程:

cpu温度高cpu会100_cpu使用率100怎么办_cpu使用100玩游戏会卡

cpu使用率100怎么办_cpu温度高cpu会100_cpu使用100玩游戏会卡

cpu使用100玩游戏会卡_cpu使用率100怎么办_cpu温度高cpu会100

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注