Linux性能分析工具和方法

科技 2024-08-20 09:48 河北

👉目录

1 分析工具

2 分析方法

3 CPU 使用有问题？

4 内存使用有问题？

5 磁盘 I/O 使用有问题？

6 网络 I/O 使用有问题？

对 Linux 进行问题排查是后台开发的日常，但却总会遇到“无法稳定复现、问题定位困难、一两天都没缩小问题范围”等等问题。

本文作者整理和总结了 Linux 后台开发常用的分析工具和问题排查思路，主要涉及 CPU 、内存、磁盘和网络四大方面，并归纳为思维导图方便大家记忆和查询。赶紧点赞转发收藏一键三连起来吧！

01

分析工具

Linux 有很多性能分析工具，有些工具具有类似的功能，可以用在同一类指标上，而有些问题需要同时使用多个工具来进行排查。下面这张思维导图总结了一些常用的工具。

（公众号对话框回复关键词Linux 性能分析，获取两张高清思维导图）

02

分析方法

Linux 上的问题排查是后台开发的家常便饭，有时候查个问题不知从何下手，甚至要花费一两天时间，所以能尽快的缩小问题范围和定位问题根源，不给产品大大拖后腿，是所有开发的愿景。

我根据以前的笔记整理了排查问题的思路图，希望能提供一些解决问题的思路。按下图走到叶子节点的时候可能没有想要的解，但也可能帮助缩小了问题范围和获得了相关信息，方便网上查询和咨询他人。图中的意思不是指从 CPU --> 内存 --> 磁盘 --> 网络依次排查，如果能明确的确定哪方面有问题，直接从该问题类型开始往下排查。

下面的内容是对上图进行展开。

03

CPU 使用有问题？

使用 top 等命令查看 CPU 使用率和负载是否过高。

内核空间占了大多数 CPU？
通过 top 命令查看内核占用 CPU 比例是否过大。
内核处理了很多中断吗？
使用 procinfo 或 cat /proc/interrupts 查看中断次数和频率，以及造成中断数量较高的设备。
内核的时间花在哪了？
使用 oprofile 分析哪些内核函数消耗大量时间，并查询这些函数的功能，确定它们处于哪个子系统（内存、网络、磁盘等）并了解可能被调用的原因。如果这些函数是设备特定的，尝试着找出为什么需要使用这种特定的设备（尤其是在1.2中造成高中断的设备），或许就可以判断出哪里出了问题。
用户空间占了大多是 CPU？
通过 top 命令查看用户态是否占了大量 CPU。
哪个进程占用了大多数 CPU？
通过 top 命令进程排序列表确定占用大量 CPU 的进程。
进程在内核还是用户空间花费了时间？
使用 time 命令查看进程在内核和用户空间花费的时间，这里不一定非得任意一方非得占大多数时间。如进程在内核占用超过25%以上的时间，说明内核也排查是重点。
进程在哪些系统调用上花费了较多时间？
使用 strace/oprofile 查看进程调用了哪些系统调用和找出主要耗时时长的系统调用，通过减少系统调用次数或者更改性能更好的系统调用来提升性能。
进程在哪些函数上花费了时间？
使用 ltrace/oprofile 确定哪些函数消耗了大多数时间。如果函数调用次数过多，则检查是否存在不必要的调用次数，如 for 循环判断条件里不断调用某个函数或者 debug 日志里调某个函数得到一个字符串序列。如果单次调用就已经很耗时，使用 oprofile/cachegrind 分析函数是否存在热点代码大量 cache 缺失，通过调整数据结构或调整代码提高热点代码 cache 命中。

04

内存使用有问题？

通过 top/vmstat/procinfo 等确定内存使用是否过高，内存交换空间不断增加。

内核使用内存在增加？
使用 slabtop 查看内核使用内存是否增加或者使用量过大。
内核使用的内存类型是什么？
使用 slabtop 排序内核使用内存情况，找出使用内存较大的对象名字。通过搜索或查询相关分配对象名字（如 inode_cache），确定它用于哪些文件或属于哪个子系统，就有可能弄清楚内存分配的原因。
进程使用内存在增加？
使用 top/ps 按内存使用量排序并观察 rss 等字段看进程使用物理内存是否增加。

进程使‍用的内存类型是什么？
通过 /proc/<pid>/status 查看内存使用情况。如 VmExe 值很大，则说明可执行文件本身很大，需要确定哪些函数文本比较大。VmLib 很大，则说明应用程序使用了大量或者体积比较大的共享库，需要确定哪些库导致了 VmLib 很大。VmData 较大并在增加，说明进程的数据区或堆在增加。
哪些函数使用大量的栈空间？
使用 gdb attach 进程，根据调用栈信息计算当前栈指针和前一个栈指针的差值，这个差值即为函数的栈容量，找到栈容量比较大的函数。
哪些函数分配大量的堆内存？
使用memprof找到哪些函数分配了堆内存并观察哪些进程的堆内存在增加，确定是否存在不合理的分配或者内存泄漏问题。
哪些库比较大？
通过 /proc/<pid>/maps 查看进程使用了哪些共享库和以及这些库的大小，对于太大的共享库是否可能替换成大小更小的版本。或者某个库已经被其他进程加载到内存使用，只是版本不同，则可以改成共用一个版本。
哪些函数文本较大？
如果进程的可执行文件本身比较大，加载到内存后会占用更多的空间。可以通过 nm 命令排序符号大小，找出文本段较大的函数看是否可以删除或者减小其大小。
共享内存使用量在增加？
使用 ipcs 查看共享内存信息，是否存在过大或者共享内存数量不断增加。
哪个进程在使用共享内存？
使用 ipcs -p 查看哪些进程创建和使用了共享内存。对于共享内存过大问题，可以查看其程序代码看分配是否合理。对于共享内存数不断增加，是否存在创建后未删除等问题。

05

磁盘 I/O 使用有问题？

运行 iostat，查看 await 平均等待时间，await 越高则说明磁盘负荷越大。

哪个进程访问了磁盘？
通过 iotop 找到产生大量 IO 的进程。
进程访问了哪些文件？
通过 strace 跟踪高 IO 进程与文件操作相关的系统调用，查看其调用详情和耗时时长，找到耗时长的读写操作。并通过其操作的文件描述符 fd 映射回磁盘上的文件，了解为什么需要读写这些文件，进而查看是否可以优化。

06

网络 I/O 使用有问题？

使用 ethool 查看网卡的最大流量限制，并通过 iptraf 查看流经端口的流量是否饱和。

网络设备产生了大量错误？
使用 ifconfig/ip 命令查看网络接口是否产生大量错误，如果是可能是硬件配置的有问题，联系网管帮忙排查解决。
网络设备存流量类型是什么？
使用 iptraf 查看流量类型（协议/端口号）。
是否有进程处理该类型的流量？
使用 netstat 查看是否有进程在流经该网络端口的流量。
哪个远程系统发送了流量？
如果没有指定进程在处理这个流量，可能来自网络上其他系统的流量攻击。可使用 etherape/wireshark 尝试跟踪或者找网管咨询。
哪个套接字在处理流量？
在确定了处理流量的进程后，使用 strace/lsof 找到是哪个套接字产生了这些通信流量。

FunTester
FunTester 原创精华
服务端功能测试
性能测试专题
Java、Groovy、Go
白盒、工具、爬虫、UI自动化
理论、感悟、视频

http://mp.weixin.qq.com/s?__biz=MzU4MTE2NDEyMQ==&mid=2247502274&idx=1&sn=c577c815f2951dd6c404eff8219e501b

FunTester

万粉千文｜百无一用

最新文章

【连载 02】多线程实现

Scheduled线程池实践

【连载01】并发与并行

【连载】序，特点，建议

写了本书，准备连载

GroovyShell 应用实践

裁员了，很严重，大家做好准备吧！

双11，支付宝崩了，原因是是它

今年测试这工资是认真的吗？

软件风险管理的策略

故障测试 Byteman 上手实践

ExecutorService 并发指南

Go 语言处理 yaml 文件

高薪！这才是测试人未来5年最好的就业方向！

元宇宙招聘【远程办公】

《寻觅意义》读后感

GoFakeIt—造数据神器

Go 语言基准测试入门

JavaScript 异步编程入门

Goja—Go 和 JavaScript 的桥梁

高性能 HTTP 客户端 undici 初探

Java 性能分析 5 大工具

Java 性能分析

Chrome Extension 开发中的 Tab 操作与实践

从传统测试转向敏捷测试

Groovy 是一门 DSL 语言

混沌工程、故障测试、Web 前端

故障测试入门指南

软件系统反脆弱指南

混沌工程入门指南

中秋快乐

取代测试岗，国内又一新兴岗位在崛起！这才是测试人未来5年最好的就业方向！

软件架构：问题起源和应对

HTTP 客户端：RestClient、WebClient、RestTemplate

Web性能回归测试

Chrome Extension 消息传递

漫画设计模式【留言赠书】

Java Streams 的潜力

腾讯6年，技术人核心竞争力

Go 语言 nil 和接口

年薪68w！真心建议测试人冲一冲新兴领域，工资高前景好

Java ORM 框架指南

影子测试：软件测试的创新策略

Go 语言异常处理

Linux性能分析工具和方法

软件测试的持存化

Go 语言 viper 库上手实践

提升服务性能的 9 大优化方案

Java Agent 开发初探

你挣多少钱？觉得公平吗？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉