go性能分析工具(wireshark抓服务器包)

前言

写了好几吨代码，实现了几百个接口。功能测试也通过了，终于部署成功了

结果，性能差，什么？

我想做性能分析

PProf

进行性能优化，首先关注Go自身提供的工具链作为分析的依据。本文带你学习和使用Go后花园，如下。

runtime/pprof :收集并分析程序(非服务器)的执行数据

net/http/pprof :收集和分析http服务器的运行时数据

是什么

pprof是用于可视化和分析性能分析数据的工具

pprof在profile.proto中读取分析样本的集合，并生成用于可视化和分析数据的报告。支持文本和图形报告

profile.proto是Protocol Buffer v3描述文件，它描述了一组调用堆栈和symbolization信息，表示统计分析的示例调用堆栈，这是一种常见的堆栈跟踪配置文件格式

支持什么样的使用模式

报告生成：生成报告

交互式终端使用：使用交互式终端

web界面： web界面

我能做什么

CPU Profiling:CPU分析以一定的频率收集监听到的APP应用程序的CPU (包括寄存器)使用情况，并确定APP应用程序在积极消耗CPU周期时需要花费时间的位置

内存配置文件：内存分析。在APP应用程序进行堆分配时记录堆栈跟踪，监视当前和历史记录的内存使用情况，并检查内存泄漏

Block Profiling :阻塞分析，记录等待goroutine阻塞的同步(包括计时器通道)的位置

Mutex Profiling :排他锁定分析，报告排他锁定的竞争情况

一个简单的例子

创建用于初步分析基本程序的简单且有点问题的示例

创建demo文件

(1) demo.go，文件内容：

包主

导入(

“日志”

' net/http '

_ 'net/http/pprof '

' github.com/eddycjy/go-pprof-example/data '

）

func main () }

go func () {

for {

log.println (data.add (https://github.com/eddycjy ) )

}

() ) ) )

HTP.listenandserve ('0.0.0. 0:6060 '，nil ) )。

}

)2) data/d.go，文件内容：

打包数据

var datas [ ]字符串

功能性(字符串)字符串{

数据：=[ ] byte (str

sdata :=字符串(data )

数据=应用(数据，数据) ) ) ) )。

返回数据

}

执行此文件将增加/debug/pprof endpoint可用于观察APP应用程序情况的HTTP服务

分析

一.通过网络界面

查看当前概述： http://127.0.0.1:6060/debug/pprof /

/debug/pprof/

profiles:

0积木

5 goroutine

3 heap

0 mutex

9热创建

全go路由堆栈dump

这个页面有很多子页面。继续深挖吧。看看你能得到什么。

CPU (CPU配置文件) : $HOST/debug/pprof/profile，默认进行30s的CPU配置文件，得到分析用的配置文件

阻止(阻止配置($ host/debug/pprof/block )，查看导致阻塞同步的堆栈跟踪

go routine:$ host/debug/pprof/go routine，显示当前运行的所有goroutines堆栈跟踪

内存配置(heap ) : $HOST/debug/pprof/heap，检查活动对象的内存分配

多重配置($ host/debug/pprof/mutex，查看导致独占锁定的竞争对手的堆栈跟踪

threadcreate:$HOST/debug

/pprof/threadcreate，查看创建新OS线程的堆栈跟踪

二、通过交互式终端使用

$ go tool pprof http://localhost:6060/debug/pprof/profile?seconds=60

Fetching profile over HTTP from http://localhost:6060/debug/pprof/profile?seconds=60

Saved profile in /Users/eddycjy/pprof/pprof.samples.cpu.007.pb.gz

Type: cpu

Duration: 1mins, Total samples = 26.55s (44.15%)

Entering interactive mode (type "help" for commands, "o" for options)

(pprof)

执行该命令后，需等待 60 秒(可调整 seconds 的值)，pprof 会进行 CPU Profiling。结束后将默认进入 pprof 的交互式命令模式，可以对分析的结果进行查看或导出。具体可执行 pprof help 查看命令说明

(pprof) top10

Showing nodes accounting for 25.92s, 97.63% of 26.55s total

Dropped 85 nodes (cum <= 0.13s)

Showing top 10 nodes out of 21

flat flat% sum% cum cum%

23.28s 87.68% 87.68% 23.29s 87.72% syscall.Syscall

0.77s 2.90% 90.58% 0.77s 2.90% runtime.memmove

0.58s 2.18% 92.77% 0.58s 2.18% runtime.freedefer

0.53s 2.00% 94.76% 1.42s 5.35% runtime.scanobject

0.36s 1.36% 96.12% 0.39s 1.47% runtime.heapBitsForObject

0.35s 1.32% 97.44% 0.45s 1.69% runtime.greyobject

0.02s 0.075% 97.51% 24.96s 94.01% main.main.func1

0.01s 0.038% 97.55% 23.91s 90.06% os.(*File).Write

0.01s 0.038% 97.59% 0.19s 0.72% runtime.mallocgc

0.01s 0.038% 97.63% 23.30s 87.76% syscall.Write

flat：给定函数上运行耗时

flat%：同上的 CPU 运行耗时总比例

sum%：给定函数累积使用 CPU 总比例

cum：当前函数加上它之上的调用运行总耗时

cum%：同上的 CPU 运行耗时总比例

最后一列为函数名称，在大多数的情况下，我们可以通过这五列得出一个应用程序的运行情况，加以优化 ????

$ go tool pprof http://localhost:6060/debug/pprof/heap

Fetching profile over HTTP from http://localhost:6060/debug/pprof/heap

Saved profile in /Users/eddycjy/pprof/pprof.alloc_objects.alloc_space.inuse_objects.inuse_space.008.pb.gz

Type: inuse_space

Entering interactive mode (type "help" for commands, "o" for options)

(pprof) top

Showing nodes accounting for 837.48MB, 100% of 837.48MB total

flat flat% sum% cum cum%

837.48MB 100% 100% 837.48MB 100% main.main.func1

-inuse_space：分析应用程序的常驻内存占用情况

-alloc_objects：分析应用程序的内存临时分配情况

三、PProf 可视化界面

这是令人期待的一小节。在这之前，我们需要简单的编写好测试用例来跑一下

编写测试用例

(1)新建 data/d_test.go，文件内容：

package data

import "testing"

const url = "https://github.com/EDDYCJY"

func TestAdd(t *testing.T) {

s := Add(url)

if s == "" {

t.Errorf("Test.Add error!")

}

func BenchmarkAdd(b *testing.B) {

for i := 0; i < b.N; i++ {

Add(url)

}

(2)执行测试用例

$ go test -bench=. -cpuprofile=cpu.prof

pkg: github.com/EDDYCJY/go-pprof-example/data

BenchmarkAdd-4 10000000 187 ns/op

PASS

ok github.com/EDDYCJY/go-pprof-example/data 2.300s

-memprofile 也可以了解一下

启动 PProf 可视化界面

方法一：

$ go tool pprof -http=:8080 cpu.prof

方法二：

$ go tool pprof cpu.prof

$ (pprof) web

如果出现 Could not execute dot; may need to install graphviz.，就是提示你要安装 graphviz 了 (请右拐谷歌)

查看 PProf 可视化界面

(1)Top

image

(2)Graph

image

框越大，线越粗代表它占用的时间越大哦

(3)Peek

image

(4)Source

image

通过 PProf 的可视化界面，我们能够更方便、更直观的看到 Go 应用程序的调用链、使用情况等，并且在 View 菜单栏中，还支持如上多种方式的切换

你想想，在烦恼不知道什么问题的时候，能用这些辅助工具来检测问题，是不是瞬间效率翻倍了呢 ????

四、PProf 火焰图

另一种可视化数据的方法是火焰图，需手动安装原生 PProf 工具：

(1) 安装 PProf

$ go get -u github.com/google/pprof

(2) 启动 PProf 可视化界面:

$ pprof -http=:8080 cpu.prof

(3) 查看 PProf 可视化界面

打开 PProf 的可视化界面时，你会明显发现比官方工具链的 PProf 精致一些，并且多了 Flame Graph(火焰图)

它就是本次的目标之一，它的最大优点是动态的。调用顺序由上到下(A -> B -> C -> D)，每一块代表一个函数，越大代表占用 CPU 的时间更长。同时它也支持点击块深入进行分析！

image

总结

在本章节，粗略地介绍了 Go 的性能利器 PProf。在特定的场景中，PProf 给定位、剖析问题带了极大的帮助

希望本文对你有所帮助，另外建议能够自己实际操作一遍，最好是可以深入琢磨一下，内含大量的用法、知识点 ????

思考题

你很优秀的看到了最后，那么有两道简单的思考题，希望拓展你的思路

(1)flat 一定大于 cum 吗，为什么？什么场景下 cum 会比 flat 大？

(2)本章节的 demo 代码，有什么性能问题？怎么解决它？

来，晒出你的想法！????

作者：EDDYCJY

链接：https://www.jianshu.com/p/4e4ff6be6af9

来源：简书

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

有疑问加站长微信联系(非本文作者)