[root@bogon c++]# perf stat -e L1-dcache-load-misses ./miss Performance counter statsfor'./miss':88,780L1-dcache-load-misses0.009002291seconds time elapsed0.009174000seconds user0.000000000seconds sys [root@bogon c++]# perf stat -e L1-dcache-load-misses ./miss1Performance counter statsfor'....
Performance counter stats for './miss 1': 1,015,683 L1-dcache-load-misses 0.012000335 seconds time elapsed 0.006059000 seconds user 0.006059000 seconds sys [root@bogon c++]# perf stat -e L1-dcache-load-misses ./miss 1 Performance counter stats for './miss 1': 1,015,363 L1-dcache-load...
perf通过硬件性能计数器来获取cache miss的信息。硬件性能计数器是处理器提供的特殊寄存器,用于记录不同类型的事件发生的次数。对于cache miss,perf会使用相应的计数器来记录缓存未命中的次数。 在x86架构中,perf使用的是指令计数器(Instruction Counter)和缓存计数器(Cache Counter)来统计cache miss。指令计数器记录了程...
dTLB-load-misses [Hardware cacheevent] dTLB-stores [Hardware cacheevent] dTLB-store-misses [Hardware cacheevent] dTLB-prefetches [Hardware cacheevent] dTLB-prefetch-misses [Hardware cacheevent] iTLB-loads [Hardware cacheevent] iTLB-load-misses [Hardware cacheevent] branch-loads [Hardware cacheev...
perftop通过-e指定关注的事件,比如查看造成cache miss最多的函数排行perftop -e cache-missesperf top -e task-clockperftop -G // 得到调用关系图perftop-e cache-misses -G // 得到调用关系图perftop -e cycles // 指定性能事件perftop -p 23015,3247 ...
通过perf list命令我们可以看到perf支持很多的采样事件,比如branch-misses、cpu-clock等等。perf中预定义的事件属于不同的类型,比如硬件产生的事件(cache 命中/分支miss)和软件产生的事件(context switch/page fault)等等。 tracepoint tracepoint是linux内核中定义的一些hook,如果被开启,它们就会在执行到特定逻辑时被触发...
perftop通过-e指定关注的事件,比如查看造成cache miss最多的函数排行perftop -e cache-missesperf top -e task-clockperftop -G // 得到调用关系图perftop-e cache-misses -G // 得到调用关系图perftop -e cycles // 指定性能事件perftop -p 23015,3247 ...
not-perf 类似perf,但是实现了cpu 无关,可以开箱即用 支持的特性 支持多种cpu 架构 支持离线以及在线stack trace展开 支持不带debuginfo 的分析 支持跨架构数据分析 架构无关的数据费事 内置火焰图 参考使用 支持的命令 nperf-core 0.1.1 Jan Bujak <j@exia.io> ...