<not supported> branch-misses 0.870022180 seconds time elapsed 0.450870000 seconds user 0.418950000 seconds sys 如果没有指定那个事件,perf stat将收集上面列出的常见事件。比如,上下文切换,CPU迁移次数,缺页故障等。 task‐clock:事件表示目标任务真正占用处理器的时间,单位是毫秒。也称任务执行时间。CPUs utilized =...
18958.321499 task-clock(msec)# 1.000 CPUs utilized28context-switches# 0.001 K/sec6cpu-migrations# 0.000 K/sec0page-faults# 0.000 K/sec<not supported> cycles <not supported> instructions <not supported> branches <not supported> branch-misses 18.959020937 secondstimeelapsed Task-clock(msec):CPU利用...
例如cpu-cycles、cache missSoftware Events: 一些比较底层的软件event,例如缺页、timer(定时)Kernel Tracepoint Events: 内核中的tracepointUser Statically-Defined Tracing (USDT): 用户态的tracepointDynamic Tracing: 动态设置的event,例如使用内核的kprobe,可以在大部分函数动态增加eventTimed Profiling...
perf可以统计或采样的event有很多,如果我们要分析cpu,那么我们可以使用cpu-cycles、cpu-clock来衡量占用cpu的程序的分布情况,还可以通过cache-misses、page-faults、branch-misses等event来分析造成cpu占用高的底层原因,确定原因后方便优化。 如果我们要分析内存、io、网络等,也可以通过其他event来进行分析,perf可以使用的e...
<not supported> branch-misses 5.001522424 seconds time elapsed 0.000000000 seconds user 0.001442000 seconds sys 可以看到我们这里对sleep 5这个命令进行了计数,这样的结果也符合我们对sleep命令的理解。 我们也可以对具体的进程进行计数: [root@VM-16-2-centos ~]# perf stat -p `pgrep -nx dockerd` ...
Hardware Event: 是由PMU硬件产生的事件,比如 cache 命中 Software Event:是内核软件产生的事件,比如进程切换,tick 数等 Tracepoint event:是内核中的静态 tracepoint 所触发的事件 perf stat 采集程序的运行时间和CPU开销,perf stat支持的主要参数: -a, --all-cpus system-wide collection from all CPUs -A, ...
Cache-misses: cache 失效的次数。 从输出我们可以看出这个程序是一个cpu密集型的程序。 执行命令 perf record -g -e cpu-clock ./perf_r 生成perf.data 由于我们程序是cpu是cpu密集型,所有我只关注了cpu始终(-e cpu-clock ) perf report -g 读取perf.data文件 ...
你可以使用perf命令配合具体的硬件事件来收集CPU的cache misses和cycles信息。例如,要收集cache misses的...
<not supported> branches <not supported> branch-misses 0.390780362 seconds time elapsed 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 参数设置: -e:选择性能事件 -i:禁止子任务继承父任务的性能计数器。-r:重复执行 n 次目标程序,并给出性能指标在n 次执行中的变化范围。-n:仅输出...
# perf stat sleep1Performance counter statsfor'sleep 1':0.58msec task-clock #0.001CPUs utilized1context-switches #0.002M/sec0cpu-migrations #0.000K/sec80page-faults #0.138M/sec<not supported>cycles<not supported>instructions<not supported>branches<not supported>branch-misses1.001128627seconds time ...