intel-vtune分析工具排查性能问题
Dear customer, 你可以使用intel 性能分析工具来分析性能问题。https://www.intel.com/content/www/us/en/developer/tools/oneapi/vtune-profiler.html。
这边你怀疑核间开销的话,可以先采集L1/L2 的cache miss, 看看是否miss 率增加。具体事件可以看https://perfmon-events.intel.com/。vtune 和perf都支持这些事件,用perf也可以采集。
可能需要先明确问题根因才能看看有没有对应的解法。
官网
下载:
教程
- 在服务器上使用vtune
- 性能分析工具:vtune 快速上手教程
- 性能分析工具perf和vtune的使用介绍
- HotSpot性能分析利器 vtune 安装使用指南
- Intel-VTune使用指南
- CPU性能分析与优化:Intel VTune 性能分析工具
vtune使用
1 | https://www.intel.com/content/dam/develop/external/us/en/documents/vtune-profiler-cheat-sheet.pdf |
perf
- 1Fast Packet Processing: A Survey
- How to Run DPDK in Pipeline Mode: A Step-by-Step Guide
- DPDK-流分类与多队列
- 网卡多队列:RPS、RFS、RSS、Flow Director(DPDK支持)
- debug cacheline 竞争和伪共享
- 用perf调查繁忙的CPU
perf stat -e cycles,instructions,cache-references,cache-misses,branch-instructions,branch-misses,L1-dcache-loads,L1-dcache-load-misses,LLC-loads,LLC-load-misses,dTLB-loads,dTLB-load-misses,cpu-clock,task-clock,context-switches,cpu-migrations,page-faults -p pidof xxxxxxx – sleep 30