CPU性能优化-磁盘空间和解析时间

发布于:2024-12-21 ⋅ 阅读:(41) ⋅ 点赞:(0)

即使考虑跟踪文件压缩格式编码后数据仍然占用很大磁盘空间通常每条指令不超过1字节但是考虑到CPU执行指令速度数据仍然非常多根据负载CPU编码100MB/s速度处理PT跟踪文件情况很常见解析后数据可能增加10(约1GB/s)使得PT工具并不适用长时间运行负载但是即使负载程序也可以PT运行小段时间在这种情况下用户可以只在问题发生绑定一小会运行进程此外也可以使用环形缓冲区环形缓冲区新的跟踪数据可以覆盖例如总是跟踪最后10s数据

用户可以通过多种方式进一步限制采集可以限制跟踪用户内核空间代码此外,还有一个地址过滤功能这样就可以动态控制跟踪开启关闭限制内存带宽使得我们可以跟踪一个函数甚至一个循环

解析PT跟踪文件很耗时Intel Core i5-8259U机器对于7ms负载程序 编码PT跟踪文件大概1MB. 使用perf script解析大概需要20s使用命令perf script-F time, ip, sym, symoff, insn 解析结果大概悍勇1.3GB磁盘空间

个人经验Intel PT工具被认为性能分析终极手段有着较低运行开销是非常强大分析工具然而20202为止perf script-F+srcline或者+srccode参数解析跟踪文件变得相当慢日常使用不太实用linux perf 工具实现有待提高Intel VTune profilePT技术支持还是处于实验阶段

6.5 本章总结

1 只有上层性能问题解决了才建议使用硬件特性进行底层调优

2 TMA方法是一种非常强大技术可以识别程序CPU微架构低效利用这是一个稳健并且正式方法

3 最后分支记录LBR 机制可以运行程序同时进行持续记录最近跳转分支指令输出产生性能损耗最小

4 基于处理器事件采样PEBS 另一个性能剖析增强技术通过不使用中断方式自动多次对特定缓冲区采样降低采样开销不过PEBS更广为人知名字精准事件可以精准定位导致某个性能事件具体指令Intel处理器支持特性AMD处理器也有类似特性基于指令采样

5 Intel处理器追踪PT技术是一个可以记录程序执行过程并把报文编码压缩率二进制文件技术压缩文件可以基于每条指令时间戳重建程序执行PT技术覆盖开销


网站公告

今日签到

点亮在社区的每一天
去签到