7.3 性能瓶颈定位:火焰图与内存泄漏检测导读:在 NPU 固件开发中,我们常遇到两类“隐形杀手”:性能抖动:推理延迟偶尔飙升,但日志显示一切正常。是缓存未命中?是自旋锁竞争?还是中断风暴?内存泄漏:系统运行几天后突然 OOM(Out Of Memory)崩溃,但在代码审查中难以发现哪条路径忘了free。传统的printf调试会引入巨大的时序干扰(Probe Effect),而单步调试又无法覆盖长时运行的场景。本节介绍两种工业级的诊断技术:火焰图 (Flame Graph):基于统计采样(Sampling),可视化 CPU 时间分布,精准定位热点函数和调用栈瓶颈。内存泄漏检测 (Memory Leak Detection):结合固件侧的分配追踪与主机侧的分析工具,自动发现未释放的内存块。我们将构建一套轻量级的NPU 性能剖析器 (Profiler),无需昂贵的硬件 Trace 单元,仅靠定时器和共享内存即可实现。一、火焰图生成原理:统计采样 (Statistical Profiling)1. 核心思想与其记录每一次函数调用(开销大),不如每隔