 图中的runtime名称做了脱敏 A compute 调用了两个cudaruntime,分别是cudaRT_P和cudaLaunchKernel,其中cudaRT_P调用了cudaRT_C,但是 https://github.com/PaddlePaddle/VisualDL/blob/e420b8cace3001bcd77ae627d8b6ac6a23448526/visualdl/component/profiler/parser/event_node.py#L457 将三个cudaruntime 一起作为A compute的runtime子节点,即len(Acompute.runtime_node) == 3 对此,已经提交了pr,见 https://github.com/PaddlePaddle/VisualDL/pull/1256,希望参与问题的后续讨论,期待回复