查看cpu时序

  • 设置环境变量
export FLOG_level=info
export LOG_path=/ota/liuchenlong
export PROFILING_TIME=1
  • 起节点前设置PROFILING_TIME=0就是统计实际耗时,PROFILING_TIME=1就是统计cpu时间
  • 启动要查看的应用程序
  • 等待几十秒后 kill -34 pid

会在/asw/data/lcl/profiler/产生txt文件 可以用func_parser.py脚本进行解析(脚本在48服务器上) 之后会生成一些文件,其中有一个trace.json,可以在ui.perfetto.dev网站打开,查看CPU占用

查看模型推理时间

export KESTREL_ASPECT=profiler