如何解释intel-gpu-top和intel-gpu-overlay的输出?


10

我已经编译并运行了这些命令,但是它们的内容对我来说还是个谜。

intel-gpu-overlay读取的过程类似:15R, 16B, 41ms waits。什么是R,什么是B,等待时间表示什么?

它具有CPU:152%(我想这与我从顶部获得的内容相同)。渲染:32%,比特流:6%,比特率:6%。哪种类型的代码会导致这些值出现瓶颈,而当它们出现时,系统的行为如何?

这是intel-gpu-top的示例:

               render busy:  23%: ████▋                                  render space: 12/16384

                      task  percent busy
                       GAM:  29%: █████▉                  vert fetch: 1380772913 (5386667/sec)
                        CS:  23%: ████▋                   prim fetch: 350972637 (1368891/sec)
                      GAFS:   9%: █▉                   VS invocations: 1375586768 (5385212/sec)
                       TSG:   8%: █▋                   GS invocations: 0 (0/sec)
                       VFE:   7%: █▌                        GS prims: 0 (0/sec)
                       SVG:   3%: ▋                    CL invocations: 677098924 (2648400/sec)
                        VS:   3%: ▋                         CL prims: 682224019 (2663834/sec)
                      URBM:   2%: ▌                    PS invocations: 9708568482932 (34396218804/sec)
                        VF:   2%: ▌                    PS depth pass: 15549624948405 (58732230331/sec)
                       SDE:   0%:                      
                        CL:   0%:                      
                        SF:   0%:                      
                       TDG:   0%:                      
                        RS:   0%:                      
                      GAFM:   0%:                      
                       SOL:   0%:

1
这是关于stackoverflow的一个很好的答案,可以关闭它:stackoverflow.com/questions/28876242/…–
mpr

你为什么要关闭这个,在这里不值得这么大的回答?
乔治·乌德森

Answers:


4

摘自OP注释中给出的链接。

我也很好奇,因此我可以从参考手册中了解一些内容。还需要关注intel-gpu-tools源,特别是lib/instdone.c描述了所有Intel GPU模型中可能出现的内容。这个补丁在翻译所有缩写词时也很有帮助!

有些人可能是错的,如果有更多知识的人士可以加入,我会喜欢的!我会在学习这些东西的时候回来用更多的答案来更新答案。

首先,右边的三行:

  • 渲染空间可能是使用常规的3D操作。
  • 从谷歌搜索来看,比特流似乎与音频解码有关?这是一个相当笼统的术语,因此很难通过查询找到。但是,它没有出现在我的GPU(Skylake HD 530)上,因此它可能无处不在。
  • 阻击器在卷中描述。11,似乎负责2D操作的硬件加速(blitting)。

固定功能(FF)管道单元(老式的GPU功能):

  • VF:顶点提取程序(第1卷),3D管道中的第一个FF单元,负责从内存中提取顶点数据。
  • VS:顶点着色器(第1卷),在GPU绘制的每个图元的顶点上计算事物。GPU上的标准操作。
  • HS:船体着色器
  • TE:镶嵌化引擎
  • DS:域着色器
  • GS:几何着色器
  • SOL:流输出逻辑
  • CL:剪辑单元
  • SF:Strips and Fans(卷1),FF单元,主要功能是将诸如Strips和Fans之类的基本拓扑分解为基本体或对象。

用于线程和管道管理,对于FF单位和单位GPGPU(参见英特尔开源高清显卡程序员手册很多信息就如何这一切工作):

  • CS:Command Streamer(第1卷),是图形处理引擎的功能单元,可提取命令,解析命令并将它们路由到适当的管道。
  • TDG:线程分派器
  • VFE:视频前端
  • TSG:线程扳手
  • URBM:统一返回缓冲区管理器

其他的东西 :

  • GAM:请参阅GFX Page Walker(第5卷),也称为Memory Arbiter,与GPU跟踪其内存页面的方式有关,似乎与TLB(另请参见SLAT)为您的RAM所做的工作非常相似。
  • SDE:南方显示引擎;根据卷。12,“南方显示引擎支持热插拔检测,GPIO,GMBUS,面板电源排序和背光调制”。

学分:

StackOverflow用户 F.X.

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.