AMD RDNA™ 2 – Radeon™ GPU Profiler 1.10 - YouTube 链接
RGP 1.9 和 1.10 引入了对 AMD Radeon™ RX6000 系列 GPU 的支持、新的内存缓存计数器功能以及对 DirectX® 和 Vulkan® 光线追踪的支持。
Radeon™ GPU Profiler (RGP) 又迎来一次更新!
RGP 是我们一款开创性的低级优化工具,可提供有关 Radeon™ GPU 的详细信息。
本次最新版本 v1.10 增加了对以下内容的支持:
以及 更多功能!请继续阅读了解详情。
虽然 RGP 一直以来都利用 Radeon GPU 的低级数据来帮助您深入了解游戏的性能,但在此版本中,我们将其提升了一个台阶。通过引入缓存计数器,您现在可以看到您的帧如何访问 GPU 内存层次结构的各个缓存级别。RGP 现在可以可视化来自 L0、L1 和 L2 内存缓存的数据,以及来自着色器核心指令和标量缓存的数据。
这些数据基于 GPU 硬件的流式性能度量 (SPM) 构建,提供了对硬件运行情况的独特洞察,并为您提供了优化着色器内存访问模式以实现更高性能的机会。
此功能支持 RDNA 和 RDNA 2 硬件,因此您需要拥有 Radeon RX 5000 系列 GPU 或更新的 GPU。要收集这些数据,只需在捕获配置文件时确保在 Radeon Developer Panel 中选中“Collect cache counters”选项。

当您在 RGP 中打开捕获的配置文件时,“Wavefront Occupancy”面板会有一个新的 UI 元素来可视化缓存数据。下面您可以看到收集到的五个缓存统计数据。图表显示了每个缓存随帧时间线的命中百分比。使用此视图,您可以将缓存统计数据与波前占用率和事件时间线相关联。
这是 RGP 中的样子(参见下图截图中的红色区域):

只需将鼠标悬停在图表上,即可查看在鼠标下方的图表点处有关每个缓存的更多详细信息,包括命中百分比、缓存请求数、命中数、未命中数。

您可以使用图表上方的“Counters”下拉菜单为任何缓存启用或禁用图表。在这里,我们取消选中了“Instruction”和“Scalar”缓存,因此图表将仅显示“L0”、“L1”和“L2”缓存计数器。

您还可以通过单击图表下方图例中对应项的颜色框来填充一个或多个图表下方的区域。
在这里,我们单击了紫色的“L0 cache hit”颜色框和红色的“L1 cache hit”颜色框,以填充两个折线图下方的区域。

想要更详细地了解每个统计数据的描述?只需将鼠标悬停在图例中的计数器名称上即可。

此版本增加了对 Vulkan® 光线追踪的支持,该支持建立在 1.9 版本中引入的 DirectX® 光线追踪支持的基础上。实际上,Vulkan® 光线追踪支持与 DirectX® 光线追踪支持几乎相同。
当可视化来自使用 Vulkan® 光线追踪 API 的应用程序的配置文件数据时,您将看到以下一个或多个事件:
vkCmdTraceRaysKHR<Indirect>
vkCmdTraceRaysKHR<Unified>
vkCmdTraceRaysIndirectKHR<Indirect>
vkCmdTraceRaysIndirectKHR<Unified>
vkCmdBuildAccelerationStructuresKHR
vkCmdBuildAccelerationStructuresIndirectKHR
vkCmdCopyAccelerationStructureKHR
vkCmdCopyAccelerationStructureToMemoryKHR
vkCmdCopyMemoryToAccelerationStructureKHR
您看到的具体事件将取决于被分析的应用程序如何使用 Vulkan® 光线追踪 API。您可以在本文中阅读有关光线追踪支持的更多信息,其中还包含对 vkCmdTraceRaysKHR 和 vkCmdTraceRaysIndirectKHR 的 <Unified> 和 <Indirect> 变体之间差异的描述。
此外,还有一些其他小的更新:

WinPIXEventRuntime 头文件 – 请查阅最新文档,了解有关将 PIX 标记与 RGP 配合使用的说明。与所有 RGP 版本一样,此次发布包含许多旨在提高质量的其他更改。
请访问 RGP 产品页面,您可以在那里找到下载 RGP 1.10 的链接。并且,欢迎通过 GitHub RGP 页面 上的“Issues”部分与我们联系。我们重视所有提供的反馈。