Radeon™ GPU Profiler v1.10 引入 GPU 缓存计数器、Vulkan® 光线追踪等

首次发布时间:
Chris Hesik's avatar
Chris Hesik

Radeon™ GPU Profiler (RGP) 又迎来一次更新!

RGP 是我们一款开创性的低级优化工具,可提供有关 Radeon™ GPU 的详细信息。

本次最新版本 v1.10 增加了对以下内容的支持:

以及 更多功能!请继续阅读了解详情。

缓存计数器

虽然 RGP 一直以来都利用 Radeon GPU 的低级数据来帮助您深入了解游戏的性能,但在此版本中,我们将其提升了一个台阶。通过引入缓存计数器,您现在可以看到您的帧如何访问 GPU 内存层次结构的各个缓存级别。RGP 现在可以可视化来自 L0、L1 和 L2 内存缓存的数据,以及来自着色器核心指令和标量缓存的数据。

这些数据基于 GPU 硬件的流式性能度量 (SPM) 构建,提供了对硬件运行情况的独特洞察,并为您提供了优化着色器内存访问模式以实现更高性能的机会。

此功能支持 RDNA 和 RDNA 2 硬件,因此您需要拥有 Radeon RX 5000 系列 GPU 或更新的 GPU。要收集这些数据,只需在捕获配置文件时确保在 Radeon Developer Panel 中选中“Collect cache counters”选项。

当您在 RGP 中打开捕获的配置文件时,“Wavefront Occupancy”面板会有一个新的 UI 元素来可视化缓存数据。下面您可以看到收集到的五个缓存统计数据。图表显示了每个缓存随帧时间线的命中百分比。使用此视图,您可以将缓存统计数据与波前占用率和事件时间线相关联。

这是 RGP 中的样子(参见下图截图中的红色区域):

只需将鼠标悬停在图表上,即可查看在鼠标下方的图表点处有关每个缓存的更多详细信息,包括命中百分比、缓存请求数、命中数、未命中数。

您可以使用图表上方的“Counters”下拉菜单为任何缓存启用或禁用图表。在这里,我们取消选中了“Instruction”和“Scalar”缓存,因此图表将仅显示“L0”、“L1”和“L2”缓存计数器。

您还可以通过单击图表下方图例中对应项的颜色框来填充一个或多个图表下方的区域。

在这里,我们单击了紫色的“L0 cache hit”颜色框和红色的“L1 cache hit”颜色框,以填充两个折线图下方的区域。

想要更详细地了解每个统计数据的描述?只需将鼠标悬停在图例中的计数器名称上即可。

Vulkan® 光线追踪

此版本增加了对 Vulkan® 光线追踪的支持,该支持建立在 1.9 版本中引入的 DirectX® 光线追踪支持的基础上。实际上,Vulkan® 光线追踪支持与 DirectX® 光线追踪支持几乎相同。

当可视化来自使用 Vulkan® 光线追踪 API 的应用程序的配置文件数据时,您将看到以下一个或多个事件:

  • vkCmdTraceRaysKHR<Indirect>
  • vkCmdTraceRaysKHR<Unified>
  • vkCmdTraceRaysIndirectKHR<Indirect>
  • vkCmdTraceRaysIndirectKHR<Unified>
  • vkCmdBuildAccelerationStructuresKHR
  • vkCmdBuildAccelerationStructuresIndirectKHR
  • vkCmdCopyAccelerationStructureKHR
  • vkCmdCopyAccelerationStructureToMemoryKHR
  • vkCmdCopyMemoryToAccelerationStructureKHR

您看到的具体事件将取决于被分析的应用程序如何使用 Vulkan® 光线追踪 API。您可以在本文中阅读有关光线追踪支持的更多信息,其中还包含对 vkCmdTraceRaysKHRvkCmdTraceRaysIndirectKHR 的 <Unified> 和 <Indirect> 变体之间差异的描述。

其他更新

此外,还有一些其他小的更新:

  • Most expensive events”窗格中的事件表现在有一个额外的列显示“Work duration”。“Work duration”(在“Wavefront Occupancy”和“Event timing”窗格的“Details”面板中也显示)表示事件实际着色器运行的时间量。通过在“Most expensive events”表中显示此信息,您可以轻松地判断一个事件是因为着色器运行时间长而昂贵,还是由于其他原因导致事件花费了很长时间。

  • 我们进行了一些重大的性能增强,应该可以使在查看大型光线追踪配置文件时 UI 更加响应。
  • 我们还更新并修复了 RGP 用户界面多个部分的剪贴板支持 – 如果您之前在将 UI 中的某些数据复制到剪贴板时遇到问题,不妨尝试使用此版本再次操作。
  • RGP 中的 PIX3 标记支持已更新,以支持最新的 WinPIXEventRuntime 头文件 – 请查阅最新文档,了解有关将 PIX 标记与 RGP 配合使用的说明。

与所有 RGP 版本一样,此次发布包含许多旨在提高质量的其他更改。

请访问 RGP 产品页面,您可以在那里找到下载 RGP 1.10 的链接。并且,欢迎通过 GitHub RGP 页面 上的“Issues”部分与我们联系。我们重视所有提供的反馈。

进一步阅读

Chris Hesik's avatar

Chris Hesik

Chris Hesik 是 AMD 开发者工具组 Radeon™ GPU Profiler 的技术负责人。第三方网站链接仅为方便起见提供,除非另有明确说明,AMD 对此类链接网站的内容概不负责,也不暗示任何认可。

相关新闻和技术文章

相关视频

© . This site is unofficial and not affiliated with AMD.