使用 HIP RT 光线追踪库加速流体模拟

首次发布：2023 年 11 月 9 日

最后更新：2024 年 6 月 26 日

作者：Tianchen Xu

原田孝裕 (Takahiro Harada)

引言

HIP RT 是一个主要用于加速光线追踪应用程序的光线追踪库。然而，由于该库的通用性，它也可用于不同领域的应用程序。在本博文中，我们将介绍 HIP RT 在物理模拟中的一个有趣应用。具体来说，我们展示了如何使用 HIP RT 来加速平滑粒子流体动力学 (SPH) 模拟 [1] 中的邻域搜索。虽然加速粒子流体模拟在 GPU 上的研究由来已久 [2]，但正如您从这篇博文中了解到的，HIP RT 使在 GPU 上实现 SPH 模拟变得容易。

在不考虑不可压缩性的基本 SPH 实现方面，计算成本最高的过程是粒子邻域搜索。在各种用于邻域搜索的数据结构中，存在结构化和非结构化组织。均匀网格是一种典型的结构化组织，它将模拟空间划分为均匀的单元格。这也表明模拟空间受限于网格的范围，因为它为网格定义的整个空间分配了内存。与此同时，包围盒层次结构 (BVH) 是一种非结构化组织。虽然在 BVH 上的搜索通常不如使用均匀网格快 [3]，但使用 BVH 的优势在于我们无需限制模拟空间。因此，对于大规模场景，它能够提供更好的灵活性，并为稀疏分布的粒子节省内存空间。

在这里，我们开始看到这两个应用程序之间的一些共同点，即空间加速数据结构 BVH。大多数光线追踪实现都使用 BVH 方案，例如 DirectX 和 Vulkan 光线追踪 (DXR 和 Vulkan RT)。根据 DXR 和 Vulkan RT 规范 [4, 5]，仅当相交光线长度 t 值满足 $T_\text{min} \lt t \lt T_{max}$ 时才能发生光线与三角形的相交。光线与程序化图元的相交，只有当相交 t 值满足 $T_\text{min} \leq t \leq T_\text{max}$ 时才能发生。HIP RT 也采用了相同的规则。因此，如果我们改变光线为一个零长度光线，我们就可以用它来查找点与轴对齐包围盒 (AABB) 的交集，这正是我们在粒子流体模拟中需要执行的操作。找到邻近粒子后，我们需要从它们计算一些物理量，这可以通过自定义相交函数来实现，HIP RT 也提供了该函数。因此，我们拥有了使用 HIP RT 实现 SPH 模拟所需的所有组件。

关于 SPH 流体模拟

平滑粒子流体动力学 (SPH) 是一种基于粒子的流体模拟方法，与欧拉网格方法相对，也称为拉格朗日方法。它关注受其他粒子影响的每个粒子的动态属性，例如密度、力（或加速度）、速度和位置。对于每个粒子 $i$ ，在位置 $\mathbf{r}_i$ 处，其属性量 $A_i$ 通过以下模型 [6] 以核密度估计 (KDE) 的形式（所有粒子的贡献的加权和）进行插值：

A_i(\mathbf{r}_i) = \sum_j m_j \dfrac{A_j}{\rho_j}W\left(\mathbf{r}_i - \mathbf{r}_j, h\right) \tag{1}

W_\text{poly6}(\mathbf{r}, h) = \begin{cases} \dfrac{315}{64\pi h^9}\left(h^2 - \mathbf{r}^2\right)^3 & 0 \leq \|\mathbf{r}\| \leq h\\ 0 & \text{otherwise} \end{cases} \tag{3}

作者：Tianchen Xu

Tianchen Xu 是 AMD 上海 Khronos3D 团队的研究员和技术支持（MTS）软件开发工程师。

原田孝裕 (Takahiro Harada)

Takahiro Harada 是 AMD 的一名研究员，也是一款名为 Radeon ProRender 的 GPU 全局照明渲染器的架构师。

相关新闻和技术文章

使用 HIP 实现应用程序的可移植性

这篇博文讨论了开发人员可以利用的各种 ROCm 工具，将现有应用程序从 CUDA 移植到 HIP。

HIP RT v2.2 介绍

随着 v2.2 的发布，HIP RT 现在支持多级实例化。多级实例化有助于减少内存需求，使您能够使用有限的内存渲染大型场景。

HIP RT v2.1 介绍 - 批量几何体构建、变换查询函数等

HIP Ray Tracing v2.1 增加了对批量构建、全局/动态堆栈、变换查询函数以及其他新功能的支持。

使用 HIP 和 OpenMP 卸载的 Jacobi 求解器

在这篇博文中，我们探讨了使用 HIP 和 OpenMP target 指令进行 GPU 卸载，并讨论了它们在实现工作量和性能方面的相对优势。

HIP Ray Tracing 2.0 引入了改进的自定义函数处理、Bitcode 链接等功能

HIPRT-v2 现已可供下载！本文介绍了一些最令人兴奋的功能和优化。

推出 HIP RT – HIP 中的光线追踪库

HIP RT 是 HIP 的新光线追踪库。它使得使用 HIP 编写光线追踪应用程序变得容易。有关更多信息，请访问此页面。

推出 Orochi – 从单个二进制文件中动态加载 HIP/CUDA®

Orochi 是一个在运行时动态加载 HIP 和 CUDA 驱动程序 API 的库，消除了维护独立后端的开销。

2024 年 HPG 会议亮点：四篇令人兴奋的新研究论文

了解更多关于我们获奖的新论文，涵盖 HIP RT、光线追踪、几何压缩和使用工作图（work graphs）的程序化生成。