跳至内容

FRLlibPPOSettings

struct FRLlibPPOSettings : public FTrainingSettings

一个结构体,用于保存 RLLib 训练脚本的近端策略优化 (PPO) 设置。

注意:这是 PPO 设置的局部实现,并非详尽无遗

依赖项: FScriptArgBuilder, FTrainingSettings

继承自: public FTrainingSettings

公共接口

析构函数

~FRLlibPPOSettings

virtual ~FRLlibPPOSettings()

属性: virtual

来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 31 行, 第 9 列)

实现: Schola/Source/Schola/Private/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.cpp (第 13-16 行)

公共函数

GenerateTrainingArgs

virtual void GenerateTrainingArgs(int Port, FScriptArgBuilder &ArgBuilder) const const

使用 ArgBuilder 为脚本生成训练参数。

注意:端口作为脚本的常见参数传入,并在高层设置,但特定子设置可能需要它。

参数

  • Port (int) – [输入] 用于脚本的端口
  • ArgBuilder (FScriptArgBuilder &) – [输入] 用于生成参数的构建器

属性: const, virtual

来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 29 行, 第 6 列)

实现: Schola/Source/Schola/Private/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.cpp (第 5-11 行)

公共成员

float GAELambda

float GAELambda = = 0.95

来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 21 行, 第 11 列)

float ClipParam

float ClipParam = = 0.2

来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 24 行, 第 11 列)

bool bUseGAE

bool bUseGAE = = true

来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 27 行, 第 10 列)

被使用: FRLlibTrainingSettings

来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 15 行, 第 1 列)

© . This site is unofficial and not affiliated with AMD.