FRLlibPPOSettings
struct FRLlibPPOSettings : public FTrainingSettings一个结构体,用于保存 RLLib 训练脚本的近端策略优化 (PPO) 设置。
注意:这是 PPO 设置的局部实现,并非详尽无遗
依赖项: FScriptArgBuilder, FTrainingSettings
继承自: public FTrainingSettings
公共接口
析构函数
~FRLlibPPOSettings
virtual ~FRLlibPPOSettings()属性: virtual
来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 31 行, 第 9 列)
实现: Schola/Source/Schola/Private/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.cpp (第 13-16 行)
公共函数
GenerateTrainingArgs
virtual void GenerateTrainingArgs(int Port, FScriptArgBuilder &ArgBuilder) const const使用 ArgBuilder 为脚本生成训练参数。
注意:端口作为脚本的常见参数传入,并在高层设置,但特定子设置可能需要它。
参数
Port(int) – [输入] 用于脚本的端口ArgBuilder(FScriptArgBuilder &) – [输入] 用于生成参数的构建器
属性: const, virtual
来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 29 行, 第 6 列)
实现: Schola/Source/Schola/Private/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.cpp (第 5-11 行)
公共成员
float GAELambda
float GAELambda = = 0.95来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 21 行, 第 11 列)
float ClipParam
float ClipParam = = 0.2来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 24 行, 第 11 列)
bool bUseGAE
bool bUseGAE = = true来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 27 行, 第 10 列)
来源: Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 15 行, 第 1 列)