FRLlibPPOSettings

struct FRLlibPPOSettings : public FTrainingSettings

一个结构体，用于保存 RLLib 训练脚本的近端策略优化 (PPO) 设置。

注意：这是 PPO 设置的局部实现，并非详尽无遗

依赖项： FScriptArgBuilder, FTrainingSettings

继承自： public FTrainingSettings

公共接口

析构函数

virtual ~FRLlibPPOSettings()

属性: virtual

来源： Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 31 行, 第 9 列)

实现： Schola/Source/Schola/Private/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.cpp (第 13-16 行)

公共函数

virtual void GenerateTrainingArgs(int Port, FScriptArgBuilder &ArgBuilder) const const

使用 ArgBuilder 为脚本生成训练参数。

注意：端口作为脚本的常见参数传入，并在高层设置，但特定子设置可能需要它。

参数

属性： const, virtual

来源： Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 29 行, 第 6 列)

实现： Schola/Source/Schola/Private/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.cpp (第 5-11 行)

公共成员

float GAELambda = = 0.95

来源： Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 21 行, 第 11 列)

float ClipParam = = 0.2

来源： Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 24 行, 第 11 列)

bool bUseGAE = = true

来源： Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 27 行, 第 10 列)

被使用： FRLlibTrainingSettings

来源： Schola/Source/Schola/Public/Subsystem/SubsystemSettings/Ray/Algorithms/RLlibPPOSettings.h (第 15 行, 第 1 列)