跳至内容

schola.scripts.sb3.utils

用于通过 Schola 和 stable baselines3 训练 NPCRL 的自定义回调类集合

Classes

CustomProgressBarCallbackSb3 中进度条的适配版本,从检查点恢复训练时从最后一个时间步开始。
RewardCallback用于在多环境设置中记录每个环境的奖励和步数的 callback。
SingleEnvRewardCallback记录向量环境中单个环境的奖励和步数的类的回调。
© . This site is unofficial and not affiliated with AMD.