跳至内容

schola.scripts.sb3.utils

用于通过 Schola 和 stable baselines3 训练 NPCRL 的自定义回调类集合

Classes

CustomProgressBarCallback()Sb3 中进度条的适配版本,从检查点恢复训练时从最后一个时间步开始。
RewardCallback([verbose, frequency, num_envs])用于在多环境设置中记录每个环境的奖励和步数的 callback。
SingleEnvRewardCallback([verbose, id, frequency])记录向量环境中单个环境的奖励和步数的类的回调。
© . This site is unofficial and not affiliated with AMD.