schola.sb3.utils.VecMergeDictActionWrapper

类定义

class schola.sb3.utils.VecMergeDictActionWrapper(venv)

基类: VecEnvWrapper

将字典的动作合并为 1 个动作的向量化包装器。字典中的所有动作必须是兼容的类型。

参数

venv

类型: VecEnv
被包装的向量化环境。

属性

unwrapped

方法

init

__init__(venv)

参数

venv (VecEnv)

close

close()

清理环境的资源。

env_is_wrapped

env_is_wrapped(wrapper_class, indices=None)

检查环境是否已用给定包装器包装。

env_method

env_method(method_name, *method_args, indices=None, **method_kwargs)

调用向量化环境的实例方法。

get_attr

get_attr(attr_name, indices=None)

从向量化环境返回属性。

get_images

get_images()

在可能的情况下，从每个环境中返回 RGB 图像。

getattr_depth_check

getattr_depth_check(name, already_found)

参见基类。

getattr_recursive

getattr_recursive(name)

递归查找包装器以查找属性。

render

render(mode="human")

Gym 环境渲染。

reset

reset()

重置所有环境并返回观察数组，或观察数组的元组。

如果 step_async 仍在进行工作，则该工作将被取消，并且在再次调用 step_async() 之前不应调用 step_wait()。

返回值: 观察

返回类型: ndarray | Dict[str, ndarray] | Tuple[ndarray, ...]

seed

seed(seed=None)

根据给定的种子设置所有环境的随机种子。

set_attr

set_attr(attr_name, value, indices=None)

在向量化环境中设置属性。

step

step(action)

使用给定的动作来步进环境。

参数

action (ndarray) – 动作

返回值: 观察、奖励、完成、信息

返回类型: Tuple[ndarray | Dict[str, ndarray] | Tuple[ndarray, ...], ndarray, ndarray, List[Dict]]

step_async

step_async(actions)

告知所有环境使用给定的动作开始步进。调用 step_wait() 以获取步进结果。

如果您有待处理的 step_async 运行，则不应调用此方法。

参数

actions (ndarray)

返回类型： None

step_wait

step_wait()

等待 step_async() 完成的步进。

返回值: 观察、奖励、完成、信息

返回类型: Tuple[ndarray | Dict[str, ndarray] | Tuple[ndarray, ...], ndarray, ndarray, List[Dict]]