schola.sb3.utils.RenderImagesWrapper

类定义

class schola.sb3.utils.RenderImagesWrapper(venv)

基类： VecEnvWrapper

将图像观察渲染到交互式 matplotlib 窗口。它假定观察是方形 RGB 图像，并尝试将任何 box 观察重塑为 3xLxL。

参数

venv

类型： VecEnv
被包装的向量化环境。

属性

unwrapped

方法

init

__init__(venv)

参数

venv (VecEnv)

close

close()

清理环境的资源。

convert_to_plt_format

convert_to_plt_format(obs)

转换为 matplotlib 支持的格式。(例如 (W,H), (W,H,3) 和 (W,H,4))。无通道或通道优先，从通道优先。

参数

obs (np.ndarray) – 要转换的观察

返回： 转换后的观察。

返回类型: np.ndarray

env_is_wrapped

env_is_wrapped(wrapper_class, indices=None)

检查环境是否已用给定包装器包装。

env_method

env_method(method_name, *method_args, indices=None, **method_kwargs)

调用向量化环境的实例方法。

get_attr

get_attr(attr_name, indices=None)

从向量化环境返回属性。

get_images

get_images()

在可能的情况下，从每个环境中返回 RGB 图像。

getattr_depth_check

getattr_depth_check(name, already_found)

请参阅基类。

getattr_recursive

getattr_recursive(name)

递归检查包装器以查找属性。

render

render(mode="human")

Gym 环境渲染。

reset

reset()

重置所有环境并返回观察数组，或观察数组的元组。

如果 step_async 仍在进行工作，则该工作将被取消，并且在再次调用 step_async() 之前不应调用 step_wait()。

返回值: 观察

返回类型： ndarray | Dict[str, ndarray] | Tuple[ndarray, ...]

seed

seed(seed=None)

根据给定的种子设置所有环境的随机种子。

set_attr

set_attr(attr_name, value, indices=None)

在向量化环境中设置属性。

step

step(action)

使用给定的动作来步进环境。

参数

action (ndarray) – 动作

返回值: 观察、奖励、完成、信息

返回类型： Tuple[ndarray | Dict[str, ndarray] | Tuple[ndarray, ...], ndarray, ndarray, List[Dict]]

step_async

step_async(actions)

告知所有环境使用给定的动作开始步进。调用 step_wait() 以获取步进结果。

如果您有待处理的 step_async 运行，则不应调用此方法。

参数

actions (ndarray)

返回类型： None

step_wait

step_wait()

等待 step_async() 完成的步进。

返回值: 观察、奖励、完成、信息

返回类型： Tuple[ndarray | Dict[str, ndarray] | Tuple[ndarray, ...], ndarray, ndarray, List[Dict]]

update_images

update_images(obs)

使用给定的观察更新 plt 窗口中的图像。

参数

obs (Dict[str, np.ndarray]) – 将观察的名称映射到观察数据

返回： 原始观察。

返回类型： Dict[str, np.ndarray]