schola.sb3.utils.RenderImagesWrapper
类定义
class schola.sb3.utils.RenderImagesWrapper(venv)基类: VecEnvWrapper
将图像观察渲染到交互式 matplotlib 窗口。它假定观察是方形 RGB 图像,并尝试将任何 box 观察重塑为 3xLxL。
参数
venv
类型: VecEnv
被包装的向量化环境。
属性
unwrapped
方法
__init__
__init__(venv)参数
- venv (
VecEnv)
close
close()清理环境的资源。
convert_to_plt_format
convert_to_plt_format(obs)转换为 matplotlib 支持的格式。(例如 (W,H), (W,H,3) 和 (W,H,4))。无通道或通道优先,从通道优先。
参数
- obs (
np.ndarray) – 要转换的观察
返回: 转换后的观察。
返回类型: np.ndarray
env_is_wrapped
env_is_wrapped(wrapper_class, indices=None)检查环境是否已用给定包装器包装。
env_method
env_method(method_name, *method_args, indices=None, **method_kwargs)调用向量化环境的实例方法。
get_attr
get_attr(attr_name, indices=None)从向量化环境返回属性。
get_images
get_images()在可能的情况下,从每个环境中返回 RGB 图像。
getattr_depth_check
getattr_depth_check(name, already_found)请参阅基类。
getattr_recursive
getattr_recursive(name)递归检查包装器以查找属性。
render
render(mode="human")Gym 环境渲染。
reset
reset()重置所有环境并返回观察数组,或观察数组的元组。
如果 step_async 仍在进行工作,则该工作将被取消,并且在再次调用 step_async() 之前不应调用 step_wait()。
返回值: 观察
返回类型: ndarray | Dict[str, ndarray] | Tuple[ndarray, ...]
seed
seed(seed=None)根据给定的种子设置所有环境的随机种子。
set_attr
set_attr(attr_name, value, indices=None)在向量化环境中设置属性。
step
step(action)使用给定的动作来步进环境。
参数
- action (
ndarray) – 动作
返回值: 观察、奖励、完成、信息
返回类型: Tuple[ndarray | Dict[str, ndarray] | Tuple[ndarray, ...], ndarray, ndarray, List[Dict]]
step_async
step_async(actions)告知所有环境使用给定的动作开始步进。调用 step_wait() 以获取步进结果。
如果您有待处理的 step_async 运行,则不应调用此方法。
参数
- actions (
ndarray)
返回类型: None
step_wait
step_wait()等待 step_async() 完成的步进。
返回值: 观察、奖励、完成、信息
返回类型: Tuple[ndarray | Dict[str, ndarray] | Tuple[ndarray, ...], ndarray, ndarray, List[Dict]]
update_images
update_images(obs)使用给定的观察更新 plt 窗口中的图像。
参数
- obs (
Dict[str, np.ndarray]) – 将观察的名称映射到观察数据
返回: 原始观察。
返回类型: Dict[str, np.ndarray]