schola.sb3.utils.SB3DQNModel

class schola.sb3.utils.SB3DQNModel(policy, action_space) : Bases: SB3ScholaModel

方法


`__init__`(policy, action_space)	初始化内部 Module 状态，由 nn.Module 和 ScriptModule 共享。
`add_module`(name, module)	将子模块添加到当前模块。
`apply`(fn)	将 `fn` 递归地应用于每个子模块（由 `.children()` 返回）以及自身。
`bfloat16`()	将所有浮点参数和缓冲区转换为 `bfloat16` 数据类型。
`buffers`([recurse])	返回模块缓冲区迭代器。
`children`()	返回直接子模块的迭代器。
`compile`(args, *kwargs)	使用 `torch.compile()` 编译此模块的前向传播。
`cpu`()	将所有模型参数和缓冲区移动到 CPU。
`cuda`([device])	将所有模型参数和缓冲区移动到 GPU。
`double`()	将所有浮点参数和缓冲区转换为 `double` 数据类型。
`eval`()	将模块设置为评估模式。
`extra_repr`()	返回模块的额外表示。
`float`()	将所有浮点参数和缓冲区转换为 `float` 数据类型。
`forward`(*args)	定义每次调用时执行的计算。
`get_buffer`(target)	如果存在，则返回由 `target` 指定的缓冲区，否则抛出错误。
`get_extra_state`()	返回模块 `state_dict` 中应包含的任何额外状态。
`get_logits`(x)
`get_parameter`(target)	如果存在，则返回由 `target` 指定的参数，否则抛出错误。
`get_submodule`(target)	如果存在，则返回由 `target` 指定的子模块，否则抛出错误。
`half`()	将所有浮点参数和缓冲区转换为 `half` 数据类型。
`ipu`([device])	将所有模型参数和缓冲区移动到 IPU。
`load_state_dict`(state_dict[, strict, assign])	将参数和缓冲区从 `state_dict` 复制到此模块及其子模块。
`modules`()	返回网络中所有模块的迭代器。
`mtia`([device])	将所有模型参数和缓冲区移动到 MTIA。
`named_buffers`([prefix, recurse, ...])	返回模块缓冲区迭代器，同时生成缓冲区名称和缓冲区本身。
`named_children`()	返回直接子模块的迭代器，同时生成模块名称和模块本身。
`named_modules`([memo, prefix, remove_duplicate])	返回网络中所有模块的迭代器，同时生成模块名称和模块本身。
`named_parameters`([prefix, recurse, ...])	返回模块参数迭代器，同时生成参数名称和参数本身。
`parameters`([recurse])	返回模块参数的迭代器。
`register_backward_hook`(hook)	在模块上注册一个后向钩子。
`register_buffer`(name, tensor[, persistent])	向模块添加一个缓冲区。
`register_forward_hook`(hook, *[, prepend, ...])	在模块上注册一个前向钩子。
`register_forward_pre_hook`(hook, *[, ...])	在模块上注册一个前向预钩子。
`register_full_backward_hook`(hook[, prepend])	在模块上注册一个后向钩子。
`register_full_backward_pre_hook`(hook[, prepend])	在模块上注册一个后向预钩子。
`register_load_state_dict_post_hook`(hook)	注册一个在模块调用 `load_state_dict()` 后运行的后钩子。
`register_load_state_dict_pre_hook`(hook)	注册一个在模块调用 `load_state_dict()` 前运行的预钩子。
`register_module`(name, module)	`add_module()` 的别名。
`register_parameter`(name, param)	向模块添加一个参数。
`register_state_dict_post_hook`(hook)	`state_dict()` 方法的后钩子注册。
`register_state_dict_pre_hook`(hook)	`state_dict()` 方法的预钩子注册。
`requires_grad_`([requires_grad])	更改 autograd 是否应记录此模块中参数的操作。
`save_as_onnx`(export_path[, onnx_opset])
`set_extra_state`(state)	设置加载的 state_dict 中包含的额外状态。
`set_submodule`(target, module)	如果存在，则设置由 `target` 指定的子模块，否则抛出错误。
`share_memory`()	参见 `torch.Tensor.share_memory_()`。
`state_dict`(*args[, destination, prefix, ...])	返回一个包含模块整个状态引用的字典。
`to`(args, *kwargs)	移动和/或转换参数和缓冲区。
`to_empty`(*, device[, recurse])	将参数和缓冲区移动到指定设备，而不复制存储。
`train`([mode])	将模块设置为训练模式。
`type`(dst_type)	将所有参数和缓冲区转换为 `dst_type`。
`xpu`([device])	将所有模型参数和缓冲区移动到 XPU。
`zero_grad`([set_to_none])	重置所有模型参数的梯度。

属性


`T_destination`
`call_super_init`
`dump_patches`
`training`

get_logits(x)