schola.sb3.utils.SB3DQNModel
class schola.sb3.utils.SB3DQNModel(policy, action_space) : Bases: SB3ScholaModel
方法
__init__(policy, action_space) | 初始化内部 Module 状态,由 nn.Module 和 ScriptModule 共享。 |
add_module(name, module) | 将子模块添加到当前模块。 |
apply(fn) | 将 fn 递归地应用于每个子模块(由 .children() 返回)以及自身。 |
bfloat16() | 将所有浮点参数和缓冲区转换为 bfloat16 数据类型。 |
buffers([recurse]) | 返回模块缓冲区迭代器。 |
children() | 返回直接子模块的迭代器。 |
compile(*args, **kwargs) | 使用 torch.compile() 编译此模块的前向传播。 |
cpu() | 将所有模型参数和缓冲区移动到 CPU。 |
cuda([device]) | 将所有模型参数和缓冲区移动到 GPU。 |
double() | 将所有浮点参数和缓冲区转换为 double 数据类型。 |
eval() | 将模块设置为评估模式。 |
extra_repr() | 返回模块的额外表示。 |
float() | 将所有浮点参数和缓冲区转换为 float 数据类型。 |
forward(*args) | 定义每次调用时执行的计算。 |
get_buffer(target) | 如果存在,则返回由 target 指定的缓冲区,否则抛出错误。 |
get_extra_state() | 返回模块 state_dict 中应包含的任何额外状态。 |
get_logits(x) | |
get_parameter(target) | 如果存在,则返回由 target 指定的参数,否则抛出错误。 |
get_submodule(target) | 如果存在,则返回由 target 指定的子模块,否则抛出错误。 |
half() | 将所有浮点参数和缓冲区转换为 half 数据类型。 |
ipu([device]) | 将所有模型参数和缓冲区移动到 IPU。 |
load_state_dict(state_dict[, strict, assign]) | 将参数和缓冲区从 state_dict 复制到此模块及其子模块。 |
modules() | 返回网络中所有模块的迭代器。 |
mtia([device]) | 将所有模型参数和缓冲区移动到 MTIA。 |
named_buffers([prefix, recurse, ...]) | 返回模块缓冲区迭代器,同时生成缓冲区名称和缓冲区本身。 |
named_children() | 返回直接子模块的迭代器,同时生成模块名称和模块本身。 |
named_modules([memo, prefix, remove_duplicate]) | 返回网络中所有模块的迭代器,同时生成模块名称和模块本身。 |
named_parameters([prefix, recurse, ...]) | 返回模块参数迭代器,同时生成参数名称和参数本身。 |
parameters([recurse]) | 返回模块参数的迭代器。 |
register_backward_hook(hook) | 在模块上注册一个后向钩子。 |
register_buffer(name, tensor[, persistent]) | 向模块添加一个缓冲区。 |
register_forward_hook(hook, *[, prepend, ...]) | 在模块上注册一个前向钩子。 |
register_forward_pre_hook(hook, *[, ...]) | 在模块上注册一个前向预钩子。 |
register_full_backward_hook(hook[, prepend]) | 在模块上注册一个后向钩子。 |
register_full_backward_pre_hook(hook[, prepend]) | 在模块上注册一个后向预钩子。 |
register_load_state_dict_post_hook(hook) | 注册一个在模块调用 load_state_dict() 后运行的后钩子。 |
register_load_state_dict_pre_hook(hook) | 注册一个在模块调用 load_state_dict() 前运行的预钩子。 |
register_module(name, module) | add_module() 的别名。 |
register_parameter(name, param) | 向模块添加一个参数。 |
register_state_dict_post_hook(hook) | state_dict() 方法的后钩子注册。 |
register_state_dict_pre_hook(hook) | state_dict() 方法的预钩子注册。 |
requires_grad_([requires_grad]) | 更改 autograd 是否应记录此模块中参数的操作。 |
save_as_onnx(export_path[, onnx_opset]) | |
set_extra_state(state) | 设置加载的 state_dict 中包含的额外状态。 |
set_submodule(target, module) | 如果存在,则设置由 target 指定的子模块,否则抛出错误。 |
share_memory() | 参见 torch.Tensor.share_memory_()。 |
state_dict(*args[, destination, prefix, ...]) | 返回一个包含模块整个状态引用的字典。 |
to(*args, **kwargs) | 移动和/或转换参数和缓冲区。 |
to_empty(*, device[, recurse]) | 将参数和缓冲区移动到指定设备,而不复制存储。 |
train([mode]) | 将模块设置为训练模式。 |
type(dst_type) | 将所有参数和缓冲区转换为 dst_type。 |
xpu([device]) | 将所有模型参数和缓冲区移动到 XPU。 |
zero_grad([set_to_none]) | 重置所有模型参数的梯度。 |
属性
T_destination | |
call_super_init | |
dump_patches | |
training |
get_logits(x)