跳至内容

schola.sb3.utils.SB3DQNModel

class schola.sb3.utils.SB3DQNModel(policy, action_space) : Bases: SB3ScholaModel

方法

__init__(policy, action_space)初始化内部 Module 状态,由 nn.Module 和 ScriptModule 共享。
add_module(name, module)将子模块添加到当前模块。
apply(fn)fn 递归地应用于每个子模块(由 .children() 返回)以及自身。
bfloat16()将所有浮点参数和缓冲区转换为 bfloat16 数据类型。
buffers([recurse])返回模块缓冲区迭代器。
children()返回直接子模块的迭代器。
compile(*args, **kwargs)使用 torch.compile() 编译此模块的前向传播。
cpu()将所有模型参数和缓冲区移动到 CPU。
cuda([device])将所有模型参数和缓冲区移动到 GPU。
double()将所有浮点参数和缓冲区转换为 double 数据类型。
eval()将模块设置为评估模式。
extra_repr()返回模块的额外表示。
float()将所有浮点参数和缓冲区转换为 float 数据类型。
forward(*args)定义每次调用时执行的计算。
get_buffer(target)如果存在,则返回由 target 指定的缓冲区,否则抛出错误。
get_extra_state()返回模块 state_dict 中应包含的任何额外状态。
get_logits(x)
get_parameter(target)如果存在,则返回由 target 指定的参数,否则抛出错误。
get_submodule(target)如果存在,则返回由 target 指定的子模块,否则抛出错误。
half()将所有浮点参数和缓冲区转换为 half 数据类型。
ipu([device])将所有模型参数和缓冲区移动到 IPU。
load_state_dict(state_dict[, strict, assign])将参数和缓冲区从 state_dict 复制到此模块及其子模块。
modules()返回网络中所有模块的迭代器。
mtia([device])将所有模型参数和缓冲区移动到 MTIA。
named_buffers([prefix, recurse, ...])返回模块缓冲区迭代器,同时生成缓冲区名称和缓冲区本身。
named_children()返回直接子模块的迭代器,同时生成模块名称和模块本身。
named_modules([memo, prefix, remove_duplicate])返回网络中所有模块的迭代器,同时生成模块名称和模块本身。
named_parameters([prefix, recurse, ...])返回模块参数迭代器,同时生成参数名称和参数本身。
parameters([recurse])返回模块参数的迭代器。
register_backward_hook(hook)在模块上注册一个后向钩子。
register_buffer(name, tensor[, persistent])向模块添加一个缓冲区。
register_forward_hook(hook, *[, prepend, ...])在模块上注册一个前向钩子。
register_forward_pre_hook(hook, *[, ...])在模块上注册一个前向预钩子。
register_full_backward_hook(hook[, prepend])在模块上注册一个后向钩子。
register_full_backward_pre_hook(hook[, prepend])在模块上注册一个后向预钩子。
register_load_state_dict_post_hook(hook)注册一个在模块调用 load_state_dict() 后运行的后钩子。
register_load_state_dict_pre_hook(hook)注册一个在模块调用 load_state_dict() 前运行的预钩子。
register_module(name, module)add_module() 的别名。
register_parameter(name, param)向模块添加一个参数。
register_state_dict_post_hook(hook)state_dict() 方法的后钩子注册。
register_state_dict_pre_hook(hook)state_dict() 方法的预钩子注册。
requires_grad_([requires_grad])更改 autograd 是否应记录此模块中参数的操作。
save_as_onnx(export_path[, onnx_opset])
set_extra_state(state)设置加载的 state_dict 中包含的额外状态。
set_submodule(target, module)如果存在,则设置由 target 指定的子模块,否则抛出错误。
share_memory()参见 torch.Tensor.share_memory_()
state_dict(*args[, destination, prefix, ...])返回一个包含模块整个状态引用的字典。
to(*args, **kwargs)移动和/或转换参数和缓冲区。
to_empty(*, device[, recurse])将参数和缓冲区移动到指定设备,而不复制存储。
train([mode])将模块设置为训练模式。
type(dst_type)将所有参数和缓冲区转换为 dst_type
xpu([device])将所有模型参数和缓冲区移动到 XPU。
zero_grad([set_to_none])重置所有模型参数的梯度。

属性

T_destination
call_super_init
dump_patches
training

get_logits(x)

© . This site is unofficial and not affiliated with AMD.