schola.scripts.ray.settings.ResourceSettings
类定义
class schola.scripts.ray.settings.ResourceSettings(num_gpus=0, num_cpus=1, num_learners=0, num_cpus_for_main_process=1, num_cpus_per_learner=1, num_gpus_per_learner=0)基类: object
用于 RLlib 训练过程的资源设置的数据类。此类定义了分配计算资源的参数,包括用于训练作业的 GPU 和 CPU 数量。这些设置有助于控制训练过程的资源分配,从而影响性能和训练时间。这在集群或分布式环境中运行尤其重要。
参数
num_gpus
类型: int | None
num_cpus
类型: int | None
num_learners
类型: int | None
num_cpus_for_main_process
类型: int | None
num_cpus_per_learner
类型: int | None
num_gpus_per_learner
类型: int | None
属性
name
类型: str
num_cpus
类型: int | None
Default: 1
用于训练过程的总 CPU 数量。这指定了 RLlib 训练作业可用的 CPU 核心数。可用于跨多个 CPU 核心并行化训练过程,这有助于加快训练时间。
num_cpus_for_main_process
类型: int | None
Default: 1
为主进程分配的 CPU 数量。这是将分配给管理训练作业的主进程的 CPU 核心数。可用于确保主进程有足够的资源来处理工作负载并有效管理学习器进程。
num_cpus_per_learner
类型: int | None
Default: 1
为每个学习器进程分配的 CPU 数量。这指定了将分配给用于训练的每个单独学习器进程的 CPU 核心数。可用于确保每个学习器都有足够的资源来处理其工作负载并高效处理训练数据。
num_gpus
类型: int | None
默认: 0
用于训练过程的 GPU 数量。这指定了 RLlib 训练作业可用的 GPU 数量。如果设置为 0,则默认使用 CPU 进行训练。如果可用,可用于利用 GPU 加速以加快训练时间。
num_gpus_per_learner
类型: int | None
默认: 0
为每个学习器进程分配的 GPU 数量。这指定了将分配给用于训练的每个单独学习器进程的 GPU 数量。
num_learners
类型: int | None
默认: 0
用于训练作业的学习器进程数量。这指定了将用于训练模型的并行学习器进程数量。每个学习器将独立处理一部分训练数据并更新模型权重。通过利用多个 CPU 核心或 GPU,这有助于加快训练时间。
方法
__init__
__init__(num_gpus=0, num_cpus=1, num_learners=0, num_cpus_for_main_process=1, num_cpus_per_learner=1, num_gpus_per_learner=0)返回类型: None
populate_arg_group
classmethod populate_arg_group(args_group)