pytorchrl.agent.storages package

Submodules

class pytorchrl.agent.storages.base.Storage(size, device, actor, algorithm, *args)[source]

Bases: abc.ABC

Base class for all storage components. It should serve as a template to create new Storage classes with new or extended features.

abstract after_gradients(actor, algo, info, *args)[source]

Steps required after updating actor policy model

Parameters

Returns

info – info dict updated with relevant info from Storage.

Return type

dict

abstract before_gradients(actor, algo, *args)[source]

Steps required before updating actor policy model.

Parameters

abstract classmethod create_factory(size, *args)[source]

Returns a function to create new Storage instances.

abstract generate_batches(num_mini_batch, mini_batch_size, num_epochs=1, *args)[source]

Returns a batch iterator to update actor critic.

Parameters

Yields

batch (dict) – Generated data batches.

abstract get_all_buffer_data(data_to_cpu=False, *args)[source]: Return all currently stored data. If data_to_cpu, moves data tensors to cpu memory.

abstract init_tensors(sample, *args)[source]

Lazy initialization of data tensors from a sample.

Parameters: sample (dict) – Data sample (containing all tensors of an environment transition)

abstract insert_data_slice(new_data, *args)[source]

Add new_data to the buffer stored data.

Parameters: new_data (dict) – Dictionary of env transition samples to replace self.data with.

abstract insert_transition(sample, *args)[source]

Store new transition sample.

Parameters: sample (dict) – Data sample (containing all tensors of an environment transition)

abstract reset(*args)[source]: Set class counters to zero and remove stored data

abstract update_storage_parameter(parameter_name, new_parameter_value, *args)[source]

If parameter_name is an attribute of the algorithm, change its value to new_parameter_value value.

Parameters