2021490caa3555a7a704a69b254bbd5db16e285d,rl_coach/presets/Doom_Health_Supreme_DFP.py,,,#,16

Before Change



schedule_params = ScheduleParameters()
schedule_params.improve_steps = EnvironmentSteps(6250000)
schedule_params.steps_between_evaluation_periods = EnvironmentSteps(62500)
schedule_params.evaluation_steps = EnvironmentSteps(6250)

// There is no heatup for DFP. heatup length is determined according to batch size. See below.

After Change


agent_params.algorithm.goal_vector = [1]  // health

// this works better than the default which is set to 8 (while running with 8 workers)
agent_params.algorithm.num_consecutive_playing_steps = EnvironmentSteps(1)

// scale observation and measurements to be -0.5 <-> 0.5
agent_params.network_wrappers["main"].input_embedders_parameters["measurements"].input_rescaling["vector"] = 100.
agent_params.network_wrappers["main"].input_embedders_parameters["measurements"].input_offset["vector"] = 0.5

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 5

Instances

Link

Project Name: NervanaSystems/coach

Commit Name: 2021490caa3555a7a704a69b254bbd5db16e285d

Time: 2018-08-26

Author: gal.leibovich@intel.com

File Name: rl_coach/presets/Doom_Health_Supreme_DFP.py

Class Name:

Method Name:

Link

Project Name: NervanaSystems/coach

Commit Name: 2021490caa3555a7a704a69b254bbd5db16e285d

Time: 2018-08-26

Author: gal.leibovich@intel.com

File Name: rl_coach/presets/Doom_Health_DFP.py

Class Name:

Method Name:

Link

Project Name: NervanaSystems/coach

Commit Name: 9e9c4fd3322b6e8f47572fefdb8fd65018fb96f7

Time: 2019-05-27

Author: gal.leibovich@intel.com

File Name: rl_coach/presets/CartPole_DQN_BatchRL_BCQ.py

Class Name:

Method Name: