DDPG w/ :RoboschoolHopper-v1 #24

CUN-bjy · 2020-12-31T11:48:15Z

No description provided.

CUN-bjy · 2020-12-31T12:14:42Z

experiment specifications
hyperparameter:

buffer_size = 20000, batch_size = 128
prioritized buffer : False
learning_rate: 1e-4,1e-3 for actor, critic
tau(target update rate): 1e-3,1e-3 for actor, critic

network

actor:

  # input layer(observations)
  input_ = Input(shape=self.obs_dim)

  # hidden layer 1
  h1_ = Dense(300,kernel_initializer=GlorotNormal())(input_)
  h1_b = BatchNormalization()(h1_)
  h1 = Activation('relu')(h1_b)

  # hidden_layer 2
  h2_ = Dense(400,kernel_initializer=GlorotNormal())(h1)
  h2_b = BatchNormalization()(h2_)
  h2 = Activation('relu')(h2_b)

  # output layer(actions)
  output_ = Dense(self.act_dim,kernel_initializer=GlorotNormal())(h2)
  output_b = BatchNormalization()(output_)
  output = Activation('tanh')(output_b)
  scalar = self.act_range * np.ones(self.act_dim)
  out = Lambda(lambda i: i * scalar)(output)

critic

  # input layer(observations and actions)
  input_obs = Input(shape=self.obs_dim)
  input_act = Input(shape=(self.act_dim,))
  inputs = [input_obs,input_act]
  concat = Concatenate(axis=-1)(inputs)

  # hidden layer 1
  h1_ = Dense(300, kernel_initializer=GlorotNormal(), kernel_regularizer=l2(0.01))(concat)
  h1_b = BatchNormalization()(h1_)
  h1 = Activation('relu')(h1_b)

  # hidden_layer 2
  h2_ = Dense(400, kernel_initializer=GlorotNormal(), kernel_regularizer=l2(0.01))(h1)
  h2_b = BatchNormalization()(h2_)
  h2 = Activation('relu')(h2_b)

  # output layer(actions)
  output_ = Dense(1, kernel_initializer=GlorotNormal(), kernel_regularizer=l2(0.01))(h2)
  output_b = BatchNormalization()(output_)
  output = Activation('linear')(output_b)

Results

max_timestep per 1epi: 500

3500epi
5000epi

Performance

Critic Loss

CUN-bjy · 2021-01-01T04:23:03Z

training time : 5500epi(about 7 hours)
on intel i7 cpu

CUN-bjy changed the title ~~DDPG w/ RoboschoolHopper-v1~~ DDPG w/ :RoboschoolHopper-v1 Dec 31, 2020

CUN-bjy self-assigned this Jan 1, 2021

CUN-bjy closed this as completed Jan 1, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

DDPG w/ :RoboschoolHopper-v1 #24

DDPG w/ :RoboschoolHopper-v1 #24

CUN-bjy commented Dec 31, 2020

CUN-bjy commented Dec 31, 2020 •

edited

Loading

CUN-bjy commented Jan 1, 2021

DDPG w/ :RoboschoolHopper-v1 #24

DDPG w/ :RoboschoolHopper-v1 #24

Comments

CUN-bjy commented Dec 31, 2020

CUN-bjy commented Dec 31, 2020 • edited Loading

Results

Performance

Critic Loss

CUN-bjy commented Jan 1, 2021

CUN-bjy commented Dec 31, 2020 •

edited

Loading