kengz
diff --git a/Diff for: ‎job/cont_benchmark.json
-14 b/Diff for: ‎job/cont_benchmark.json
-14
diff --git a/Diff for: ‎job/roboschool_benchmark.json
+14 b/Diff for: ‎job/roboschool_benchmark.json
+14
diff --git a/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_gae_cont.json
-76 b/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_gae_cont.json
-76
diff --git a/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_gae_roboschool.json
+78 b/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_gae_roboschool.json
+78
diff --git a/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_nstep_cont.json
-76 b/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_nstep_cont.json
-76
diff --git a/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_nstep_roboschool.json
+78 b/Diff for: ‎slm_lab/spec/benchmark/a2c/a2c_nstep_roboschool.json
+78
@@ -0,0 +1,14 @@
+{
+  "slm_lab/spec/benchmark/a2c/a2c_nstep_roboschool.json": {
+    "a2c_nstep_roboschool": "train",
+  },
+  "slm_lab/spec/benchmark/a2c/a2c_gae_roboschool.json": {
+    "a2c_gae_roboschool": "train",
+  },
+  "slm_lab/spec/benchmark/ppo/ppo_roboschool.json": {
+    "ppo_roboschool": "train",
+  },
+  "slm_lab/spec/benchmark/sac/sac_roboschool.json": {
+    "sac_roboschool": "train",
+  }
+}
@@ -142,81 +142,5 @@
       "max_session": 4,
       "max_trial": 1
     }
-  },
-  "a2c_gae_roboschool": {
-    "agent": [{
-      "name": "A2C",
-      "algorithm": {
-        "name": "ActorCritic",
-        "action_pdtype": "default",
-        "action_policy": "default",
-        "explore_var_spec": null,
-        "gamma": 0.99,
-        "lam": 0.95,
-        "num_step_returns": null,
-        "entropy_coef_spec": {
-          "name": "no_decay",
-          "start_val": 0.0,
-          "end_val": 0.0,
-          "start_step": 0,
-          "end_step": 0
-        },
-        "val_loss_coef": 0.5,
-        "training_frequency": 2048
-      },
-      "memory": {
-        "name": "OnPolicyBatchReplay",
-      },
-      "net": {
-        "type": "MLPNet",
-        "shared": false,
-        "hid_layers": [64, 64],
-        "hid_layers_activation": "tanh",
-        "init_fn": "orthogonal_",
-        "normalize": false,
-        "batch_norm": false,
-        "clip_grad_val": 0.5,
-        "use_same_optim": false,
-        "loss_spec": {
-          "name": "MSELoss"
-        },
-        "actor_optim_spec": {
-          "name": "Adam",
-          "lr": 3e-4,
-        },
-        "critic_optim_spec": {
-          "name": "Adam",
-          "lr": 3e-4,
-        },
-        "lr_scheduler_spec": {
-          "name": "LinearToZero",
-          "frame": 1e6
-        },
-        "gpu": true
-      }
-    }],
-    "env": [{
-      "name": "${env}",
-      "num_envs": 32,
-      "max_t": null,
-      "max_frame": 1e6
-    }],
-    "body": {
-      "product": "outer",
-      "num": 1
-    },
-    "meta": {
-      "distributed": false,
-      "log_frequency": 1000,
-      "eval_frequency": 1000,
-      "rigorous_eval": 0,
-      "max_session": 4,
-      "max_trial": 1
-    },
-    "spec_params": {
-      "env": [
-        "RoboschoolAnt-v1", "RoboschoolHalfCheetah-v1", "RoboschoolHopper-v1", "RoboschoolWalker2d-v1"
-      ]
-    }
   }
 }
@@ -0,0 +1,78 @@
+{
+  "a2c_gae_roboschool": {
+    "agent": [{
+      "name": "A2C",
+      "algorithm": {
+        "name": "ActorCritic",
+        "action_pdtype": "default",
+        "action_policy": "default",
+        "explore_var_spec": null,
+        "gamma": 0.99,
+        "lam": 0.95,
+        "num_step_returns": null,
+        "entropy_coef_spec": {
+          "name": "no_decay",
+          "start_val": 0.0,
+          "end_val": 0.0,
+          "start_step": 0,
+          "end_step": 0
+        },
+        "val_loss_coef": 0.5,
+        "training_frequency": 2048
+      },
+      "memory": {
+        "name": "OnPolicyBatchReplay",
+      },
+      "net": {
+        "type": "MLPNet",
+        "shared": false,
+        "hid_layers": [64, 64],
+        "hid_layers_activation": "tanh",
+        "init_fn": "orthogonal_",
+        "normalize": false,
+        "batch_norm": false,
+        "clip_grad_val": 0.5,
+        "use_same_optim": false,
+        "loss_spec": {
+          "name": "MSELoss"
+        },
+        "actor_optim_spec": {
+          "name": "Adam",
+          "lr": 3e-4,
+        },
+        "critic_optim_spec": {
+          "name": "Adam",
+          "lr": 3e-4,
+        },
+        "lr_scheduler_spec": {
+          "name": "LinearToZero",
+          "frame": 1e6
+        },
+        "gpu": true
+      }
+    }],
+    "env": [{
+      "name": "${env}",
+      "num_envs": 32,
+      "max_t": null,
+      "max_frame": 1e6
+    }],
+    "body": {
+      "product": "outer",
+      "num": 1
+    },
+    "meta": {
+      "distributed": false,
+      "log_frequency": 1000,
+      "eval_frequency": 1000,
+      "rigorous_eval": 0,
+      "max_session": 4,
+      "max_trial": 1
+    },
+    "spec_params": {
+      "env": [
+        "RoboschoolAnt-v1", "RoboschoolHalfCheetah-v1", "RoboschoolHopper-v1", "RoboschoolWalker2d-v1"
+      ]
+    }
+  }
+}
@@ -135,81 +135,5 @@
       "max_session": 4,
       "max_trial": 1
     }
-  },
-  "a2c_nstep_roboschool": {
-    "agent": [{
-      "name": "A2C",
-      "algorithm": {
-        "name": "ActorCritic",
-        "action_pdtype": "default",
-        "action_policy": "default",
-        "explore_var_spec": null,
-        "gamma": 0.99,
-        "lam": null,
-        "num_step_returns": 5,
-        "entropy_coef_spec": {
-          "name": "no_decay",
-          "start_val": 0.0,
-          "end_val": 0.0,
-          "start_step": 0,
-          "end_step": 0
-        },
-        "val_loss_coef": 0.5,
-        "training_frequency": 2048
-      },
-      "memory": {
-        "name": "OnPolicyBatchReplay",
-      },
-      "net": {
-        "type": "MLPNet",
-        "shared": false,
-        "hid_layers": [64, 64],
-        "hid_layers_activation": "tanh",
-        "init_fn": "orthogonal_",
-        "normalize": false,
-        "batch_norm": false,
-        "clip_grad_val": 0.5,
-        "use_same_optim": false,
-        "loss_spec": {
-          "name": "MSELoss"
-        },
-        "actor_optim_spec": {
-          "name": "Adam",
-          "lr": 3e-4,
-        },
-        "critic_optim_spec": {
-          "name": "Adam",
-          "lr": 3e-4,
-        },
-        "lr_scheduler_spec": {
-          "name": "LinearToZero",
-          "frame": 1e6
-        },
-        "gpu": true
-      }
-    }],
-    "env": [{
-      "name": "${env}",
-      "num_envs": 32,
-      "max_t": null,
-      "max_frame": 1e6
-    }],
-    "body": {
-      "product": "outer",
-      "num": 1
-    },
-    "meta": {
-      "distributed": false,
-      "log_frequency": 1000,
-      "eval_frequency": 1000,
-      "rigorous_eval": 0,
-      "max_session": 4,
-      "max_trial": 1
-    },
-    "spec_params": {
-      "env": [
-        "RoboschoolAnt-v1", "RoboschoolHalfCheetah-v1", "RoboschoolHopper-v1", "RoboschoolWalker2d-v1"
-      ]
-    }
   }
 }
@@ -0,0 +1,78 @@
+{
+  "a2c_nstep_roboschool": {
+    "agent": [{
+      "name": "A2C",
+      "algorithm": {
+        "name": "ActorCritic",
+        "action_pdtype": "default",
+        "action_policy": "default",
+        "explore_var_spec": null,
+        "gamma": 0.99,
+        "lam": null,
+        "num_step_returns": 5,
+        "entropy_coef_spec": {
+          "name": "no_decay",
+          "start_val": 0.0,
+          "end_val": 0.0,
+          "start_step": 0,
+          "end_step": 0
+        },
+        "val_loss_coef": 0.5,
+        "training_frequency": 2048
+      },
+      "memory": {
+        "name": "OnPolicyBatchReplay",
+      },
+      "net": {
+        "type": "MLPNet",
+        "shared": false,
+        "hid_layers": [64, 64],
+        "hid_layers_activation": "tanh",
+        "init_fn": "orthogonal_",
+        "normalize": false,
+        "batch_norm": false,
+        "clip_grad_val": 0.5,
+        "use_same_optim": false,
+        "loss_spec": {
+          "name": "MSELoss"
+        },
+        "actor_optim_spec": {
+          "name": "Adam",
+          "lr": 3e-4,
+        },
+        "critic_optim_spec": {
+          "name": "Adam",
+          "lr": 3e-4,
+        },
+        "lr_scheduler_spec": {
+          "name": "LinearToZero",
+          "frame": 1e6
+        },
+        "gpu": true
+      }
+    }],
+    "env": [{
+      "name": "${env}",
+      "num_envs": 32,
+      "max_t": null,
+      "max_frame": 1e6
+    }],
+    "body": {
+      "product": "outer",
+      "num": 1
+    },
+    "meta": {
+      "distributed": false,
+      "log_frequency": 1000,
+      "eval_frequency": 1000,
+      "rigorous_eval": 0,
+      "max_session": 4,
+      "max_trial": 1
+    },
+    "spec_params": {
+      "env": [
+        "RoboschoolAnt-v1", "RoboschoolHalfCheetah-v1", "RoboschoolHopper-v1", "RoboschoolWalker2d-v1"
+      ]
+    }
+  }
+}