Diversity Evolutionary Policy Deep Reinforcement Learning

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_left">Environment</td><td class="align_center">Action dimension/state dimension</td><td class="align_center">Task goals</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left">Hopper-v2</td><td class="align_center">3/11</td><td class="align_center">Make a two-dimensional one-legged robot hop forward as fast as possible</td></tr><tr><td class="align_left">HalfCheetah-v2</td><td class="align_center">6/17</td><td class="align_center">Make the 2D cheetah robot run fast</td></tr><tr><td class="align_left">Ant-v2</td><td class="align_center">8/111</td><td class="align_center">Make a four-legged creature walk forward as fast as possible</td></tr><tr><td class="align_left">Walker2d-v2</td><td class="align_center">6/17</td><td class="align_center">Make a two-dimensional bipedal robot walk forward as fast as possible</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The test environment in the MuJoCo benchmark.</div>

Computational Intelligence and Neuroscience

tab1

Table 1

Table 1: Diversity Evolutionary Policy Deep Reinforcement Learning