Diversity Evolutionary Policy Deep Reinforcement Learning

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Hyperparameter</td><td class="align_center">Values</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">Critic/actor learning rate</td><td class="align_center">0.0003</td></tr><tr><td class="align_left">Critic/actor hidden layer</td><td class="align_center">2</td></tr><tr><td class="align_left">Number of neurons</td><td class="align_center">400/300</td></tr><tr><td class="align_left">Critic activation</td><td class="align_center">Relu</td></tr><tr><td class="align_left">Actor activation</td><td class="align_center">Tanh</td></tr><tr><td class="align_left">Discount factor</td><td class="align_center">0.99</td></tr><tr><td class="align_left">Optimizer</td><td class="align_center">Adam</td></tr><tr><td class="align_left">Soft update coefficient</td><td class="align_center">0.005</td></tr><tr><td class="align_left">Experience pool capacity</td><td class="align_center">10<sup>6</sup></td></tr><tr><td class="align_left">Experience pool sample size</td><td class="align_center">100</td></tr><tr><td class="align_left">Gauss noise</td><td class="align_center">Clip ((0, 0.2), −0.5, 0.5)</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

Computational Intelligence and Neuroscience

tab2

Table 2

Table 2: Diversity Evolutionary Policy Deep Reinforcement Learning