End-to-End Autonomous Exploration with Deep Reinforcement Learning and Intrinsic Motivation

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_left">Method</td><td class="align_center">Environment</td><td class="align_center">TC-network (%)</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left" rowspan="4">Pretraining</td><td class="align_center">Parameter selection</td><td class="align_center">92.36</td></tr><tr><td class="align_center">Maze-1</td><td class="align_center">84.52</td></tr><tr><td class="align_center">Maze-2</td><td class="align_center">85.14</td></tr><tr><td class="align_center">Maze-3</td><td class="align_center">78.32</td></tr><tr><td class="align_left" rowspan="3">Targeted training</td><td class="align_center">Maze-1</td><td class="align_center">93.16</td></tr><tr><td class="align_center">Maze-2</td><td class="align_center">92.67</td></tr><tr><td class="align_center">Maze-3</td><td class="align_center">92.03</td></tr><tr><td class="align_left" rowspan="4">Generalization training</td><td class="align_center">Maze-1/Maze-2</td><td class="align_center">90.89</td></tr><tr><td class="align_center">Maze-1/Maze-3</td><td class="align_center">91.35</td></tr><tr><td class="align_center">Maze-2/Maze-3</td><td class="align_center">90.62</td></tr><tr><td class="align_center">Maze-1/Maze-2/Maze-3</td><td class="align_center">90.28</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The secondary training results for TC-network.</div>

Computational Intelligence and Neuroscience

tab4

Table 4

Table 4: End-to-End Autonomous Exploration with Deep Reinforcement Learning and Intrinsic Motivation