Multirobot Coverage Path Planning Based on Deep Q-Network in Unknown Environment

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_center" colspan="3"><i>R</i>1 = 1</td><td class="align_center" colspan="2">Average results from the 191<sup>th</sup> episode to the 200<sup>th</sup> episode</td></tr><tr class="thead"><td class="align_left"><i>R</i>2</td><td class="align_center"><i>R</i>3</td><td class="align_center"><i>R</i>4</td><td class="align_center">Coverage rate</td><td class="align_center">Repetition rate</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">10</td><td class="align_center">0</td><td class="align_center">−10</td><td class="align_center">96.8%</td><td class="align_center">378%</td></tr><tr><td class="align_left">10</td><td class="align_center">−0.01</td><td class="align_center">−1</td><td class="align_center">100%</td><td class="align_center">163.4%</td></tr><tr><td class="align_left">10</td><td class="align_center">−0.01</td><td class="align_center">−10</td><td class="align_center">98.8%</td><td class="align_center">306.8%</td></tr><tr><td class="align_left">10</td><td class="align_center">−0.1</td><td class="align_center">−1</td><td class="align_center">100%</td><td class="align_center">170.3%</td></tr><tr><td class="align_left">10</td><td class="align_center">−0.1</td><td class="align_center">−10</td><td class="align_center">100%</td><td class="align_center">197.7%</td></tr><tr><td class="align_left">100</td><td class="align_center">−0.01</td><td class="align_center">−1</td><td class="align_center">97.4%</td><td class="align_center">382%</td></tr><tr><td class="align_left">100</td><td class="align_center">−0.01</td><td class="align_center">−10</td><td class="align_center">95.4%</td><td class="align_center">356.3%</td></tr><tr><td class="align_left">100</td><td class="align_center">−0.1</td><td class="align_center">−1</td><td class="align_center">92%</td><td class="align_center">422.3%</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The average results of the last ten episodes when reward parameters change.</div>

Journal of Robotics

tab1

Table 1

Table 1: Multirobot Coverage Path Planning Based on Deep Q-Network in Unknown Environment