A Method of Multi-UAV Cooperative Task Assignment Based on Reinforcement Learning

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Parameter</td><td class="align_center">Value</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">Number of UAVs</td><td class="align_center">3</td></tr><tr><td class="align_left">Number of tasks</td><td class="align_center">3</td></tr><tr><td class="align_left">Number of obstacles</td><td class="align_center">1</td></tr><tr><td class="align_left">Number of base stations</td><td class="align_center">1</td></tr><tr><td class="align_left">Steps of episode</td><td class="align_center">35</td></tr><tr><td class="align_left">Capacity of replay buffer</td><td class="align_center">1000000</td></tr><tr><td class="align_left">Number of network neurons</td><td class="align_center">128</td></tr><tr><td class="align_left">Learning rate</td><td class="align_center">0.001</td></tr><tr><td class="align_left">Discount factor of reward</td><td class="align_center">0.99</td></tr><tr><td class="align_left">Update ratio of target network <svg height="6.1673pt" id="M92" style="vertical-align:-0.2063904pt" version="1.1" viewbox="-0.0498162 -5.96091 6.40217 6.1673" width="6.40217pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M471 456L444 459C426 433 414 430 388 430C324 430 270 434 216 434C103 434 51 374 23 338L43 317C96 366 146 380 221 375L154 109C149 86 147 68 147 52C147 4 168 -12 197 -12C240 -12 291 25 334 71L320 96C295 75 268 58 252 58C238 58 227 79 238 138C251 211 272 296 292 372C310 372 332 368 350 368C391 368 421 369 434 371C444 388 455 413 471 456Z"></path></g></svg></td><td class="align_center">0.001</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

Mobile Information Systems

tab2

Table 2

Table 2: A Method of Multi-UAV Cooperative Task Assignment Based on Reinforcement Learning