An Exoatmospheric Homing Guidance Law Based on Deep Q Network

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Hyperparameter</td><td class="align_center">Parameter value</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">Maximum iterations</td><td class="align_center">3000</td></tr><tr><td class="align_left">Discount factor</td><td class="align_center">0.996</td></tr><tr><td class="align_left"><i>Q</i> network learning rate</td><td class="align_center">0.001</td></tr><tr><td class="align_left">Capacity of experience replay memory</td><td class="align_center">100000</td></tr><tr><td class="align_left">Minibatch size</td><td class="align_center">64</td></tr><tr><td class="align_left">Target network update rate</td><td class="align_center">10</td></tr><tr><td class="align_left">Initial exploration</td><td class="align_center">0.8</td></tr><tr><td class="align_left">Final exploration</td><td class="align_center">0.01</td></tr><tr><td class="align_left">Reward coefficient</td><td class="align_center">0.05</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

International Journal of Aerospace Engineering

tab3

Table 3

Table 3: An Exoatmospheric Homing Guidance Law Based on Deep Q Network