Deep Reinforcement Learning-Based Joint Satellite Scheduling and Resource Allocation in Satellite-Terrestrial Integrated Networks

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Parameters</td><td class="align_center">Value</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">Batch size</td><td class="align_center">32</td></tr><tr><td class="align_left">Learning rate <i>α</i></td><td class="align_center">0.005</td></tr><tr><td class="align_left">Number of leaves of SumTree structure</td><td class="align_center">2000</td></tr><tr><td class="align_left">Number of neurons in input layer</td><td class="align_center">156</td></tr><tr><td class="align_left">Number of neurons in hidden layers</td><td class="align_center">64, 32</td></tr><tr><td class="align_left">Number of neurons in output layer</td><td class="align_center">24</td></tr><tr><td class="align_left">Discount rate <i>γ</i></td><td class="align_center">0.9</td></tr><tr><td class="align_left">Activation function</td><td class="align_center">ReLU</td></tr><tr><td class="align_left">Optimizer</td><td class="align_center">Gradient descent optimizer</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Parameters of PSDDQN algorithm.</div>

Wireless Communications and Mobile Computing

tab2

Table 2

Table 2: Deep Reinforcement Learning-Based Joint Satellite Scheduling and Resource Allocation in Satellite-Terrestrial Integrated Networks