PPDRL: A Pretraining-and-Policy-Based Deep Reinforcement Learning Approach for QoS-Aware Service Composition

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="13"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">Problem #</td><td class="align_center" colspan="2">PPDRL</td><td class="align_center" colspan="2">MCOP_M</td><td class="align_center" colspan="2">GA</td><td class="align_center" colspan="2">PTR</td><td class="align_center" colspan="2">QLR</td><td class="align_center" colspan="2">DQN</td></tr><tr class="thead"><td class="align_center">Mean</td><td class="align_center">Var</td><td class="align_center">Mean</td><td class="align_center">Var</td><td class="align_center">Mean</td><td class="align_center">Var</td><td class="align_center">Mean</td><td class="align_center">Var</td><td class="align_center">Mean</td><td class="align_center">Var</td><td class="align_center">Mean</td><td class="align_center">Var</td></tr><tr><td class="thead-hr" colspan="13"><hr/></td></tr><tr><td class="align_left">Nodes 10</td><td class="align_center">0.32</td><td class="align_center">0.00</td><td class="align_center">0.24</td><td class="align_center">2.22e − 3</td><td class="align_center">0.32</td><td class="align_center">0.0000</td><td class="align_center">0.29</td><td class="align_center">6.83e − 5</td><td class="align_center">0.29</td><td class="align_center">1.19e − 4</td><td class="align_center">0.25</td><td class="align_center">2.45e − 4</td></tr><tr><td class="align_left">Nodes 30</td><td class="align_center">0.31</td><td class="align_center">0.00</td><td class="align_center">0.13</td><td class="align_center">4.23e − 3</td><td class="align_center">0.28</td><td class="align_center">4.38e − 3</td><td class="align_center">0.13</td><td class="align_center">1.55e − 5</td><td class="align_center">0.12</td><td class="align_center">5.54e − 5</td><td class="align_center">0.05</td><td class="align_center">1.44e − 4</td></tr><tr><td class="align_left">Nodes 50</td><td class="align_center">0.20</td><td class="align_center">0.0000</td><td class="align_center">0.08</td><td class="align_center">1.37e − 3</td><td class="align_center">0.20</td><td class="align_center">1.07e − 7</td><td class="align_center">0.13</td><td class="align_center">7.12e − 6</td><td class="align_center">0.13</td><td class="align_center">4.83e − 6</td><td class="align_center">0.06</td><td class="align_center">3.32e − 4</td></tr><tr><td class="align_left">Nodes 70</td><td class="align_center">0.15</td><td class="align_center">6.64e-12</td><td class="align_center">0.06</td><td class="align_center">2.89e − 4</td><td class="align_center">0.14</td><td class="align_center">1.02e − 6</td><td class="align_center">0.07</td><td class="align_center">1.49e − 5</td><td class="align_center">0.07</td><td class="align_center">2.22e − 5</td><td class="align_center">0.02</td><td class="align_center">1.72e − 4</td></tr><tr><td class="align_left">Nodes 90</td><td class="align_center">0.14</td><td class="align_center">0.0000</td><td class="align_center">0.05</td><td class="align_center">4.30e − 5</td><td class="align_center">0.13</td><td class="align_center">4.56e − 6</td><td class="align_center">0.04</td><td class="align_center">6.50e − 5</td><td class="align_center">0.03</td><td class="align_center">7.36e − 5</td><td class="align_center">-0.02</td><td class="align_center">3.48e − 5</td></tr><tr><td class="align_left">Nodes 100</td><td class="align_center">0.20</td><td class="align_center">7.54e-7</td><td class="align_center">0.09</td><td class="align_center">4.30e − 4</td><td class="align_center">0.18</td><td class="align_center">2.31e − 6</td><td class="align_center">0.09</td><td class="align_center">2.57e − 5</td><td class="align_center">0.08</td><td class="align_center">2.31e − 4</td><td class="align_center">0.05</td><td class="align_center">5.18e − 4</td></tr><tr class="table-tr"><td colspan="13"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The QoS values (mean and variance) on six different test cases.</div>

Security and Communication Networks

tab3

Table 3

Table 3: PPDRL: A Pretraining-and-Policy-Based Deep Reinforcement Learning Approach for QoS-Aware Service Composition