PPDRL: A Pretraining-and-Policy-Based Deep Reinforcement Learning Approach for QoS-Aware Service Composition

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Algorithm</td><td class="align_center">Hyperparameters</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">MCOP_M</td><td class="align_center">N/A</td></tr><tr><td class="align_left">GA</td><td class="align_center">population_size: 64, cross_rate: 0.5, mutation_rate: 0.2</td></tr><tr><td class="align_left">PTR</td><td class="align_center">embedding_hidden_dim: 128, LSTM_hidden_dim: 128, lr1_decay_step: 1000, lr1_decay_rate: 0.96, <span class="nowrap"><svg height="6.1673pt" id="M81" style="vertical-align:-0.2063904pt" version="1.1" viewbox="-0.0498162 -5.96091 7.51131 6.1673" width="7.51131pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M545 106L524 126C493 85 467 65 455 65C438 65 427 113 405 238C448 295 498 362 543 439L533 448L478 435C453 386 423 331 398 295H395C370 404 347 448 282 448C169 448 23 309 23 153C23 54 65 -12 128 -12C203 -12 283 70 339 155H341C360 29 380 -12 411 -12C444 -12 491 11 545 106ZM333 204C265 95 210 54 169 54C137 54 113 96 113 171C113 302 191 405 252 405C301 405 318 306 333 204Z"></path></g></svg>:</span> 0.9</td></tr><tr><td class="align_left">QLR</td><td class="align_center">learning_rate: 0.2, reward_decay: 0.9, e_greedy: 0.6</td></tr><tr><td class="align_left">DQN</td><td class="align_center">hidden_dim: 30, lr_start: 0.0002, lr_decay_step: 5000, lr_decay_rate: 0.96, max_epsilon: 0.9, min_epsilon: 0.1, epsilon_increment:0.01, memory_capacity: 300</td></tr><tr><td class="align_left">PPDRL</td><td class="align_center">preipotrain_lr: 0.001, rl_lr: 0.0001, hidden_dim: 128</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Hyperparameters for each algorithm.</div>

Security and Communication Networks

tab2

Table 2

Table 2: PPDRL: A Pretraining-and-Policy-Based Deep Reinforcement Learning Approach for QoS-Aware Service Composition