Research Article
PPDRL: A Pretraining-and-Policy-Based Deep Reinforcement Learning Approach for QoS-Aware Service Composition
Table 3
The QoS values (mean and variance) on six different test cases.
| Problem # | PPDRL | MCOP_M | GA | PTR | QLR | DQN | Mean | Var | Mean | Var | Mean | Var | Mean | Var | Mean | Var | Mean | Var |
| Nodes 10 | 0.32 | 0.00 | 0.24 | 2.22e − 3 | 0.32 | 0.0000 | 0.29 | 6.83e − 5 | 0.29 | 1.19e − 4 | 0.25 | 2.45e − 4 | Nodes 30 | 0.31 | 0.00 | 0.13 | 4.23e − 3 | 0.28 | 4.38e − 3 | 0.13 | 1.55e − 5 | 0.12 | 5.54e − 5 | 0.05 | 1.44e − 4 | Nodes 50 | 0.20 | 0.0000 | 0.08 | 1.37e − 3 | 0.20 | 1.07e − 7 | 0.13 | 7.12e − 6 | 0.13 | 4.83e − 6 | 0.06 | 3.32e − 4 | Nodes 70 | 0.15 | 6.64e-12 | 0.06 | 2.89e − 4 | 0.14 | 1.02e − 6 | 0.07 | 1.49e − 5 | 0.07 | 2.22e − 5 | 0.02 | 1.72e − 4 | Nodes 90 | 0.14 | 0.0000 | 0.05 | 4.30e − 5 | 0.13 | 4.56e − 6 | 0.04 | 6.50e − 5 | 0.03 | 7.36e − 5 | -0.02 | 3.48e − 5 | Nodes 100 | 0.20 | 7.54e-7 | 0.09 | 4.30e − 4 | 0.18 | 2.31e − 6 | 0.09 | 2.57e − 5 | 0.08 | 2.31e − 4 | 0.05 | 5.18e − 4 |
|
|