[Retracted] Gradient Descent Optimization in Deep Learning Model Training Based on Multistage and Method Combination Strategy

<table class="table-group" id="tab14"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2"> </td><td class="align_center" colspan="2">ResNet-20 on Cafri-10</td><td class="align_center" colspan="2">LSTM on IMDB</td></tr><tr class="thead"><td class="align_center">Val-loss</td><td class="align_center">Val-acc</td><td class="align_center">Val-loss</td><td class="align_center">Val-acc</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + SGD</td><td class="align_center">0.6149</td><td class="align_center">0.8464</td><td class="align_center">0.4872</td><td class="align_center"><b>0.8338</b></td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + (SGD + <i>d</i>)</td><td class="align_center">0.9866</td><td class="align_center">0.7530</td><td class="align_center">0.5555</td><td class="align_center">0.8289</td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + (SGD + <i>M</i>)</td><td class="align_center"><b>0.6012</b></td><td class="align_center"><b>0.8493</b></td><td class="align_center"><b>0.4848</b></td><td class="align_center">0.8341</td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + (SGD + <i>M</i> + <i>d</i>)</td><td class="align_center">0.7868</td><td class="align_center">0.7915</td><td class="align_center">0.5462</td><td class="align_center">0.8257</td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + RMSprop</td><td class="align_center">0.7120</td><td class="align_center">0.8212</td><td class="align_center">0.7487</td><td class="align_center">0.8161</td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + (RMSprop + <i>d</i>)</td><td class="align_center">0.9602</td><td class="align_center">0.7771</td><td class="align_center">0.8846</td><td class="align_center">0.7980</td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + Adam</td><td class="align_center">0.8002</td><td class="align_center">0.7920</td><td class="align_center">0.9164</td><td class="align_center">0.8114</td></tr><tr><td class="align_left">(RMSprop + <i>d</i>) + (Adam + <i>d</i>)</td><td class="align_center">0.8254</td><td class="align_center">0.8000</td><td class="align_center">1.0931</td><td class="align_center">0.8146</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>The bold values represent the best results.<br/></div></td></tr></table>

<div>Performance of the proposed method, RMSprop with decay.</div>

Security and Communication Networks

tab14

Table 14

Table 14: [Retracted] Gradient Descent Optimization in Deep Learning Model Training Based on Multistage and Method Combination Strategy