[Retracted] Gradient Descent Optimization in Deep Learning Model Training Based on Multistage and Method Combination Strategy

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr class="thead"><td class="align_left">Methods</td><td class="align_center">Decay</td><td class="align_center">1R1D</td><td class="align_center">2R2D</td><td class="align_center">3R3D</td><td class="align_center">5R5D</td></tr><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr><td class="align_left">RMSprop</td><td class="align_center">100</td><td class="align_center">108</td><td class="align_center">109</td><td class="align_center">111</td><td class="align_center">113</td></tr><tr><td class="align_left">Adam</td><td class="align_center">109</td><td class="align_center">122</td><td class="align_center">124</td><td class="align_center">126</td><td class="align_center">129</td></tr><tr><td class="align_left">NAdam</td><td class="align_center">124</td><td class="align_center">142</td><td class="align_center">145</td><td class="align_center">146</td><td class="align_center">149</td></tr><tr><td class="align_left">AdaMax</td><td class="align_center">115</td><td class="align_center">139</td><td class="align_center">141</td><td class="align_center">143</td><td class="align_center">147</td></tr><tr><td class="align_left">Adadelta</td><td class="align_center">129</td><td class="align_center">162</td><td class="align_center">165</td><td class="align_center">168</td><td class="align_center">176</td></tr><tr><td class="align_left">Adagrad</td><td class="align_center">128</td><td class="align_center">167</td><td class="align_center">170</td><td class="align_center">171</td><td class="align_center">173</td></tr><tr class="table-tr"><td colspan="6"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>Unit: s/epoch; kRkD: raise <i>k</i> times and decrease <i>k</i> times on learning rate for each iteration.<br/></div></td></tr></table>

<div>Executing time of conflicting situations on the learning rate.</div>

Security and Communication Networks

tab5

Table 5

Table 5: [Retracted] Gradient Descent Optimization in Deep Learning Model Training Based on Multistage and Method Combination Strategy