[Retracted] Gradient Descent Optimization in Deep Learning Model Training Based on Multistage and Method Combination Strategy

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr class="thead"><td class="align_left">Methods</td><td class="align_center">Decay</td><td class="align_center">1R1D</td><td class="align_center">2R2D</td><td class="align_center">3R3D</td><td class="align_center">5R5D</td></tr><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr><td class="align_left">RMSprop</td><td class="align_center">64</td><td class="align_center">69</td><td class="align_center">70</td><td class="align_center">71</td><td class="align_center">72</td></tr><tr><td class="align_left">Adam</td><td class="align_center">70</td><td class="align_center">78</td><td class="align_center">79</td><td class="align_center">81</td><td class="align_center">83</td></tr><tr><td class="align_left">NAdam [<a href="/journals/scn/2021/9956773/#B29" target="_blank">29</a>]</td><td class="align_center">79</td><td class="align_center">91</td><td class="align_center">92</td><td class="align_center">93</td><td class="align_center">95</td></tr><tr><td class="align_left">AdaMax [<a href="/journals/scn/2021/9956773/#B5" target="_blank">5</a>]</td><td class="align_center">74</td><td class="align_center">89</td><td class="align_center">90</td><td class="align_center">92</td><td class="align_center">94</td></tr><tr><td class="align_left">Adadelta</td><td class="align_center">83</td><td class="align_center">104</td><td class="align_center">106</td><td class="align_center">108</td><td class="align_center">112</td></tr><tr><td class="align_left">Adagrad</td><td class="align_center">82</td><td class="align_center">107</td><td class="align_center">108</td><td class="align_center">109</td><td class="align_center">111</td></tr><tr class="table-tr"><td colspan="6"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>Unit: ms/batch; kRkD: raise <i>k</i> times and decrease <i>k</i> times on learning rate for each iteration.<br/></div></td></tr></table>

<div>Executing time of conflicting situations on learning rate.</div>

Security and Communication Networks

tab4

Table 4

Table 4: [Retracted] Gradient Descent Optimization in Deep Learning Model Training Based on Multistage and Method Combination Strategy