Custom Network Quantization Method for Lightweight CNN Acceleration on FPGAs

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">Network</td><td class="align_center" rowspan="2">Top-1 accuracy (%)</td><td class="align_center" colspan="2">XCZU3EG</td><td class="align_center" colspan="2">XCVU13P</td><td class="align_center" rowspan="2">Size (M)</td><td class="align_center" rowspan="2">Compression ratio (%)</td></tr><tr class="thead"><td class="align_center">Inference time (ms)</td><td class="align_center">Time reduction (%)</td><td class="align_center">Inference time (ms)</td><td class="align_center">Time reduction (%)</td></tr><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr><td class="align_left">MobileNetv1-C</td><td class="align_center">89.98</td><td class="align_center">29.44</td><td class="align_center">—</td><td class="align_center">8.04</td><td class="align_center">—</td><td class="align_center">3.7</td><td class="align_center">70.86</td></tr><tr><td class="align_left">MobileNetv3-C</td><td class="align_center">93.90</td><td class="align_center">53.97</td><td class="align_center">—</td><td class="align_center">14.92</td><td class="align_center">—</td><td class="align_center">5.1</td><td class="align_center">70.17</td></tr><tr><td class="align_left">PPLCNet-C</td><td class="align_center">89.56</td><td class="align_center">16.35</td><td class="align_center">—</td><td class="align_center">4.30</td><td class="align_center">—</td><td class="align_center">2.2</td><td class="align_center">71.12</td></tr><tr><td class="align_left">PPLCNetv2-C</td><td class="align_center">93.61</td><td class="align_center">47.81</td><td class="align_center">—</td><td class="align_center">13.79</td><td class="align_center">—</td><td class="align_center">6.0</td><td class="align_center">74.35</td></tr><tr><td class="align_left">MobileNetv1-O</td><td class="align_center">89.77</td><td class="align_center">16.44</td><td class="align_center">44.16</td><td class="align_center">4.32</td><td class="align_center">46.27</td><td class="align_center">3.5</td><td class="align_center">72.44</td></tr><tr><td class="align_left">MobileNetv3-O</td><td class="align_center">93.84</td><td class="align_center">18.89</td><td class="align_center">64.99</td><td class="align_center">5.01</td><td class="align_center">66.42</td><td class="align_center">4.7</td><td class="align_center">72.51</td></tr><tr><td class="align_left">PPLCNet-O</td><td class="align_center">89.68</td><td class="align_center">9.88</td><td class="align_center">39.57</td><td class="align_center">2.69</td><td class="align_center">37.44</td><td class="align_center">2.0</td><td class="align_center">73.75</td></tr><tr><td class="align_left">PPLCNetv2-O</td><td class="align_center">93.46</td><td class="align_center">23.01</td><td class="align_center">51.87</td><td class="align_center">6.10</td><td class="align_center">55.76</td><td class="align_center">5.7</td><td class="align_center">75.64</td></tr><tr class="table-tr"><td colspan="8"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The comparison between the conventional quantized networks and the optimized networks.</div>

International Journal of Distributed Sensor Networks

tab5

Table 5

Table 5: Custom Network Quantization Method for Lightweight CNN Acceleration on FPGAs