Designing Deep Learning Hardware Accelerator and Efficiency Evaluation

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left">Experimental platform</td><td class="align_center">CPU</td><td class="align_center">GPU</td><td class="align_center">FPGA [<a href="/journals/cin/2022/1291103/#B6" target="_blank">6</a>]</td><td class="align_center">FPGA (proposed)</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">Platform configuration</td><td class="align_center">i5–10400F</td><td class="align_center">GTX 1660Ti</td><td class="align_center">V6-690T</td><td class="align_center">Xilinx Kintex-7</td></tr><tr><td class="align_left">Data type</td><td class="align_center">Fp32</td><td class="align_center">Fp32</td><td class="align_center">Fix16</td><td class="align_center">Fix16/Fp32</td></tr><tr><td class="align_left">Clock frequency (MHz)</td><td class="align_center">4300</td><td class="align_center">1845</td><td class="align_center">—</td><td class="align_center">1818</td></tr><tr><td class="align_left">Execution time (s)</td><td class="align_center">176.2</td><td class="align_center">3.9</td><td class="align_center">—</td><td class="align_center">20.3</td></tr><tr><td class="align_left">Energy consumption (W)</td><td class="align_center">65</td><td class="align_center">120</td><td class="align_center">25.6</td><td class="align_center">23.3</td></tr><tr><td class="align_left">Throughput (GOPS)</td><td class="align_center">1.359</td><td class="align_center">117.4</td><td class="align_center">41.32</td><td class="align_center">76.19</td></tr><tr><td class="align_left">Energy efficiency (GOPS/w)</td><td class="align_center">0.0209</td><td class="align_center">0.978</td><td class="align_center">1.65</td><td class="align_center">3.27</td></tr><tr><td class="align_left">Speedup</td><td class="align_center">—</td><td class="align_center">40.98</td><td class="align_center">—</td><td class="align_center">8.67</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The comparative evaluation of the existing and the proposed implementation schemes.</div>

Computational Intelligence and Neuroscience

tab3

Table 3

Table 3: Designing Deep Learning Hardware Accelerator and Efficiency Evaluation