Automatic Image Caption Generation Based on Some Machine Learning Algorithms

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr class="thead"><td class="align_left">Model</td><td class="align_center">B1</td><td class="align_center">B2</td><td class="align_center">B3</td><td class="align_center">B4</td><td class="align_center">CIDEr</td></tr><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr><td class="align_left">Up-down [<a href="/journals/mpe/2022/4001460/#B24" target="_blank">24</a>]</td><td class="align_center">0.802</td><td class="align_center">0.641</td><td class="align_center">0.491</td><td class="align_center">0.369</td><td class="align_center">1.179</td></tr><tr><td class="align_left">Attention based [<a href="/journals/mpe/2022/4001460/#B23" target="_blank">23</a>]</td><td class="align_center">0.748</td><td class="align_center">0.525</td><td class="align_center">0.365</td><td class="align_center">0.235</td><td class="align_center">1.041</td></tr><tr><td class="align_left">Our method (InceptionV3)</td><td class="align_center">0.821</td><td class="align_center">0.693</td><td class="align_center">0.452</td><td class="align_center">0.441</td><td class="align_center">1.092</td></tr><tr><td class="align_left">Our method (MobNet)</td><td class="align_center">0.707</td><td class="align_center">0.563</td><td class="align_center">0.516</td><td class="align_center">0.366</td><td class="align_center">0.797</td></tr><tr><td class="align_left">Our method (ResNet-50)</td><td class="align_center">0.784</td><td class="align_center">0.732</td><td class="align_center">0.458</td><td class="align_center">0.38</td><td class="align_center">0.090</td></tr><tr><td class="align_left">Our method (EffNet-B1)</td><td class="align_center">0.802</td><td class="align_center">0.756</td><td class="align_center">0.501</td><td class="align_center">0.396</td><td class="align_center">0.812</td></tr><tr class="table-tr"><td colspan="6"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The BLEU result for the models using the InceptionV3, ResNet-50, MobileNet, and EffectiveNet-B1 pretrained networks.</div>

Mathematical Problems in Engineering

tab1

Table 1

Table 1: Automatic Image Caption Generation Based on Some Machine Learning Algorithms