JGRCAN: A Visual Question Answering Co-Attention Network via Joint Grid-Region Features

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_center" colspan="2">Accuracy</td><td class="align_center" colspan="4">Test-dev</td><td class="align_center">Test-std</td></tr><tr class="thead"><td class="align_left">Methods (%)</td><td class="align_center"></td><td class="align_center">All</td><td class="align_center">Y/N</td><td class="align_center">Number</td><td class="align_center">Other</td><td class="align_center">All</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left" colspan="2">Bottom-up [<a href="/journals/mpe/2022/4554074/#B3" target="_blank">3</a>]</td><td class="align_center">65.32</td><td class="align_center">81.82</td><td class="align_center">44.21</td><td class="align_center">56.05</td><td class="align_center">65.67</td></tr><tr><td class="align_left" colspan="2">BAN [<a href="/journals/mpe/2022/4554074/#B16" target="_blank">16</a>]</td><td class="align_center">69.52</td><td class="align_center">85.31</td><td class="align_center">50.93</td><td class="align_center">60.26</td><td class="align_center">69.84</td></tr><tr><td class="align_left" colspan="2">BAN + counter [<a href="/journals/mpe/2022/4554074/#B16" target="_blank">16</a>]</td><td class="align_center">70.04</td><td class="align_center">85.42</td><td class="align_center">54.04</td><td class="align_center">60.52</td><td class="align_center">70.35</td></tr><tr><td class="align_left" colspan="2">MuRel [<a href="/journals/mpe/2022/4554074/#B29" target="_blank">29</a>]</td><td class="align_center">68.76</td><td class="align_center">84.77</td><td class="align_center">49.84</td><td class="align_center">57.85</td><td class="align_center">68.41</td></tr><tr><td class="align_left" colspan="2">DFAF [<a href="/journals/mpe/2022/4554074/#B30" target="_blank">30</a>]</td><td class="align_center">70.22</td><td class="align_center">86.09</td><td class="align_center">53.32</td><td class="align_center">60.49</td><td class="align_center">70.34</td></tr><tr><td class="align_left" colspan="2">MCAN [<a href="/journals/mpe/2022/4554074/#B2" target="_blank">2</a>]</td><td class="align_center">70.63</td><td class="align_center">86.82</td><td class="align_center">53.26</td><td class="align_center">60.72</td><td class="align_center">70.90</td></tr><tr><td class="align_left" colspan="2">JGRCAN</td><td class="align_center">70.87</td><td class="align_center">86.97</td><td class="align_center">53.15</td><td class="align_center">61.45</td><td class="align_center">71.18</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Experiment results compared with other state-of-the-art models on the test-dev and test-std sets.</div>

Mathematical Problems in Engineering

tab3

Table 3

Table 3: JGRCAN: A Visual Question Answering Co-Attention Network via Joint Grid-Region Features