HRNet Encoder and Dual-Branch Decoder Framework-Based Scene Text Recognition Model

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">Model</td><td class="align_center" colspan="2">Parameters</td></tr><tr class="thead"><td class="align_center">Training</td><td class="align_center">Testing</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left">Baseline (HRNet)</td><td class="align_center">35.564</td><td class="align_center">35.564</td></tr><tr><td class="align_left">Baseline + SR (Bilinear Interpolation)</td><td class="align_center">35.565</td><td class="align_center">35.564</td></tr><tr><td class="align_left">Baseline + SR (Bilinear Interpolation) + SAM</td><td class="align_center">35.568</td><td class="align_center">35.567</td></tr><tr><td class="align_left">Baseline + SR (Trans Conv2D) + SAM</td><td class="align_center">35.573</td><td class="align_center">35.567</td></tr><tr><td class="align_left">Proposed model (Baseline + SR (Trans Conv2D) + SAM + Independent Trans Conv2D Layers)</td><td class="align_center">37.582</td><td class="align_center">37.576</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Parameter comparison in ablation models during training and testing (<i>M</i>).</div>

International Journal of Antennas and Propagation

tab4

Table 4

Table 4: HRNet Encoder and Dual-Branch Decoder Framework-Based Scene Text Recognition Model