[Retracted] A Multimodal Model for College English Teaching Using Text and Image Feature Extraction

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left">Algorithm model</td><td class="align_center" colspan="3">Image retrieval</td><td class="align_center" colspan="3">Sentence retrieval</td></tr><tr><td class="align_left" colspan="7"><hr/></td></tr><tr><td class="align_left">R@K</td><td class="align_center">1</td><td class="align_center">10</td><td class="align_center">20</td><td class="align_center">1</td><td class="align_center">10</td><td class="align_center">20</td></tr><tr><td class="align_left">Random ranking</td><td class="align_center">7.1</td><td class="align_center">15.6</td><td class="align_center">19.8</td><td class="align_center">6.9</td><td class="align_center">14.9</td><td class="align_center">20.3</td></tr><tr><td class="align_left">SDT-RNN</td><td class="align_center">7.5</td><td class="align_center">25.3</td><td class="align_center">26.7</td><td class="align_center">6.9</td><td class="align_center">34.7</td><td class="align_center">40.2</td></tr><tr><td class="align_left">Deep fragment</td><td class="align_center">8.1</td><td class="align_center">36.9</td><td class="align_center">49.3</td><td class="align_center">10.1</td><td class="align_center">35.7</td><td class="align_center">46.3</td></tr><tr><td class="align_left">MCNN</td><td class="align_center">26.3</td><td class="align_center">29.6</td><td class="align_center">49.1</td><td class="align_center">29.3</td><td class="align_center">18.5</td><td class="align_center">67.1</td></tr><tr><td class="align_left">Proposed</td><td class="align_center">32.1</td><td class="align_center">49.2</td><td class="align_center">72.3</td><td class="align_center">37.9</td><td class="align_center">65.1</td><td class="align_center">75.5</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Performance comparison of the cross-modal retrieval methods on Flickr30K dataset.</div>

Computational Intelligence and Neuroscience

tab2

Table 2

Table 2: [Retracted] A Multimodal Model for College English Teaching Using Text and Image Feature Extraction