Similarity Measurement and Classification of English Characters Based on Language Features

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="11"><hr/></td></tr><tr class="thead"><td class="align_left">Number of data</td><td class="align_center">500</td><td class="align_center">1000</td><td class="align_center">1500</td><td class="align_center">2000</td><td class="align_center">2500</td><td class="align_center">3000</td><td class="align_center">3500</td><td class="align_center">4000</td><td class="align_center">4500</td><td class="align_center">5801</td></tr><tr><td class="thead-hr" colspan="11"><hr/></td></tr><tr><td class="align_left">method1</td><td class="align_center">0.717</td><td class="align_center">0.742</td><td class="align_center">0.728</td><td class="align_center">0.731</td><td class="align_center">0.730</td><td class="align_center">0.729</td><td class="align_center">0.731</td><td class="align_center">0.731</td><td class="align_center">0.730</td><td class="align_center">0.730</td></tr><tr><td class="align_left">method2</td><td class="align_center">0.713</td><td class="align_center">0.718</td><td class="align_center">0.721</td><td class="align_center">0.725</td><td class="align_center">0.724</td><td class="align_center">0.722</td><td class="align_center">0.724</td><td class="align_center">0.724</td><td class="align_center">0.723</td><td class="align_center">0.723</td></tr><tr><td class="align_left">method3</td><td class="align_center">0.373</td><td class="align_center">0.378</td><td class="align_center">0.376</td><td class="align_center">0.378</td><td class="align_center">0.378</td><td class="align_center">0.377</td><td class="align_center">0.376</td><td class="align_center">0.380</td><td class="align_center">0.378</td><td class="align_center">0.380</td></tr><tr><td class="align_left">method4</td><td class="align_center">0.649</td><td class="align_center">0.652</td><td class="align_center">0.658</td><td class="align_center">0.661</td><td class="align_center">0.663</td><td class="align_center">0.662</td><td class="align_center">0.664</td><td class="align_center">0.664</td><td class="align_center">0.663</td><td class="align_center">0.664</td></tr><tr><td class="align_left">method5</td><td class="align_center">0.841</td><td class="align_center">0.837</td><td class="align_center">0.839</td><td class="align_center">0.841</td><td class="align_center">0.845</td><td class="align_center">0.844</td><td class="align_center">0.846</td><td class="align_center">0.846</td><td class="align_center">0.846</td><td class="align_center">0.846</td></tr><tr class="table-tr"><td colspan="11"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Average similarity of vocabulary pairs with status 1 under different data numbers of different algorithms.</div>

Mobile Information Systems

tab1

Table 1

Table 1: Similarity Measurement and Classification of English Characters Based on Language Features