Sentence Classification Using N-Grams in Urdu Language Text

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Sr. No.</td><td class="align_center">Dataset</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">1</td><td class="align_center">Enabling Minority Language Engineering (EMILLE) (only 200000 tokens) [<a href="/journals/sp/2021/1296076/#B18" target="_blank">18</a>]</td></tr><tr><td class="align_left">2</td><td class="align_center">Becker-Riaz corpus (only 50000 tokens) [<a href="/journals/sp/2021/1296076/#B19" target="_blank">19</a>]</td></tr><tr><td class="align_left">3</td><td class="align_center">Computing Research Laboratory (CRL) annotated corpus (only 55,000 tokens are publicly available data corpora) [<a href="/journals/sp/2021/1296076/#B20" target="_blank">20</a>]</td></tr><tr><td class="align_left">4</td><td class="align_center">International Joint Conference on Natural Language Processing (IJCNLP) workshop corpus (only 58252 tokens)</td></tr><tr><td class="align_left">5</td><td class="align_center">Urdu Named Entity Recognition (UNER) [<a href="/journals/sp/2021/1296076/#B4" target="_blank">4</a>]</td></tr><tr><td class="align_left">6</td><td class="align_center">Corpus of 705 sentences [<a href="/journals/sp/2021/1296076/#B21" target="_blank">21</a>]</td></tr><tr><td class="align_left">7</td><td class="align_center">Corpus of BBC Urdu, Daily Jang [<a href="/journals/sp/2021/1296076/#B22" target="_blank">22</a>]</td></tr><tr><td class="align_left">8</td><td class="align_center">corpus of 19.3 million words [<a href="/journals/sp/2021/1296076/#B23" target="_blank">23</a>]</td></tr><tr><td class="align_left">9</td><td class="align_center">COUNTER, Naïve, NPUU [<a href="/journals/sp/2021/1296076/#B24" target="_blank">24</a>, <a href="/journals/sp/2021/1296076/#B25" target="_blank">25</a>]</td></tr><tr><td class="align_left">10</td><td class="align_center">DSL Urdu news [<a href="/journals/sp/2021/1296076/#B26" target="_blank">26</a>]</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

Scientific Programming

tab2

Table 2

Table 2: Sentence Classification Using N-Grams in Urdu Language Text