Arabic Syntactic Diacritics Restoration Using BERT Models

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Method</td><td class="align_center">All WER</td><td class="align_center">Morph WER</td><td class="align_center">CEER (%)</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">MaxEnt tagger [<a href="/journals/cin/2022/3214255/#B10" target="_blank">10</a>]</td><td class="align_center">18.00%</td><td class="align_center">7.90%</td><td class="align_center">10.10</td></tr><tr><td class="align_left">Rule-based tagger [<a href="/journals/cin/2022/3214255/#B41" target="_blank">41</a>]</td><td class="align_center">—</td><td class="align_center">—</td><td class="align_center">9.97</td></tr><tr><td class="align_left">MADA tagger [<a href="/journals/cin/2022/3214255/#B42" target="_blank">42</a>]</td><td class="align_center">14.90%</td><td class="align_center">5.50%</td><td class="align_center">9.40</td></tr><tr><td class="align_left">Random forest tagger [<a href="/journals/cin/2022/3214255/#B28" target="_blank">28</a>]</td><td class="align_center">13.70%</td><td class="align_center">4.30%</td><td class="align_center">9.40</td></tr><tr><td class="align_left">Scoring of a language model [<a href="/journals/cin/2022/3214255/#B5" target="_blank">5</a>]</td><td class="align_center">12.50%</td><td class="align_center">3.10%</td><td class="align_center">9.11</td></tr><tr><td class="align_left">Confused subset resolution [<a href="/journals/cin/2022/3214255/#B43" target="_blank">43</a>]</td><td class="align_center">11.60%</td><td class="align_center">3.00%</td><td class="align_center">8.60</td></tr><tr><td class="align_left">Scoring of a language model [<a href="/journals/cin/2022/3214255/#B16" target="_blank">16</a>]</td><td class="align_center">10.87%</td><td class="align_center">3.00%</td><td class="align_center">7.87</td></tr><tr><td class="align_left">SVM tagger [<a href="/journals/cin/2022/3214255/#B29" target="_blank">29</a>]</td><td class="align_center">—</td><td class="align_center">—</td><td class="align_center">6.8</td></tr><tr><td class="align_left">MADAMIRA + character RNN tagger [<a href="/journals/cin/2022/3214255/#B21" target="_blank">21</a>]</td><td class="align_center">8.40%</td><td class="align_center">2.30%</td><td class="align_center">6.10</td></tr><tr><td class="align_left">Character RNN tagger [<a href="/journals/cin/2022/3214255/#B20" target="_blank">20</a>]</td><td class="align_center">9.07%</td><td class="align_center">4.34%</td><td class="align_center">4.73</td></tr><tr><td class="align_left">Word level MaxEnt/BiLSTM tagger [<a href="/journals/cin/2022/3214255/#B29" target="_blank">29</a>]</td><td class="align_center">—</td><td class="align_center">—</td><td class="align_center">5.3</td></tr><tr><td class="align_left">Word level MaxEnt/BiLSTM tagger + distillation of knowledge + embeddings based on characters [<a href="/journals/cin/2022/3214255/#B4" target="_blank">4</a>]</td><td class="align_center">—</td><td class="align_center">—</td><td class="align_center">4.3</td></tr><tr><td class="align_left">BERT tagger (two steps fine-tuning)</td><td class="align_center">—</td><td class="align_center">—</td><td class="align_center">2.94</td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The comparison between the proposed BERT model and the state-of-the-art systems on the ATB test dataset.</div>

Computational Intelligence and Neuroscience

Arabic Syntactic Diacritics Restoration Using BERT Models

Table 5