[Retracted] Analyzing the Effect of Masking Length Distribution of MLM: An Evaluation Framework and Case Study on Chinese MRC Datasets

<table class="table-group" id="tab5"><tr class="table-caption" id="a"><td><div><b>(a) </b></div></td></tr><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_center" colspan="7">Short span dataset</td></tr><tr class="thead"><td class="align_left">Tokens #</td><td class="align_center">Train #</td><td class="align_center">PP (%)</td><td class="align_center">Dev #</td><td class="align_center">PP (%)</td><td class="align_center">Test #</td><td class="align_center">PP (%)</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left">4</td><td class="align_center">16,171</td><td class="align_center">51.52%</td><td class="align_center">3344</td><td class="align_center">49.37%</td><td class="align_center">4147</td><td class="align_center">49.91%</td></tr><tr><td class="align_left">5</td><td class="align_center">8566</td><td class="align_center">27.29%</td><td class="align_center">1828</td><td class="align_center">26.99%</td><td class="align_center">2230</td><td class="align_center">26.84%</td></tr><tr><td class="align_left">6</td><td class="align_center">6653</td><td class="align_center">21.19%</td><td class="align_center">1602</td><td class="align_center">23.65%</td><td class="align_center">1932</td><td class="align_center">23.25%</td></tr><tr><td class="align_left">Total</td><td class="align_center">31,390</td><td class="align_center">100.00%</td><td class="align_center">6774</td><td class="align_center">100.00%</td><td class="align_center">8309</td><td class="align_center">100.00%</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-caption" id="b"><td><div><b>(b) </b></div></td></tr><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_center" colspan="7">Long span dataset</td></tr><tr class="thead"><td class="align_left">Tokens #</td><td class="align_center">Train #</td><td class="align_center">PP (%)</td><td class="align_center">Dev #</td><td class="align_center">PP (%)</td><td class="align_center">Test #</td><td class="align_center">PP (%)</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left">7</td><td class="align_center">5040</td><td class="align_center">41.82%</td><td class="align_center">819</td><td class="align_center">34.47%</td><td class="align_center">2071</td><td class="align_center">35.63%</td></tr><tr><td class="align_left">8</td><td class="align_center">4192</td><td class="align_center">34.78%</td><td class="align_center">980</td><td class="align_center">41.25%</td><td class="align_center">2390</td><td class="align_center">41.12%</td></tr><tr><td class="align_left">9</td><td class="align_center">2821</td><td class="align_center">23.40%</td><td class="align_center">577</td><td class="align_center">24.28%</td><td class="align_center">1351</td><td class="align_center">23.25%</td></tr><tr><td class="align_left">Total</td><td class="align_center">12,053</td><td class="align_center">100.00%</td><td class="align_center">2376</td><td class="align_center">100.00%</td><td class="align_center">5812</td><td class="align_center">100.00%</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The answer length distributions of the proposed span extraction datasets.</div>

Wireless Communications and Mobile Computing

tab5

Table 5

Table 5: [Retracted] Analyzing the Effect of Masking Length Distribution of MLM: An Evaluation Framework and Case Study on Chinese MRC Datasets