TCMNER and PubMed: A Novel Chinese Character-Level-Based Model and a Dataset for TCM Named Entity Recognition

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">%</td><td class="align_center" colspan="3">Publications (test)</td><td class="align_center" colspan="3">Medical records</td></tr><tr class="thead"><td class="align_center">P</td><td class="align_center">R</td><td class="align_center">F1</td><td class="align_center">P</td><td class="align_center">R</td><td class="align_center">F1</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left">BiLSTM-CRF</td><td class="align_center">60.8</td><td class="align_center">30.6</td><td class="align_center">40.7</td><td class="align_center">61.4</td><td class="align_center">48.3</td><td class="align_center">54.1</td></tr><tr><td class="align_left">BERT-CRF</td><td class="align_center">58.7</td><td class="align_center">54.2</td><td class="align_center">56.4</td><td class="align_center">54.7</td><td class="align_center">60.5</td><td class="align_center">57.4</td></tr><tr><td class="align_left">BERT-BiLSTM</td><td class="align_center">93</td><td class="align_center">91.6</td><td class="align_center">90.3</td><td class="align_center">85.5</td><td class="align_center">88.1</td><td class="align_center">86.8</td></tr><tr><td class="align_left">BERT-BiLSTM-CRF</td><td class="align_center">75.4</td><td class="align_center">73.1</td><td class="align_center">74.2</td><td class="align_center">69</td><td class="align_center">75.2</td><td class="align_center">71.9</td></tr><tr><td class="align_left">RoBERTa-BiLSTM</td><td class="align_center">88.8</td><td class="align_center">92.6</td><td class="align_center">90.7</td><td class="align_center">86.3</td><td class="align_center">90.1</td><td class="align_center">88.2</td></tr><tr><td class="align_left">RoBERTa-c</td><td class="align_center">92.6</td><td class="align_center">96.7</td><td class="align_center">94.6</td><td class="align_center">90.4</td><td class="align_center">92.3</td><td class="align_center">91.3</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The performances of different models in the test set of publications and the entire medical records.</div>

Journal of Healthcare Engineering

tab5

Table 5

Table 5: TCMNER and PubMed: A Novel Chinese Character-Level-Based Model and a Dataset for TCM Named Entity Recognition