A Multitask Deep Learning Framework for DNER

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_left">Layer</td><td class="align_center">Hyperparameter</td><td class="align_center">Value</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left" rowspan="2">CNN</td><td class="align_center">Window size</td><td class="align_center">3</td></tr><tr><td class="align_center">Number of filters</td><td class="align_center">30</td></tr><tr><td class="align_left" colspan="3"><hr/></td></tr><tr><td class="align_left" rowspan="3">LSTM</td><td class="align_center">State size</td><td class="align_center">200</td></tr><tr><td class="align_center">Initial state</td><td class="align_center">0.0</td></tr><tr><td class="align_center">Peepholes</td><td class="align_center">No</td></tr><tr><td class="align_left" colspan="3"><hr/></td></tr><tr><td class="align_left" rowspan="7">Dropout</td><td class="align_center">Dropout rate</td><td class="align_center">0.5</td></tr><tr><td class="align_center">Batch size</td><td class="align_center">10</td></tr><tr><td class="align_center">Initial learning rate</td><td class="align_center">0.015</td></tr><tr><td class="align_center">Gradient clipping</td><td class="align_center">5.0</td></tr><tr><td class="align_center">Decay rate</td><td class="align_center">0.05</td></tr><tr><td class="align_center">Labeling schema</td><td class="align_center">BIO</td></tr><tr><td class="align_center">ELMo dim</td><td class="align_center">1024</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The parameters for our experiments.</div>

Computational Intelligence and Neuroscience

tab3

Table 3

Table 3: A Multitask Deep Learning Framework for DNER