Multi-Rule Based Ensemble Feature Selection Model for Sarcasm Type Detection in Twitter

<table class="algorithm-group"><tr><td><table class="algorithm" id="alg1"><tr><td> </td><td><b>Input</b>: Comma separated raw tweet file</td></tr><tr><td> </td><td><b>Output</b>: Preprocessed and clean tweet file</td></tr><tr><td> </td><td>Create a list preprocessed_docs</td></tr><tr><td> </td><td>for each tweet S in T:</td></tr><tr><td> </td><td> create a list result</td></tr><tr><td> </td><td> for each word W in S:</td></tr><tr><td> </td><td>  if W not in STOPWORDS:</td></tr><tr><td> </td><td>   Add stem (W) to result</td></tr><tr><td> </td><td>  end if</td></tr><tr><td> </td><td>  if <svg height="11.439pt" id="M2" style="vertical-align:-2.15067pt" version="1.1" viewbox="-0.0498162 -9.28833 49.3934 11.439" width="49.3934pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M956 650H736V622C814 613 818 602 804 542C789 471 733 275 691 141H689C628 314 570 476 514 641H485C434 478 377 312 323 142H321C277 284 238 419 199 554C184 605 186 613 259 622V650H16V622C77 615 92 606 117 524C172 346 228 170 281 -11H312C363 151 419 312 475 488H477C528 343 597 150 652 -11H683C765 269 826 458 848 522C878 605 887 613 956 622V650Z"></path></g><g transform="matrix(.013,0,0,-0.013,12.67,0)"><path d="M290 -163V-135C183 -126 181 -122 181 -44V583C181 662 184 666 290 675V703H120V-163H290Z"></path></g><g transform="matrix(.013,0,0,-0.013,17.155,0)"><path d="M248 635C97 635 43 457 43 311C43 153 97 -12 247 -12S450 166 450 312C450 466 397 635 248 635ZM246 603C337 603 361 452 361 312S337 20 248 20S132 172 132 313C132 452 156 603 246 603Z"></path></g><g transform="matrix(.013,0,0,-0.013,23.588,0)"><path d="M226 -163V703H56V676C162 667 165 662 165 584V-43C165 -122 162 -126 56 -136V-163H226Z"></path></g><g transform="matrix(.013,0,0,-0.013,31.705,0)"><path d="M535 323V373H52V323H535ZM535 138V188H52V138H535Z"></path></g><g transform="matrix(.013,0,0,-0.013,42.968,0)"><path d="M448 453H361L394 608H355L322 453H214L248 608H210L176 453H79L70 395H163L134 259H35L24 201H120L82 27H120L158 201H266L229 27H267L305 201H395L404 259H318L348 395H439L448 453ZM310 395L280 259H173L202 395H310Z"></path></g></svg></td></tr><tr><td> </td><td>   Tokenize W</td></tr><tr><td> </td><td>  end if</td></tr><tr><td> </td><td>  if W has @, /, RT, http</td></tr><tr><td> </td><td>   Remove the word and then add to result</td></tr><tr><td> </td><td>  end if</td></tr><tr><td> </td><td> end for</td></tr><tr><td> </td><td> preprocessed docs.Append (result)</td></tr><tr><td> </td><td>end for</td></tr><tr><td> </td><td>end</td></tr></table></td></tr></table>

<div>Preprocessing of raw twitter data.</div>

Computational Intelligence and Neuroscience

alg1

Algorithm 1

Algorithm 1: Multi-Rule Based Ensemble Feature Selection Model for Sarcasm Type Detection in Twitter