COVID-19 Infodemic in Malaysia: Conceptualizing Fake News for Detection

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Index</td><td class="align_center">Procedure</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">1</td><td class="align_center">The columns that require for future analysis are extracted</td></tr><tr><td class="align_left">2</td><td class="align_center">The presence of null or missing values of the extracted data are examined</td></tr><tr><td class="align_left">3</td><td class="align_center">Columns “Tajuk” and “Keterangan” are combined for future analysis</td></tr><tr><td class="align_left">4</td><td class="align_center">The news distribution is plotted based on the categories of the news</td></tr><tr><td class="align_left">5</td><td class="align_center">Column “label” is added, and the news is labelled into “real” and “fake”</td></tr><tr><td class="align_left">6</td><td class="align_center">The balance of data is checked</td></tr><tr><td class="align_left">7</td><td class="align_center">The data are preprocessed by natural language processing (NLP)</td></tr><tr><td class="align_left">8</td><td class="align_center">Frequency distribution of 30 most common token of words and word clouds for COVID-19 related fake news are generated</td></tr><tr><td class="align_left">9</td><td class="align_center">Feature extraction of the data is generated by term frequency-inverse document frequency (TF-IDF) with bigram</td></tr><tr><td class="align_left">10</td><td class="align_center">The data are split into 70% train data and 30% test data</td></tr><tr><td class="align_left">11</td><td class="align_center">SMOTE oversampling technique is employed to solve the data imbalanced problem</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Summarized procedures for data preparation.</div>

Advances in Multimedia

tab3

Table 3

Table 3: COVID-19 Infodemic in Malaysia: Conceptualizing Fake News for Detection