A Deep Random Forest Model on Spark for Network Intrusion Detection

<table class="algorithm-group"><tr><td><table class="algorithm" id="alg1"><tr><td> </td><td>Input: training dataset D = {(x1, y1), (x2, y2)… (xm, ym)};</td></tr><tr><td> </td><td> x: potential anomaly data.</td></tr><tr><td> </td><td>Output: H (x): voting result of sample x;</td></tr><tr><td> </td><td> CPRF: Deep random forests where {PRFi |i = 1, 2, …, N}.</td></tr><tr><td>(1)</td><td>CPRF = {∅}</td></tr><tr><td>(2)</td><td>Initialize hyperparameters: tolerance t and slice window size winSize</td></tr><tr><td>(3)</td><td>D′ = Feature Grained (D); //D′ is newly generated feature vector.</td></tr><tr><td>(4)</td><td>do</td></tr><tr><td>(5)</td><td> i = 1//layer i of cascaded PRF.</td></tr><tr><td>(6)</td><td> for j = 1, 2, …, T do</td></tr><tr><td>(7)</td><td>  PRFi = {∅}</td></tr><tr><td>(8)</td><td>  D′j ⟵ Bootstrap sampling (D′)</td></tr><tr><td>(9)</td><td>  Treej ⟵ decision tree (D′j)</td></tr><tr><td>(10)</td><td>  PRFi+ = {Treej}</td></tr><tr><td>(11)</td><td>end for</td></tr><tr><td>(12)</td><td>if (tolerance ≥ t)</td></tr><tr><td>(13)</td><td>  CPRF+ = {PRFi}</td></tr><tr><td>(14)</td><td>else</td></tr><tr><td>(15)</td><td>  Break</td></tr><tr><td>(16)</td><td>i = i + 1</td></tr><tr><td>(17)</td><td>while (TRUE)</td></tr><tr><td>(18)</td><td>H (x) = voting method (x)//the last layer votes for classification</td></tr><tr><td>(19)</td><td>Return CPRF</td></tr></table></td></tr></table>

Mobile Information Systems

alg1

Algorithm 1.

Algorithm 1.: A Deep Random Forest Model on Spark for Network Intrusion Detection