Mathematical Problems in Engineering

Research Article

A Data Mining Method Using Deep Learning for Anomaly Detection in Cloud Computing Environment

Compute

	input data set
	k: number of nearest neighbor
	: threshold for LOF
	N: data block number
	output data set which
	Initialize a Hadoop Job
	Set TaskMapReduce class
	Logically divide X into multiple data blocks: .
	In the -th TaskMapReduce
	FirstMapper
	input
	output <key, value> = < >
	for each data d_i, i = 1, 2, ..., m do
	Calculate dis_ij = distance (d_i, d_j), j = 1, ... , m
	Sort dis_ij of d_i
	for each dis_ij of d_i do
	if &
	add d_i and dis_ij in k-distinct-neighbor record (, )
	end
	Calculate k-distinct-distance record k-dis (d_i)
	end
	First Record
	input <key, value> = < d_i, [(o_k, dis (d_i, o_k)), k-dis (d_i) >
	output <key, value> = < d_i, [(o_k, dis (d_i, o_k)), k-dis (d_i) >
	SecondMapper
	input < key, value> = < d_i, [(o_k, dis (d_i, o_k)), k-dis (d_i) >
	output < key, value> = < d_i, [(o_k, reach-dis (d_i, o_k)) >
	for o_k ∈ k-distinct-neighbor do
	if k-dis (d_i) < dis (d_i, o_k)
	reach-dis (d_i, o_k) = dis (d_i, o_k)
	else reach-dis (d_i, o_k) = k-dis (d_i, o_k)
	end
	SecondReducer
	input < key, value> = < d_i, (o_k, reach-dis (d_i, o_k)) >
	output < key, value> = < d_i, lrd (d_i) >
	for value do
	,
	o_k ∈ k-distinct-neighbor
	end
	ThirdMapper
	input < key, value> = < d_i, lrd (d_i) >
	output < key, value> = < d_i (lof (d_i) > θ), lof (d_i) >
	for o_k ∈ k-distinct-neighbor do
	,
	o_k ∈ k-distinct-neighbor
	end
	if lof (d_i) > θ
	output
	ThirdReduce
	input < key, value> = < d_i (lof (d_i) > θ), lof(d_i) >
	output < key, value> = < , lof () >
	for value do
	Sort for and record
	End