Computational Intelligence and Neuroscience

Research Article

An Empirical Investigation of Transfer Effects for Reinforcement Learning

The algorithm for training the non-transfer and transfer RL methods.

input: S_training, TRQ_n−1[S_n−1, A_n−1]
(1)	initialize
(2)	new NRQ_n[S_n, A_n]
(3)	new TRQ_n[S_n, A_n]
(4)	TRQ_n[S_n, A_n] ⟵ TRQ_n−1[S_n−1, A_n−1]
(5)	upper_bound = n + 1
(6)	Assign S_training to s_nt and s_tr
(7)	finish = FALSE
(8)	NonTrans_Tr_Steps = 0
(9)	Trans_Tr_Steps = 0
(10)	repeat
(11)	NRQ_n[S_n, A_n], Steps_nt = RL_Sort(s_nt , NRQ_n[S_n, A_n])
(12) TRQ_n[S_n, A_n] , Steps_tr = RL_Sort(s_tr , TRQ_n[S_n, A_n])
(13)	NonTrans_Tr_Steps = NonTrans_Tr_Steps + Steps_nt
(14)	Trans_Tr_Steps = Trans_Tr_Steps + Steps_tr
(15)	Sort n! lists in S_n by NRQ_n, compute the average Avg_nt and pick the list with max value as s_nt
(16)	Sort n! lists in S_n by TRQ_n, compute the average Avg_tr and pick the list with max value as s_tr
(17)	if (\|Avg_nt − Avg_tr\|/Avg_tr <= 0.1) or (Avg_nt <= upper_bound and Avg_tr <= upper_bound)
(18)	finish = TRUE
(19)	until finish is TRUE