Hybrid Online and Offline Reinforcement Learning for Tibetan Jiu Chess

<div>Comparison of learning efficiency with or without 2D normal distribution. (a) 2D normalization off. (b) 2D normalization on. (c) 2D normalization on and making a special board type.</div>

Complexity

fig7

Figure 7

Figure 7: Hybrid Online and Offline Reinforcement Learning for Tibetan Jiu Chess