Event Driven Duty Cycling with Reinforcement Learning and Monte Carlo Technique for Wireless Network

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Notation</td><td class="align_center">Description</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">qi</td><td class="align_center">The capacity of the queue for nodes as node-i (i = 1, ..., N)</td></tr><tr><td class="align_left">S, A, P, R</td><td class="align_center">Components of MDP: state space, action space, transition probability, the reward function</td></tr><tr><td class="align_left">α</td><td class="align_center">Learning rate</td></tr><tr><td class="align_left">γ</td><td class="align_center">Discount factor</td></tr><tr><td class="align_left"><svg height="6.04987pt" id="M2" style="vertical-align:-0.2325001pt" version="1.1" viewbox="-0.0498162 -5.81737 5.98461 6.04987" width="5.98461pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M219 86C216 168 211 250 206 337C201 410 189 448 163 448C131 448 79 396 43 344L60 322C91 359 110 375 118 375S132 358 136 298C141 238 152 81 155 -12H182C242 62 331 177 390 258C435 321 451 360 451 391C450 424 432 448 408 448C390 448 372 435 366 419C362 410 362 401 366 394C373 383 376 367 376 350C376 283 262 138 221 86H219Z"></path></g></svg>(i)</td><td class="align_center">Value of node-i</td></tr><tr><td class="align_left">G = (V, E)</td><td class="align_center">WSN with the set of nodes, V, and edges, E</td></tr><tr><td class="align_left">r</td><td class="align_center">Transmission range of a node</td></tr><tr><td class="align_left">NB(i)</td><td class="align_center">Neighbor nodes of node-i</td></tr><tr><td class="align_left"><svg height="6.1673pt" id="M3" style="vertical-align:-0.2063904pt" version="1.1" viewbox="-0.0498162 -5.96091 9.39034 6.1673" width="9.39034pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M689 332C689 394 670 448 646 448C620 448 597 421 597 396C597 386 600 381 608 372C619 359 620 334 620 315C620 150 538 45 454 45C414 45 386 67 386 122C386 138 388 158 394 180L457 426L452 432L377 416L315 156C302 100 259 45 216 45C176 45 148 67 148 122C148 133 152 158 156 180C162 212 173 259 194 332C201 357 206 384 206 405C206 430 198 448 174 448C125 448 66 406 23 342L43 319C84 368 110 383 121 383C126 383 128 382 128 377C128 370 127 359 122 343C99 268 84 204 77 156C74 137 70 111 70 104C70 25 125 -12 180 -12C228 -12 276 12 319 50C338 8 378 -12 418 -12C549 -12 689 166 689 332Z"></path></g></svg>(i)</td><td class="align_center">Duration of slots when node-i works</td></tr><tr><td class="align_left">wk(i)</td><td class="align_center">Slot when node-i is wake-up</td></tr><tr><td class="align_left">p(i)</td><td class="align_center">The parent node of node-i</td></tr><tr><td class="align_left">c(i)</td><td class="align_center">The child node of node-i</td></tr><tr><td class="align_left">sch(i)</td><td class="align_center">Transmission schedule of node-i</td></tr><tr><td class="align_left">F(i)</td><td class="align_center">Nodes of NB(i) forbidden to wake up</td></tr><tr><td class="align_left">pc(i)</td><td class="align_center">Candidate parent nodes of node-i</td></tr><tr><td class="align_left">τ = (ns, …, nd)</td><td class="align_center">The path from the source to the destination node</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The notations used in the paper.</div>

Mobile Information Systems

tab1

Table 1

Table 1: Event Driven Duty Cycling with Reinforcement Learning and Monte Carlo Technique for Wireless Network