CHOSUN

A Study on Deep Reinforcement Learning for Energy Conservation in IoT Tracking Applications

Metadata Downloads
Author(s)
SULTAN SALMAN MD
Issued Date
2021
Abstract
사물 인터넷 (IoT) 기반 표적 추적 시스템은 움직이는 표적 위치를 수집하기 위해 많은 센서 디바이스가 공동으로 연결된 스마트 팜, 스마트 팩토리, 스마트 시티와 같은 애플리케이션에서 필요하다. 각 센서 디바이스는 배터리로 작동하되 지속적으로 실행되며, 디바이스가 위치한 환경에서 목표 정보를 인식하는 과정으로 에너지를 소비한다. 기존의 실시간 IoT 추적 애플리케이션에서는 센서 디바이스의 에너지 소비를 줄이기 위해 클러스터링, 정보 기반 및 기타 접근 방식과 같은 많은 방법을 사용하여 최상의 센서 디바이스를 선택했다. 그러나 추적 애플래케이션에서 센서 선택 문제를 해결하기 위해 기계 학습 방법, 특히 심층 강화 학습 (Deep RL)을 적용하는 것은 센서 노드의 배터리 수명 제한으로 매우 까다롭다. 본 연구에서 제안된 시스템은 IoT 타켓 애플리케이션에서는 에너지 소비 문제를 극복하기 위해 Deep Q-Network 기반 심층 강화 학습 모델을 활용하였다. 시뮬레이션 결과는 최상의 센서 선택 및 에너지 소비 측면에서 유리한 기능을 보여주고 있다.|The Internet of Things (IoT) based target tracking system is required for applications such as smart farm, smart factory and smart city where many sensor devices are jointly connected to collect the moving target positions. Each sensor device continuously runs on battery-operated power, consuming energy while perceiving target information in a particular environment. To reduce sensor device energy consumption in real-time IoT tracking applications, many traditional methods such as clustering, information-driven, and other approaches have previously been utilized to select the best sensor. However, applying machine learning methods, particularly deep reinforcement learning (Deep RL), to address the problem of sensor selection in tracking applications is quite demanding because of the limited sensor node battery lifetime. In this study, the proposed system utilized a long short-term memory deep Q-network (DQN) based Deep RL target tracking model to overcome the problem of energy consumption in IoT target applications. The simulation results show favorable features in terms of the best sensor selection and energy consumption.
Alternative Title
IoT 트래킹 응용에서 에너지 절약을 위한 강화학습에 관한 연구
Alternative Author(s)
술탄 살만 엠디
Affiliation
조선대학교 일반대학원
Department
일반대학원 정보통신공학과
Advisor
변재영
Awarded Date
2021-08
Table Of Contents
ABSTRACT v
한 글 요 약 vi

I. INTRODUCTION 1
A. Motivation 1
B. Contributions 2
C. Thesis Layout 3

II. Background 4
A. Reinforcement Learning (RL) 4
B. Tabular Q-Learning 4
C. Deep-Q-Network 5
1. Experience Replay Memory 6
2. Seperate Target Q-approximator 7
D. Long Short-Term Memory (LSTM) 7
E. Activation Function 9
1. Rectifier Linear Unit (ReLU) 9
2. Sigmoid 9
F. Kalman Filter 10
1. Prediction Step 12
2. Updated Step 13

III. Related Works 14
A. Tracking Application based on Information-driven Approaches 14
B. Machine Learning based Techniques for Tracking Application 15
1. Unsupervised Learning based Clustering Approaches 15
2. Reinforcement Learning Approaches 16

IV. System Overview and Best Sensor Selection 18
A. System Overview 18
B. Best Sensor Selection 19

V. The Proposed LSTM-DQN-epsilon-greedy Method 20
A. State Space 20
B. Preprocess State 20
C. Action Space 21
D. Energy Consumption Model 22
E. Binary Based Reward Space 23

VI. Simulation and Results 26
A. Environment Setup and Hyper Parameters 26
B. Results 29
1. Cumulative Rewards 29
2. Best Sensor Selection Accuracy 30
C. Comparative Analysis 32
1. Average Cumulative Reward 32
2. Loss Convergence 34
3. Average Best Sensor Selection Accuracy 35
4. Average Cumulative Energy Consumption 36

VII. Conclusion and Future Directions 39

References 40

Publication 46

ACKNOWLEDGEMENTS 47
Degree
Master
Publisher
조선대학교 대학원
Citation
SULTAN SALMAN MD. (2021). A Study on Deep Reinforcement Learning for Energy Conservation in IoT Tracking Applications.
Type
Dissertation
URI
https://oak.chosun.ac.kr/handle/2020.oak/17044
http://chosun.dcollection.net/common/orgView/200000490409
Appears in Collections:
General Graduate School > 3. Theses(Master)
Authorize & License
  • AuthorizeOpen
  • Embargo2021-08-27
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.