딥러닝 기반 전력 계량데이터 결측 보정 모델에 대한 연구
- Author(s)
- 권혁록
- Issued Date
- 2022
- Keyword
- 결측 보정, 전력 계량데이터, 딥러닝
- Abstract
- Due to global warming, abnormal climates such as heavy snow, heatwaves, forest fires, and typhoons are occurring in many places around the world. Recognizing the seriousness of the climate change problem, the international panel on climate change (IPCC) general meeting in Songdo, Incheon in 2018 suggested that carbon dioxide emissions should be reduced by at least 45% compared to 2010 and achieved by 2050. Korea also prepared the "2050 Carbon Neutral Promotion Strategy" in December 2020. Five basic carbon-neutral directions: ①Expanding the use of clean electricity and hydrogen ②Improving innovative energy efficiency in connection with digital technology ③Promoting the development and commercialization of future carbon-free technologies ④Sustainable industrial innovation with a circular economy Promotion ⑤strengthening the carbon absorption function of nature and ecology such as forests, tidal flats, and wetlands were suggested. After all, the most basic thing to reduce carbon emissions is to reduce energy consumption. In order to save energy, it is possible to quickly build AMI and to reduce the active energy of consumers by supporting advanced time-based rate plans such as Time Of Use (TOU), Critical Peak Pricing (CPP), and Real Time Pricing (RTP) which are various additional services through two-way communication between AMI infrastructure.
KEPCO has also tried to build an AMI infrastructure across 22.5 million units by 2020, but about 10 million units have been built and operated, and the construction will be completed in the next few years. In addition, the government announced in 2020 that it would distribute AMI to 5 million apartments in its detailed task, “Building an Intelligent Smart Grid for Energy Management Efficiency”, through the announcement of the “Korean Version of the New Deal”. As the spread of AMI expands, various new services are emerging, and through this, they are taking a step further toward the goal of carbon neutrality, a government policy.
In order to provide additional services using power metering data, it is essential to acquire measurement data well from the electricity meter. However, due to the limitations and various factors of the communication network that makes up the AMI, there are about 2-5% missing values. In order to improve the quality of AMI additional services, it is necessary to predict and provide missing data. Therefore, various algorithms are being studied and applied to predict missing values of time series data generated by smart meters. However, if the accuracy is not high and the missing section is prolonged, the error increases and quality service cannot be provided.
The power usage data is not a general time series data prediction, but has a continuously increasing cumulative power usage value, so the cumulative power usage value should be predicted and corrected. Among the methods frequently used in the time series field so far, this paper identified their strengths and weaknesses through previous studies such as linear correction, similarity-based correction, Autoregressive Integrated Moving Average(ARIMA) prediction correction, and LSTM(Long Short-Term Memory) prediction correction. However, it was not appropriate to use the previously studied correction methods to predict cumulative power usage data. In particular, while simply predicting and correcting the data, there was an error that some data decreased the cumulative power usage value that appeared after correction.
To solve these problems, this paper proposes a model that applies weights to a deep learning-based CNN-LSTM combination model as a hybrid method that combines the advantages of linear correction method and correction method using LSTM deep learning algorithms superior to general methods used in time series.
To conduct the study, the study was conducted in the order of Business Understanding, Data Understanding, Data Preparation, Model Development, and Evaluation according to the standards of CRISP-DM(Cross Industry Standard Process for Data Mining) methodology. Through previous studies, the AMI infrastructure was first understood, the cause and ratio of data missing were identified, the characteristics and patterns of power usage data were identified through data analysis, and data was prepared through preprocessing. In order to improve the previously studied long short-term memory deep learning algorithm (LSTM), a deep learning model was created that combines a convolutional neural network (CNN) and a short-term memory circulating neural network (LSTM). The results predicted by the CNN-LSTM combined deep learning model were predicted by applying weights, which are the ratio of each section to the total amount of missing sections. And finally, the final cumulative power usage data was predicted by summing the cumulative power usage value before missing and the hourly power usage value.
When comparing and analyzing the experimental results of the preceding correction method and the proposed correction method, the correction method proposed in this paper was ‘0.218447’, which was about 40 times better than the ARIMA predictive correction method, and the square root mean square error (RMSE) was 6 times better. Even when compared with Mean Absolute Percentage Error(MAPE) value, the correction method proposed in this paper was ‘0.009899’, which was the best at about 45 times more than the ARIMA prediction correction method ‘0.448682’. In addition, the correction method proposed in this paper did not reduce the cumulative power usage value because the weight was applied to the total amount of missing sections, and even if there were many errors in predicting power usage over time, stability was very high.
When analyzing the experimental results according to the length of missing, the linear correction method was generally simpler and better than various methods with good performance in the time series field. The linear correction method had the highest accuracy until the number of data in the missing section was less than 7. Therefore, when applying to the AMI system, it is effective to determine the missing length first and use the linear correction method if the missing length is less than 7, and in the above case, it would be better to use the CNN-LSTM combination weighting correction method proposed in this paper.
In the future, if the proposed model was predicted and corrected with deep learning algorithm simply with time series data of power usage, research to increase its accuracy using more input values is needed to learn deep learning. In particular, since power usage has a very high correlation with climate, it is necessary to further increase accuracy by adding weather information.|지구 온난화로 폭설, 폭염, 산불, 태풍 등 이상기후 현상이 세계 여러 곳에서 나타나고 있다. 이에 국제사회는 기후변화 문제의 심각성을 인식하고 이를 해결하기 위해 2015년 파리기후변화협정, 2018년 인천 송도에서 개최된 IPCC(Intergovernmental Panel on Climate Change) 총회에서 지구온난화 1.5℃ 목표의 과학적 근거마련 등 2030년까지 이산화탄소 배출량을 2010년 대비 최소 45% 이상 감축하여야 하고, 2050년경에는 탄소중립(Netzero)을 달성하여야 한다는 경로를 제시했다. 우리나라도 2020년 12월 '2050 탄소중립 추진전략'을 마련했다. 여기에 탄소중립 5대 기본방향으로 ①깨끗하게 생산된 전기․수소의 활용 확대 ②디지털 기술과 연계한 혁신적인 에너지 효율 향상 ③탈 탄소 미래기술 개발 및 상용화 촉진 ④순환경제로 지속가능한 산업 혁신 촉진 ⑤산림, 갯벌, 습지 등 자연․생태의 탄소 흡수 기능 강화 등이 제시됐다. 결국 탄소배출량을 줄이기 위해서 가장 기본이 되는 것이 에너지 사용량을 줄이는 것이다. 에너지 절약을 위해서 AMI구축을 서두르고 AMI 인프라를 통해 소비자와 전력회사 간 양방향통신으로 다양한 부가서비스인 계시별 요금제(TOU; Time Of Use), 수요관리형 선택요금(CPP; Critical Peak Pricing), 실시간 요금제(RTP; Real Time Pricing) 등 고도화된 Time-based 요금제 지원을 통해 수용가의 능동적인 에너지 절감 참여 유도가 가능하다.
한국전력도 2020년까지 2,250만호 전체에 AMI 인프라를 구축하기 위해 노력했지만 약 1,000만호를 구축 운영 상태이며, 앞으로 수년 내에 구축이 완료될 것이다. 또한 정부는 2020년 “한국판 뉴딜” 발표를 통해 그 세부과제인 “에너지관리 효율화 지능형 스마트그리드 구축”에서 아파트 500만호를 대상으로 AMI를 보급하겠다고 발표했다. AMI 보급이 확대되면서 여러 가지 새로운 서비스들이 생겨나고 있고, 이를 통해 정부정책인 탄소중립 목표에 한걸음 더 나아가고 있다.
전력 계량데이터를 활용한 부가 서비스들을 제공하기 위해선 필수적으로 전력량계로부터 계량데이터들을 잘 취득하여야 한다. 그러나 AMI를 구성하고 있는 통신망의 한계 및 여러 가지 요인으로 인해서 계량데이터의 결측이 2~5% 가량 발생하고 있다. AMI 부가 서비스의 품질을 높이기 위해서는 결측 데이터를 예측하여 제공하는 것이 필요하다. 따라서 스마트미터에서 생성한 시계열 데이터의 값을 예측하기 위해 여러 가지 알고리즘들을 연구하고 적용하고 있다. 하지만 그 정확도가 높지 않고 결측 구간이 길어지면 오차가 커져 양질의 서비스를 제공할 수가 없다.
전력 사용량은 일반적인 시계열 데이터 예측이 아니라 계속 증가하는 누적 전력사용량 값을 가지고 있고, 따라서 누적 전력사용량 값을 예측해서 보정해야 한다. 지금까지 시계열 분야에서 자주 이용되는 방법들 중에 본 논문에서는 선형보정법, 유사도 기반 보정법, ARIMA(AutoRegressive Integrated Moving Average) 예측 보정법, 장단기메모리순환신경망(LSTM; Long Short-Term Memory) 예측 보정법 등을 선행 연구를 통해 그 장·단점을 파악하였다. 하지만 선행 연구된 보정법들을 누적 전력사용량 예측에 사용하는 것은 적합하지 않았다. 특히 단순히 데이터를 예측 후 보정하면서 일부 데이터들이 결측 후 나타나는 누적 전력사용량 값이 감소되는 오류가 발생했다.
본 논문에서는 이러한 문제들을 해결하기 위해 시계열에 사용되는 일반적인 방법들보다 선형보정법의 장점과 시계열 분야에서 우수한 LSTM 딥러닝 알고리즘을 이용한 보정법의 장점을 결합한 하이브리드 방법으로 딥러닝 기반 CNN-LSTM결합 모형에 가중치를 적용한 모델을 제안하였다.
연구를 수행하기 위해 CRISP-DM(Cross Industry Standard Process for Data Mining) 방법론의 표준에 따라서 업무 이해(Business Understanding), 데이터 이해(Data Understanding), 데이터 준비(Data Preparation), 모델 개발(Modeling), 평가(Evaluation) 순으로 연구를 진행하였다. 선행 연구를 통해서 AMI 인프라를 먼저 이해하고, 데이터 결측이 발생하는 원인, 비율 등을 파악했으며, 데이터 분석을 통해서 전력사용량 데이터들의 특징 및 패턴을 파악하고, 전처리를 통해서 데이터를 준비하였다. 선행 연구된 장단기메모리순환신경망(LSTM; Long Short-Term Memory) 딥러닝 알고리즘을 개선하고자 합성곱신경망(CNN; Convolutional Neural Network)과 장단기메모리순환신경망(LSTM)를 결합한 딥러닝 모형을 만들었고, CNN-LSTM결합 딥러닝 모형의 예측 결과에 결측 구간의 총량 대비 구간별 비율인 가중치를 적용하여 시간별 구간 전력사용량을 예측하였고, 마지막으로 결측 이전 누적 전력사용량 값에 시간별 구간 전력사용량을 합산하여 최종 누적 전력사용량을 예측하였다.
선행 보정법과 제안된 보정법의 실험 결과를 비교 분석했을 때 평균제곱오차 (MSE)는 본 논문에서 제안한 보정법이 ‘0.218447’로 ARIMA 예측 보정법보다 약 40배 이상 좋았고, 제곱근 평균제곱오차(RMSE)도 6배 이상 좋았다. 평균절대비오차(MAPE) 값으로 비교 시에도 본 논문에서 제안한 보정법이 ‘0.009899’ 으로 ARIMA 예측 보정법 ‘0.448682’ 보다 약 45배 이상으로 정확도가 가장 우수했다. 또한 본 논문에서 제안한 보정법은 결측 구간의 총량 대비 구간별 비율인 가중치를 적용하였기 때문에 누적 전력사용량 값이 감소되는 현상도 발생하지 않았고, 시간별 구간 전력사용량 예측 오차가 많이 발생하더라도 총 사용량 내에서 예측을 하게 되므로 안정성이 매우 높았다.
결측 길이에 따른 실험결과를 분석했을 때 일반적으로 시계열 분야에서 성능이 좋은 여러 가지 방법들보다 선형보정법이 간단하면서도 성능이 좋았다. 결측 구간의 데이터 개수가 7개 미만 일 때 까지는 선형보정법이 정확도가 가장 높았다. 그래서 AMI시스템에 적용 시에는 결측 길이를 먼저 판단하여 결측 길이가 7개 미만일 경우는 선형보정법을 사용하는 것이 효과적이고, 이상일 경우에는 본 논문에서 제안한 CNN-LSTM결합 가중치적용 보정법을 사용하는 것이 좋을 것이다.
향후, 제안된 모델이 단순히 전력사용량의 시계열 데이터만을 가지고 딥러닝 알고리즘으로 예측하여 보정하였다면, 딥러닝을 학습시키기 위해서 더 많은 입력값을 사용하여 그 정확도를 높이는 연구가 필요하다. 특히 전력사용량은 기후와 그 연관성이 매우 높기 때문에 날씨정보를 추가하여 정확도를 더 높일 필요가 있다.
- Alternative Title
- A Study on the Power Metering Data Missing Correction Model Based on Deep Learning
- Alternative Author(s)
- HyukRok Kwon
- Affiliation
- 조선대학교 일반대학원
- Department
- 일반대학원 컴퓨터공학과
- Advisor
- 김판구
- Awarded Date
- 2022-02
- Table Of Contents
- Ⅰ. 서론 1
A. 연구 배경 및 목적 1
B. 연구 내용 및 구성 8
Ⅱ. 선행연구 및 고찰 9
A. 지능형 계량 인프라 9
1. 스마트미터 9
2. AMI 통신 네트워크 12
3. AMI시스템 17
4. 계량데이터관리시스템(MDMS) 18
B. 결측 데이터 보정에 대한 선행연구 19
1. 선형보정법 19
2. 유사도 기반 보정법 23
3. ARIMA 예측 보정법 27
4. 장단기메모리순환신경망(LSTM) 예측 보정법 29
C. 선행 연구결과 고찰 31
1. 계량데이터 수집 관련 시사점 31
2. 결측 데이터 보정기법 관련 시사점 33
3. 계량데이터 결측 관련 종합 시사점 35
Ⅲ. 연구 방법론 37
A. 연구 방법론 개요 37
B. 연구 방법론 설정 39
1. 데이터 분석 방법 39
2. 데이터 보정모델 개발 방법 39
3. 데이터 보정모델 평가 방법 39
Ⅳ. CNN-LSTM결합 가중치적용 보정법 제안 42
A. 제안한 모델의 개념 42
1. 모델 필요성 42
2. 모델 이론 43
3. 모델의 처리 흐름 46
B. 제안 모델 개발 48
1. 데이터 분석결과 48
2. 모델 개발 56
Ⅴ. 실험 및 평가 64
A. 실험과정 및 결과 64
1. 자료 수집 및 대상 범위 선정 64
2. 실험 환경 66
3. 실험 절차 67
4. 실험 결과 77
B. 평가 분석 결과 100
1. 시간별 구간 전력사용량 비교 분석 결과 100
2. 선행 보정법과 제안된 보정법의 비교 분석 결과 102
3. 결측 길이에 따른 분석 결과 107
C. 연구 결과 활용 가능성 109
1. 연구 결과 적용 가능성 109
2. 연구 결과 적용시 고려사항 110
Ⅵ. 결론 및 제언 113
참고문헌 116
[부록 1] 계량기별 가장 유사한 전력사용량 패턴 탐색 126
[부록 2] CNN-LSTM결합 딥러닝 모델의 학습과정 및 예측결과 131
[부록 3] 계량기별 결측 보정 방법별 예측결과와 실제데이터 비교 141
국문초록 146
- Degree
- Doctor
- Publisher
- 조선대학교 대학원
- Citation
- 권혁록. (2022). 딥러닝 기반 전력 계량데이터 결측 보정 모델에 대한 연구.
- Type
- Dissertation
- URI
- https://oak.chosun.ac.kr/handle/2020.oak/17213
http://chosun.dcollection.net/common/orgView/200000600826
-
Appears in Collections:
- General Graduate School > 4. Theses(Ph.D)
- Authorize & License
-
- AuthorizeOpen
- Embargo2022-02-25
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.