드라마 리뷰 속성별 감성분류 방법

Unlike the past when dramas were mainly limited to terrestrial channels, numerous dramas are being broadcast through Internet web dramas as well as cable. People's opinions have become important for those who choose to watch dramas because it can be fun even if they have low ratings. Accordingly, people's opinions can be helpful because they can understand how they feel and watch dramas without a separate investigation process. However, the time and expense of reading and selecting all of the review data, which was the opinion of people online, led to the need for data analysis techniques to automatically analyze and meter the information needed in the review data. And those objectives are bringing about the development of emotional analysis. Existing emotional analysis analyzes the review written by viewers to find out whether it is positive or negative, but it can also mean that there are sentences that are unrelated to the drama and that one wants to know what one likes or dislikes. Therefore, in this thesis, one can select a property keyword related to a drama and provide information considering one's preferences to those who want to watch the drama through emotional classification method by nature. Similar terms, which refer to attributes within a sentence, also use the Word2Vec model to avoid missing sentences related to the attribute. This paper also presents the results for verifying efficiency through comparative experiments with the proposed classification of sensitivities by attributes and with existing emotional analysis, and also shows examples of the popularity ranking of dramas by nature based on positive/negative results.
드라마가 주로 지상파 채널에만 국한되었던 과거와 달리, 수많은 드라마들이 케이블뿐만 아니라 인터넷 웹 드라마를 통해 방송되고 있다. 시청률이 낮더라도 재미있을 수 있기 때문에 드라마를 선택한 사람들에게 사람들의 의견은 중요해졌다. 이에 따라 별도의 조사 과정 없이 드라마의 감정과 시청을 이해할 수 있어 도움이 될 수 있다. 그러나, 모든 검토 데이터를 읽고 선택하는 데 드는 시간과 비용은, 온라인 상에서 사람들의 의견이었던, 검토 데이터에 필요한 정보를 자동으로 분석하고 측정하는 데이터 분석 기법이 필요하게 되었다. 그리고 그러한 목표들은 감성 분석의 발전을 가져오고 있다. 기존의 감성 분석은 그것이 긍정적인지 부정적인지를 알기 위해 시청자들이 쓴 리뷰를 분석하지만, 드라마와 관련이 없는 문장들이 있고 좋아하는 것과 싫어하는 것이 무엇인지 알고 싶어한다는 것을 의미할 수도 있다. 따라서 본 논문에서는 드라마와 관련된 속성 키워드를 선정해 자연적 감성 분류 방식으로 시청하고자 하는 이들에게 선호도를 고려한 정보를 제공할 수 있다. 문장의 속성을 지칭하는 유사한 용어는 속성과 관련된 문장이 누락되지 않도록 Word2Vec 모델도 사용한다. 본 논문은 또한 속성별, 기존 감성 분석별로 감성 분류를 제안하여 비교 실험을 통해 효율성을 검증하는 결과를 제시하고, 긍정/부정적 결과를 바탕으로 속성별 드라마 인기 순위 예제를 제시한다.
Method of Emotion Classification by Attributefor Drama Review
Han, Doo Jin
조선대학교 산업기술융합대학원
산업기술융합대학원 소프트웨어융합공학과
2019. 2
Table Of Contents

I. 서론 1
A. 연구 배경 및 목적 1
B. 연구 내용 및 구성 3

II. 관련연구 4
A. 감성분석 4
1. 사전 기반의 감성분석 6
2. 속성 단위의 극성 분석 7
B. Word2Vec 9

III. 드라마 리뷰 속성별 감성분류 방법 11
A. 시스템 구성도 11
B. 속성 사전 구축 13
1. 데이터 전처리 및 속성단어 유사어 추출 13
2. 속성사전 구축 17
C. 속성별 감성분석 18
1. 속성별 문장 분류 18
2. 속성별 감성 어휘 추출 20
3. 속성별 문장 감성분류 21

IV. 실험 및 평가 24
A. 실험 결과 및 비교 실험 25

V. 결론 및 제언 29

참고문헌 31
조선대학교 산업기술융합대학원
한두진. (2018). 드라마 리뷰 속성별 감성분류 방법
