스토리텔링 저작을 위한 서사정보 추출 시스템 설계 및 구현

Recently, the perceived value of stories has risen, which has created a greater focus on storytelling. Storytelling is method used for immersing an audience and prompting interest in the development of plot. This method has been receiving a lot of attention recently as an important technique in the cultural industry.

More specifically, there have many more cases of stories being created using authoring tool systems through Human-Computer Interaction (HCI). Compared to other countries, there have not been many studies regarding using such systems for storytelling in Korea.

This thesis proposes a system which automatically extracts narrative information, including key storytelling elements, that comprises the main components of a written story. Patterns for extracting narrative information nouns within the text are defined by applying a Korean natural language process technique to story data collection and analysis. Story data is then extracted using term frequency(TF).

To assess this narrative information extraction system, experiments were done to analyze data from six stories. The results determined using the automated character extraction method. The results showed that approximately 71.83% of the average precision ratio and performance had been confirmed.
Design and Implementation of Narrative Information Extraction System for Storytelling Authoring
Baek, Nam Ju
산업기술융합대학원 소프트웨어융합공학과
2015. 8
Table Of Contents

Ⅰ. 서론 1
A. 연구 배경 및 목적 1
B. 논문의 구성 2

Ⅱ. 관련 연구 3
A. 스토리텔링 저작 지원 기술 현황 3
1. 스토리텔링 저작을 위한 지능형 스토리 생성 기술 3
2. 스토리텔링 저작 지원 도구 5
3. 스토리텔링을 위한 서사구조 모델 9
B. 설화 데이터 분석을 위한 자연어 처리 시스템 13
1. 꼬꼬마 형태소 분석기 13
2. 한나눔 형태소 분석기 14
C. 토픽맵 17
1. 토픽맵 구조 및 구성요소 17
2. 토픽맵을 이용한 정보 시각화 20

Ⅲ. 서사정보 자동 추출 시스템 설계 및 구현 22
A. 서사정보 자동 추출 시스템 설계 및 인터페이스 정의 22
1. 시스템 구성도 22
2. 개발 환경 23
3. 사용자 인터페이스(User Interface) 23
B. 서사정보 추출을 위한 전처리 및 명사 추출 방법 24
1. 특수문자 제거 및 POS(Part-Of-Speech) Tagging 24
2. 서사정보 추출을 위한 명사 패턴 정의 및 추출 26
C. 서사정보 추출을 위한 TF 알고리즘 활용 방법 27
1. TF(Term Frequency) 값을 이용한 서사정보 후보 추출 27
2. 불용어 명사 목록 정의 29
3. 불용어 태그를 이용한 TF별 명사 재추출 30

Ⅳ. 실험 및 평가 33
A. 실험 데이터 33
B. 실험 평가 및 결과 34
1. 실험 평가 방법 34
2. 실험 결과 34
C. 실험 결과에 따른 토픽맵 기반 시각화 응용방안 36
1. 서사정보를 이용한 토픽맵 구축 36
2. 토픽 및 관계 생성 39

Ⅴ. 결론 및 제언 42

참고문헌 43
Engineering > Theses(Master)(산업기술창업대학원)
