보안 취약점 데이터 기반 보안 지식 그래프 구축 및 확장
- Author(s)
- 안현진
- Issued Date
- 2024
- Abstract
- Construction and Expansion of a Security Knowledge Graph Based on Vulnerability Data HyunJin An Advisor : Prof. JunHo Choi, Ph.D Industrial Technology and Entrepreneurship Chosun University Recently, various studies are being conducted to build and apply knowledge graphs from text data. In the security field, the need for knowledge graphs is increasing to respond to new security vulnerabilities. There is a lot of research going on to create a security knowledge graph. However, because security vulnerabilities continue to arise, updating the security knowledge graph is essential. Therefore, in this paper, it will be suggested a method to 1) cluster of Vulnerability data based on text similarity and delete less relevant data, 2) extract Relation Triples from Vulnerability data using the REBEL model, 3) expand the knowledge graph using Google News data related to Entities. The expanded knowledge graph is expected to increase accuracy in tasks such as link prediction. In the experiment of this paper, Four embedding models, "ComplEx", "TransE", "DistMult", and "HolE", were trained using the generated knowledge graph. Afterwards, it was evaluated using the “MMR”, “MR”, and “Hits@N”. As a result, the “HolE” model showed the highest performance. Also it was confirmed that the expansion of the knowledge graph increases the performance of the embedding model.
- Alternative Title
- Construction and Expansion of a Security Knowledge Graph Based on Vulnerability Data
- Alternative Author(s)
- An HyunJin
- Affiliation
- 조선대학교 산업기술창업대학원
- Department
- 산업기술창업대학원 소프트웨어융합공학과
- Advisor
- 최준호
- Awarded Date
- 2024-02
- Table Of Contents
- Ⅰ. 서론 · 1
A. 연구의 배경 및 목적 1
B. 연구 내용 및 구성 2
Ⅱ. 관련 연구 3
A. 지식 그래프 · 3
B. 딥러닝 기반 지식 그래프 생성 · 4
Ⅲ. 보안 취약점 데이터 기반 보안 지식 그래프 구축 및 확장 6
A. 보안 지식 그래프 생성 및 확장 프레임워크 6
B. 보안 취약점 데이터 수집 및 전처리 7
1. CVE 데이터 수집 및 전처리 7
2. 크롤링을 이용한 Exploit 데이터 수집 · 9
C. 텍스트 유사도 기반 CVE 데이터 분류 10
1. 텍스트 유사도 기반 분류를 위한 전처리 11
a. CVE Description 열 토큰화 11
b. 텍스트 유사도 기반 CVE 데이터 분류화를 위한 워드 임베딩 ·· 11
2. KMeans 알고리즘을 이용한 CVE 데이터 군집화 13
D. 딥러닝 기반 보안 지식 그래프 구축 15
1. REBEL 모델 15
2. REBEL을 이용한 보안 지식 그래프 생성 17
3. 보안 지식 그래프 시각화 · 18
E. 구글뉴스를 이용한 보안 지식 그래프 확장 · 19
1. 구글 뉴스 데이터 크롤링 · 19
2. News 데이터로부터의 triplet 추출 및 지식 그래프 확장 · 20
F. 보안 지식 그래프 임베딩 21
1. TransE 임베딩 21
2. DistMult, ComplEx 임베딩 · 22
3. HolE 임베딩 22
Ⅳ. 실험 및 평가 · 24
Ⅴ. 결론 27
참고문헌 · 29
- Degree
- Master
- Publisher
- 조선대학교 산업기술창업대학원
- Citation
- 안현진. (2024). 보안 취약점 데이터 기반 보안 지식 그래프 구축 및 확장.
- Type
- Dissertation
- URI
- https://oak.chosun.ac.kr/handle/2020.oak/17911
http://chosun.dcollection.net/common/orgView/200000724688
-
Appears in Collections:
- Engineering > 3. Theses(Master)
- Authorize & License
-
- AuthorizeOpen
- Embargo2024-02-23
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.