CHOSUN

Disease risk prediction incorporating genetic variants from association analysis with disease phenotype and endophenotype

Metadata Downloads
Author(s)
김윤태
Issued Date
2022
Abstract
Genome-wide association study (GWAS) using vast amounts of genetic data generated by high-throughput technologies such as microarray and next generation sequencing discovered new genes and paths that were previously unknown, and expected that disease prediction, diagnosis, and treatment would develop.

However, in the case of complex diseases, the performance of models made of Polygenic Risk Score (PRS), which is commonly used, shows low performance of around 0.6 area under the curves (AUCs). This indicates that various heterogeneity of the disease cannot be considered with the existing GWAS using the phenotype of the disease. As an alternative, it is expected to improve performance by using endophenotype to find new genetic variations related to diseases and develop disease prediction models.

Alzheimer's disease (AD) initially accumulates amyloid beta protein in the brain, and then hyperphosphorylation of Tau protein occurs, resulting in neurodegeneration and ultimately dementia. Early diagnosis is essential for AD because symptoms appear after neurodegeneration. However, an accurate early diagnosis of AD is only a method of measuring the amount of amyloid beta or tau by positron emission tomography or cerebrospinal fluid. These methods are expensive, time-consuming, and invasive. Therefore, there is a need for an early diagnosis method that is inexpensive and less time-consuming and non-invasive or a screening method to find a high-risk group for Alzheimer's disease.

In this study, GWAS using phenotype and structural magnetic resonance imaging, an endophenotype of AD, was conducted using Korean AD data obtained from Gwang-ju alzheimer’s & related dementias cohort. Then a new PRS model was developed using genetic variants found through this.

Three types of models were developed, using genetic variants known to be associated with AD through existing GWAS analysis (AD Gene model), a model using genetic variants related to newly discovered genes (Novel Gene model), and a combination of genetic variants related to AD and newly discovered genes (AD & Novel Combine model). For real-world application of the model, accuracy, sensitivity, and specificity at optimal threshold were evaluated as performance, and the best model was the AD Gene model.

When measuring performance with two independent validation datasets, the AD Gene model has an average AUC of 72%, an average accuracy of 66.5%, an average sensitivity of 79.5%, and an average specificity of 53%. In addition, we measured cumulative proportion of amyloid positivity incidence across the age, two groups predicted as amyloid positive and negative showed a clear separation. The ability of separation was clearer in mild cognitive impairment subjects but also valid in subjects with the cognitive normal. From these results, it was confirmed that the performance of the model was improved by using the endophenotype, and the average sensitivity was 79.5%, it is expected that this model can be applied to screening tests that classify AD high-risk groups.| 인간 게놈 프로젝트 이후 마이크로어레이와 차세대 염기서열 분석법같은 대량신속처리 기술이 발전하면서 생성된 방대한 양의 유전체 자료를 활용한 전장유전체연관분석을 통해 이전에는 알지 못했던 새로운 유전자와 경로들을 발견하였고, 이를 통해 질병 예측, 진단, 치료법이 발전할 것이라고 기대하였다.

그러나 복합질환의 경우 일반적으로 많이 사용되는 다중유전자위험점수로 만든 모델의 성능을 보았을 때 곡선하면적 0.6대의 낮은 성능을 보인다. 이는 질병의 표현형을 활용한 기존의 전장유전체연관성 연구로는 질병의 다양한 이질성을 고려하지 못한다는 것을 보여준다. 이에 대한 대안으로 표현형 외에 내적표현형을 활용하여 새로운 질병연관 유전변이를 찾아내어 질병예측모델을 만들면 성능이 향상될 것이라 기대된다.

알츠하이머병은 초기에 뇌에 아밀로이드베타단백질이 축적되고, 이후에 타우 단백질의 과인산화가 일어나 신경퇴화가 일어나 인지기능이 저하되고 궁극적으로 치매증상을 띄게 되는 질병이다. 알츠하이머병은 신경퇴화가 일어난 뒤에 증상이 나타나기 때문에 조기진단이 필수인 질병이다. 하지만 현재 알츠하이머병을 진단할 수 있는 방법은 아밀로이드 양전자 단층촬영이나 뇌척수액을 추출하여 아밀로이드베타의 양을 측정하는 방법 뿐이다. 이러한 방법은 비용과 시간이 많이 들고, 침습적인 방법이기 때문에 비용과 시간이 적게들면서 비침습적인 조기진단법이나 알츠하이머병 고위험군 대상자를 찾아내기 위한 선별검사방법이 필요하다.

본 연구는 광주치매코호트연구단에서 한국인 알츠하이머병 데이터를 사용하여 표현형을 활용한 전장유전체연관성연구를 통해 알아낸 유전변이와 알츠하이머병의 내적표현형인 구조적 자기공명영상에서 추출한 겉질밑 부피을 활용한 전장유전체연관성연구를 통해 얻은 유전변이를 이용하여 알츠하이머병 위험예측을 위한 새로운 다중유전자위험점수 모델을 만들었다.

총 3가지 모델을 만들어 성능을 측정하였으며 기존 전장유전체연관분석을 통해 알츠하이머병과 연관되어 있다고 알려진
유전자와 관련된 유전변이들을 사용한 모델(AD Gene model), 기존에 알려지지 않았던 새롭게 발견된 유전자에 관련된 유전변이들을 사용한 모델(Novel Gene model), 알츠하이머병과 연관된 유전자와 관련된 유전변이들과 새롭게 발견된 유전자와 관련된 유전변이들을 합쳐서 사용한 모델(AD & Novel Combine model)이다. 모델의 실제 적용을 위해 최적의
임계값에서의 정확도, 민감도, 특이도를 성능으로 평가하였고, 최적의 모델은 “AD Gene” 모델이었다.

“AD Gene” 모델은 독립적인 두 개의 검증 데이터 세트로 성능을 측정했을 때 평균 곡선하면적은 72%이며 평균 정확도는 66.5%, 평균 민감도는 79.5%, 평균 특이도는 53% 이다. 이러한 결과로부터 내적표현형을 활용하면 모델의 성능이 향상된다는 것을 확인할 수 있었으며, 평균 민감도가 79.5%로 준수한 성능을 보였다. 또한 알츠하이머병 환자 중 모든
증상이 존재하는 집단과 무증상단계 집단과 경도인지장애 집단에서 아밀로이드 베타 예측 결과를 바탕으로 두 개의 집단으로 나눠서 각 그룹별 아밀로이드 베타 양성 누적발생률을 확인 했을 때 두 집단이 잘 나뉘는 것을 확인할 수 있었다. 따라서 본 모델이 알츠하이머병의 고위험군을 구분하는 선별검사에 적용할 수 있을 것이라 기대한다.
Alternative Title
질병 표현형과 내적표현형 연관 유전변이를 활용한 질병위험예측
Alternative Author(s)
Yoontae Kim
Affiliation
조선대학교 일반대학원
Department
일반대학원 글로벌바이오융합학과
Advisor
김정수
Awarded Date
2022-02
Table Of Contents
LIST OF TABLES ⅲ
LIST OF FIGURES ⅳ
ABSTRACT ⅴ

Ⅰ. INTRODUCTION 1
Ⅰ-1. Importance and limitation of GWAS 1
Ⅰ-2. Imaging GWAS 2
Ⅰ-3. Alzheimer’s disease 2
Ⅰ-4. Genomic prediction of AD 3

Ⅱ. MATERIALS AND METHOD 5
Ⅱ-1. Dataset description 5
Ⅱ-1.1 Characteristics of the discovery samples 5
Ⅱ-1.2 Characteristics of the validation samples 6
Ⅱ-2. Genotyping & QC 11
Ⅱ-3. MRI acquisition & QC 11
Ⅱ-4. Feature selection 11
Ⅱ-5. PRS generation and predictability modelling 14

Ⅲ. RESULTS 16
Ⅲ-1. Direct application of GWAS finding in Korean AD 16
Ⅲ-2. Performance of the three models in validation sets 19
Ⅲ-3. Performance of the best model in varying symptom 24

Ⅳ. DISCUSSION 26

Ⅴ. FURTHER STUDY 27

Ⅵ. 초 록 29

Ⅶ. REFERENCES 32
Degree
Master
Publisher
조선대학교 대학원
Citation
김윤태. (2022). Disease risk prediction incorporating genetic variants from association analysis with disease phenotype and endophenotype.
Type
Dissertation
URI
https://oak.chosun.ac.kr/handle/2020.oak/18499
http://chosun.dcollection.net/common/orgView/200000589056
Appears in Collections:
General Graduate School > 3. Theses(Master)
Authorize & License
  • AuthorizeOpen
  • Embargo2022-02-25
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.