CHOSUN

Trans-ethnic genome-wide meta analysis and genomic prediction of type 2 diabetes

Metadata Downloads
Author(s)
김민수
Issued Date
2023
Keyword
Type 2 diabetes (T2D), Meta-analysis, Genome-wide association study (GWAS)
Abstract
인간 게놈 프로젝트(Human Genome Project, HGP) 이후, 시퀀싱 기술의 발전과 함께 방대한 양의 유전체 데이터 생산이 가능해 졌다. 이를 활용한 전장유전체연관성분석(genome-wide association study, GWAS)으로 여러 질병과 관련된 변이가 발굴되어 질병의 진단, 예측 및 치료에 활용 가능성이 높아졌다.
현대의 주요 공중 보건 문제로 지목되는 제2형 당뇨(type 2 diabetes, T2D) 또한 GWAS를 통해 서구화된 식습관, 운동 부족과 같은 환경적 요인 외에도 유전적 요인에 의해 발병한다는 것을 밝혔으며, 새로운 T2D 감수성 유전자 좌위의 발견은 질병의 병태생리학을 이해하는 데 상당한 기여를 했다.
그러나 T2D 예측을 위한 PRS(polygenic risk score)모델은 AUC(area under the curve)가 약 0.6 정도로 예측 성능이 좋지 않으며, 실제 질병 진단 및 예측을 위한 이러한 유전자 좌위의 임상적 유용성은 빈약하고 제한적이다. 이러한 결과는 T2D 예측을 위한 보다 새로운 변이의 존재 및 발굴된 변이와 질병과의 연관성에 대한 추가적인 검증이 필요함을 시사한다.
따라서 본 연구는 다양한 인종에서 수행된 T2D에 대한 GWAS 결과를 활용한 메타분석을 통해 범인종적으로 작동하는 새로운 T2D 발병 원인 변이를 규명하고, 이에 대한 생물학적 기전을 확립하기 위한 기능 분석을 했다.
먼저 249,625명으로 구성된 2개의 독립된 동아시아 자료(Korean Genome and Epidemiology Study, KoGES; Biobank Japan, BBJ) 그리고 총 379,665명으로 구성된 3개의 독립된 서양인 자료(European Prospective Investigation into Cancer, EPIC; UK Biobank, UKBB; Finnish Biobank, FinnGen)를 사용하여 T2D에 대한 인종별 전장 유전체 메타분석(genome-wide meta-analysis, GWMA)을 수행하고, 추가적으로 범인종 T2D GWMA를 수행했다.
범인종 메타분석 결과, Bonferroni임계수준(P < 5e-8)에서 2개의 인종별 메타분석결과에서는 발견되지 않은 3,423개의 유의한 SNP(single nucleotide polymorphisms)을 선별했으며, 유전자 주석(gene annotation)을 통해 최종적으로 73개의 유전자만이 특이적으로 발견됨을 확인했다.
광주치매코호트(Gwangju Alzheimer's & Related Dementias ,GARD)자료를 사용한 T2D에 대한 GWAS를 통해, 개별데이터에서 수준에서 총 5개의 유전자가 검증되었다(P < 0.01). 검증된 5개의 유전자를 GWAS Catalog 에 검색한 결과, 4개의 유전자(DNAH7, TRIM66, ANKH, SYMPK)는 T2D와 관련성이 보고되었고, 1개의 유전자(SLC39A10)는 새롭게 밝혀진 유전자였다. 새로운 유전자에 대한 기능 분석을 통해 해당 유전자가 세포액의 아연농도와 베타세포의 인슐린 분비를 조절하여 포도당 대사와 관련하는 zinc transporter 연관 유전자임을 확인했다. 또한, SLC39A10은 해당 유전자가 위치한 2번 염색체 내의 chromatin interaction 분석과 eQTLs 분석을 통해 T2D연관 유전자인 DNAH7, HECW2, STK17B 등과의 상호작용을 확인할 수 있었다. 종합적으로, 기능분석의 결과들은 SLC39A10와 T2D의 높은 관련성을 시사했다.
결론적으로 범인종 GWMA통해서 새로운 T2D 연관변이를 식별할 수 있었으며, 이에 대한 추가적인 개별 데이터 수준에서의 검증과 기능분석을 통해 T2D와의 높은 연관성을 입증했다. 이 변이들은 T2D 진단 및 예측을 위한 PRS 모델에 적용될 수 있을 것이며, 향후 임상에서 T2D 선별검사에 기여할 수 있을 것으로 기대된다.|After the Human Genome Project (HGP), it has become possible to produce massive amounts of genome data with the development of sequencing technology. Genome-wide association study (GWAS) using these data has discovered single nucleotide polymorphisms (SNPs) related to various diseases, increasing the possibility of using them for diagnosis, prediction, and treatment of diseases.
GWASs have reported that type 2 diabetes (T2D), a major public health challenge in modern society, is caused by genetic factors in addition to environmental factors such as a high-nutrition diet and lack of exercise. GWASs have discovered numerous T2D-susceptible loci, leading to significant contributions to understand the pathophysiology of the disease.
However, the polygenic risk score (PRS) model for T2D prediction has low predictive performance with the AUC of around 0.6 and the clinical assessment using these loci for disease diagnosis and prediction is limited. These limitations suggest that there will be more causal variants for T2D prediction, and functional validation is needed to establish biological mechanisms for the association with disease among novel findings.
In this study, meta-analyses using the GWASs of T2D performed in various ethnicities were used to identify trans-ethnic specific novel T2D-associated loci. In addition, functional analyses of those SNPs were conducted to identify the biological mechanism.
First, East Asian specific T2D genome-wide meta-analysis (GWMA) was conducted with two different cohorts (n = 249,625), i.e., the Korean Genome and Epidemiology Study (KoGES) and the Biobank Japan (BBJ) project, and also Caucasian specific T2D GWMA conducted with three different cohorts (n =379,665), i.e., the European Prospective Investigation into Cancer (EPIC), UK Biobank (UKBB) and Finnish Biobank (FinnGen). Finally, trans-ethnic T2D GWMA was conducted with all 5 publicly available cohorts.
As a result of trans-ethnic GWMA, 3,424 SNPs were identified at the genome-wide significance level (P < 5e-8), which were not identified in the other GWMAs conducted by ethnicity. And it was confirmed that 73 novel genes were finally identified at the gene level through gene annotation.
Through T2D GWAS using Gwangju Alzheimer's & Related Dementias (GARD) data, 5 genes were validated at the individual data level (P < 0.01). Based on the GWAS Catalog database, four of these genes (DNAH7, TRIM66, ANKH, and SYMPK) have already been reported as T2D-associated genes, and only one gene (SLC39A10) was discovered as a novel gene. Functional analysis of the novel gene confirmed that it is a zinc transporter-related gene related to glucose metabolism by regulating zinc concentration in cell fluid and insulin secretion in beta cells. In addition, through chromatin interaction and eQTLs analysis on chromosome 2, where SLC39A10 is located, DNAH7, HECW2, and STK17B which are T2D-associated genes, were confirmed. Collectively, the functional analysis results suggested a high association between SLC39A10 and T2D.
In conclusion, T2D-related novel variants were identified through trans-ethnic GWMA, and a high association with T2D was demonstrated through validation at the individual data level and additional functional analysis. These variants can be applied to the PRS model for T2D diagnosis and prediction, and are expected to contribute to the T2D screening test.
Alternative Title
제2형 당뇨의 범인종적 전장 유전체 연관성 메타분석과 유전 위험 예측
Alternative Author(s)
Minsoo Kim
Affiliation
조선대학교 일반대학원
Department
일반대학원 글로벌바이오융합학과
Advisor
김정수
Awarded Date
2023-02
Table Of Contents
LIST OF TABLES ⅲ
LIST OF FIGURES ⅳ
ABSTRACT ⅴ
Ⅰ. INTRODUCTION 1
Ⅰ-1. Genetics of Type 2 diabetes (T2D) 1
Ⅰ-2. Limitation of previous T2D GWASs 2
Ⅰ-3. Genome-wide meta-analysis (GWMA) 3
Ⅱ. MATERIALS AND METHOD 4
Ⅱ-1. Dataset description 4
Ⅱ-1.1 Characteristics of the East Asian cohorts 4
Ⅱ-1.2 Characteristics of the Caucasian cohorts 4
Ⅱ-1.3 Characteristics of the validation dataset 5
Ⅱ-2. Genome-wide meta-analysis (GMWA) 7
Ⅱ-3. Validation with individual dataset 8
Ⅱ-3.1 Quality control (QC) and imputation of genotype data 8
Ⅱ-3.2 T2D GWAS 9
Ⅱ-4. Functional validation 10
Ⅲ. RESULTS 11
Ⅲ-1. Meta-analyses of T2D GWASs 11
Ⅲ-2. Functional validation of novel SNPs 17
Ⅲ-3. Validation of novel findings 21
Ⅳ. DISCUSSION 25
Ⅴ. 초 록 26
Ⅵ. REFERENCES 29
Ⅶ. APPENDIX 32
Degree
Master
Publisher
조선대학교 대학원
Citation
김민수. (2023). Trans-ethnic genome-wide meta analysis and genomic prediction of type 2 diabetes.
Type
Dissertation
URI
https://oak.chosun.ac.kr/handle/2020.oak/18575
http://chosun.dcollection.net/common/orgView/200000650278
Appears in Collections:
General Graduate School > 3. Theses(Master)
Authorize & License
  • AuthorizeOpen
  • Embargo2023-02-24
Files in This Item:
  • There are no files associated with this item.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.