A Study on Multi-Class Teeth Segmentation in Dental 2D Panoramic X-ray Images
- Author(s)
- 가푸어 무함마드 아프난
- Issued Date
- 2024
- Keyword
- Segmentation, teeth segmentation, multi-class teeth segmentation
- Abstract
- 본 논문에서는 M-Net 기반 Swin Transformers(Swin Transformers) 및 TAB (Teeth Attention Block)라는 새로운 구성 요소를 갖는 다중 클래스 치아 분할 아키텍처를 제안하였다. 기존 치아 영상 분할 방법은 복잡하고 다양한 치아 형태로 인해 정확하고 신뢰할 수 없는 분할 결과가 발생하는 문제가 존재한다. 제안하는 치안 분할 방법에서 TAB는 치아의 복잡한 구조에 초점을 맞추는 새로운 어텐션 메커니즘을 이용한다. TAB의 어텐션 메커니즘은 치과 파노라마 X-ray 영상에서 치아 특징의 주요 요소를 정확하게 강조하여 보다 정확한 분할 결과를 도출할 수 있도록 도움을 준다. 또한 제안하는 치아 분할 아키텍처는 지역 및 전역의 치아 정보를 효과적으로 캡처하여 각 치아와 그 주변 구조를 정확하게 분할할 수 있도록 한다. 또한 U-Net의 왼쪽 다리 (left-leg)와 오른쪽 다리(right-leg)를 활용하는 다중 스케일 감독 방법 채택하여 향상된 영상의 특징 표현으로 분할 성능을 향상시킨다. 제안 방법에서는 클래스 불균형 문제를 해결하기 위해 자승 Dice 손실 함수를 적용하여 보다 정확한 치아 분할할 수 있도록 하였다. 제안된 방법은 실제 치과 진단에서 촬영한 파노라마 치아 X-ray 데이터 세트에서 검증하였다. 실험 결과는 여러 치과 이미지 데이터 세트에서 제안된 치아 분할 아키텍처의 성능을 검증하였고 객관적인 분할 성능 수치 및 시각적 검사에서 기존 치아 분할 방법을 크게 능가하는 것을 실험적으로 검증하였다.|This thesis proposed a cutting-edge multiclass teeth segmentation architecture that integrates an M-Net-like structure with Swin Transformers and a novel component named Teeth Attention Block (TAB). Existing teeth image segmentation methods have issues with less accurate and unreliable segmentation outcomes due to the complex and varying morphology of teeth, although teeth segmentation in dental panoramic images is essential for dental disease diagnosis. An M-Net-like structure with Swin Transformers and TAB is incorporated into the proposed novel teeth segmentation model. The proposed TAB utilizes a unique attention mechanism that focuses specifically on the complex structures of teeth. The attention mechanism in TAB precisely highlights key elements of teeth features in panoramic images, resulting in more accurate segmentation outcomes. The proposed architecture effectively captures local and global contextual information, accurately defining each tooth and its surrounding structures. Furthermore, a multiscale supervision strategy is employed, which leverages the left and right legs of the U-Net structure, boosting the performance of the segmentation with enhanced feature representation. The squared Dice loss is utilized to tackle the class imbalance issue, ensuring accurate segmentation across all classes. The proposed method was validated on a panoramic teeth X-ray dataset, which was taken in a real-world dental diagnosis. The experimental results demonstrate the efficacy of the proposed architecture for tooth segmentation on multiple benchmark dental image datasets, outperforming existing state-of-the-art methods in objective metrics and visual examinations.
- Alternative Title
- 치과 2D 파노라마 X-ray 영상에서 멀티클래스치아 분할에 관한 연구
- Alternative Author(s)
- Ghafoor Muhammad Afnan
- Affiliation
- 조선대학교 일반대학원
- Department
- 일반대학원 IT융합학과
- Advisor
- Bumshik Lee
- Awarded Date
- 2024-02
- Table Of Contents
- List of Figures iii
List of Tables iv
Abstract . v
한 글 요 약 . vii
1. Introduction . 1
1.1 Overview 1
1.2 Research Objective 6
1.3 Thesis Layout . 6
2. Related Works 7
3. Proposed Network . 14
3.1 Overall Architecture . 14
3.2 Pre-Processing . 15
3.3 Encoder and Decoder 17
3.4 Swin Transformer Blocks 18
ii
3.5 Teeth Attention Block . 19
3.6 Loss Functions and Supervision . 23
4. Experimental Results 26
4.1 Implementation Details 26
4.2 Experimental Setup 26
4.3 Results and Discussion 31
4.4 Ablation Study . 37
5. Conclusion . 42
Acknowledgment 43
References . 44
Publications . 49
iii
- Degree
- Master
- Publisher
- 조선대학교 대학원
- Citation
- 가푸어 무함마드 아프난. (2024). A Study on Multi-Class Teeth Segmentation in Dental 2D Panoramic X-ray Images.
- Type
- Dissertation
- URI
- https://oak.chosun.ac.kr/handle/2020.oak/17963
http://chosun.dcollection.net/common/orgView/200000720320
-
Appears in Collections:
- General Graduate School > 3. Theses(Master)
- Authorize & License
-
- AuthorizeOpen
- Embargo2024-02-23
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.