잡음 환경에 강건한 음향 이벤트 위치 추정 및 탐지에 대한 연구
- Author(s)
- 신영서
- Issued Date
- 2023
- Abstract
- SELD(sound event localization and detection) aims to classify sound events, detect their onset and offset, and estimate their direction. Recent advancements in deep learning have led to the proposal of various SELD methods based on deep learning techniques.
However, existing deep learning-based SELD methods have mostly been developed and evaluated on audio data with minimal noise. Consequently, applying these methods in environments with high levels of noise often yields suboptimal performance. To address this issue, some approaches preprocess the data by applying noise reduction techniques before performing SELD, but this can be time-consuming.
To overcome these challenges, this study proposes a SELD model that incorporates deep learning-based speech enhancement techniques. The proposed model combines a U-net architecture for speech enhancement and a SELDnet for SELD, enabling end-to-end processing of noise reduction and SELD tasks.
To evaluate the proposed method, experiments were conducted using datasets containing diverse levels of noise. The results demonstrated that the proposed model outperformed existing SELD models in environments with high levels of noise, although it showed slightly lower performance in noise-free environments.
- Alternative Title
- A Study on Robust Sound Event Localization and Detection in Noisy Environment
- Alternative Author(s)
- Shin, Yeongseo
- Affiliation
- 조선대학교 일반대학원
- Department
- 일반대학원 컴퓨터공학과
- Advisor
- 전찬준
- Awarded Date
- 2023-08
- Table Of Contents
- 제1장 서론 1
제1절 연구 배경 1
제2절 연구 목적 5
제2장 배경 이론 및 관련 연구 7
제1절 배경 이론 7
1. 음향 이벤트 탐지 및 위치 추정 7
2. 음성 향상 9
3. 음향 이벤트 탐지 및 위치 추정 평가 지표 10
4. 음성 향상 평가 지표 12
제2절 관련 연구 14
1. 음향 이벤트 탐지 및 위치 추정 연구 14
2. 음성 향상 연구 20
제3장 제안 방법 22
제1절 SELD U-net 22
1. U-net 23
2. SELDnet 26
제4장 실험 수행 30
제1절 데이터셋 및 학습 환경 설정 30
1. 데이터셋 구축 30
2. 입력 특징 및 증강 기법 31
3. 학습 환경 설정 32
제2절 비교군 모델 구조 33
1. CRNN 모델 33
2. Residual+Transformer 모델 33
제3절 실험 결과 35
1. 음성 향상 결과 35
2. 음향 탐지 및 위치 추정 결과 40
제5장 결론 44
1. 연구 의의 44
2. 향후 연구 45
참 고 문 헌 46
- Degree
- Master
- Publisher
- 조선대학교 대학원
- Citation
- 신영서. (2023). 잡음 환경에 강건한 음향 이벤트 위치 추정 및 탐지에 대한 연구.
- Type
- Dissertation
- URI
- https://oak.chosun.ac.kr/handle/2020.oak/17844
http://chosun.dcollection.net/common/orgView/200000682592
-
Appears in Collections:
- General Graduate School > 3. Theses(Master)
- Authorize & License
-
- AuthorizeOpen
- Embargo2023-08-25
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.