CHOSUN

잡음 환경에 강건한 음향 이벤트 위치 추정 및 탐지에 대한 연구

Metadata Downloads
Author(s)
신영서
Issued Date
2023
Abstract
SELD(sound event localization and detection) aims to classify sound events, detect their onset and offset, and estimate their direction. Recent advancements in deep learning have led to the proposal of various SELD methods based on deep learning techniques.
However, existing deep learning-based SELD methods have mostly been developed and evaluated on audio data with minimal noise. Consequently, applying these methods in environments with high levels of noise often yields suboptimal performance. To address this issue, some approaches preprocess the data by applying noise reduction techniques before performing SELD, but this can be time-consuming.
To overcome these challenges, this study proposes a SELD model that incorporates deep learning-based speech enhancement techniques. The proposed model combines a U-net architecture for speech enhancement and a SELDnet for SELD, enabling end-to-end processing of noise reduction and SELD tasks.
To evaluate the proposed method, experiments were conducted using datasets containing diverse levels of noise. The results demonstrated that the proposed model outperformed existing SELD models in environments with high levels of noise, although it showed slightly lower performance in noise-free environments.
Alternative Title
A Study on Robust Sound Event Localization and Detection in Noisy Environment
Alternative Author(s)
Shin, Yeongseo
Affiliation
조선대학교 일반대학원
Department
일반대학원 컴퓨터공학과
Advisor
전찬준
Awarded Date
2023-08
Table Of Contents
제1장 서론 1
제1절 연구 배경 1
제2절 연구 목적 5

제2장 배경 이론 및 관련 연구 7
제1절 배경 이론 7
1. 음향 이벤트 탐지 및 위치 추정 7
2. 음성 향상 9
3. 음향 이벤트 탐지 및 위치 추정 평가 지표 10
4. 음성 향상 평가 지표 12
제2절 관련 연구 14
1. 음향 이벤트 탐지 및 위치 추정 연구 14
2. 음성 향상 연구 20

제3장 제안 방법 22
제1절 SELD U-net 22
1. U-net 23
2. SELDnet 26

제4장 실험 수행 30
제1절 데이터셋 및 학습 환경 설정 30
1. 데이터셋 구축 30
2. 입력 특징 및 증강 기법 31
3. 학습 환경 설정 32
제2절 비교군 모델 구조 33
1. CRNN 모델 33
2. Residual+Transformer 모델 33
제3절 실험 결과 35
1. 음성 향상 결과 35
2. 음향 탐지 및 위치 추정 결과 40

제5장 결론 44
1. 연구 의의 44
2. 향후 연구 45

참 고 문 헌 46
Degree
Master
Publisher
조선대학교 대학원
Citation
신영서. (2023). 잡음 환경에 강건한 음향 이벤트 위치 추정 및 탐지에 대한 연구.
Type
Dissertation
URI
https://oak.chosun.ac.kr/handle/2020.oak/17844
http://chosun.dcollection.net/common/orgView/200000682592
Appears in Collections:
General Graduate School > 3. Theses(Master)
Authorize & License
  • AuthorizeOpen
  • Embargo2023-08-25
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.