온라인 C2C 중고거래 시장에서의 사기 탐지 연구
- Author(s)
- 이동우
- Issued Date
- 2021
- Abstract
- With the prevalent use of information and communication technologies, the volume of online C2C transactions has largely increased. Among online C2C markets, the demand for C2C second-hand market is particularly growing as the increasing number of consumers want reasonable consumption by using this market. However, as the volume of transactions increases, the number of frauds, which intend to earn unfair gains by sending products different from specified ones or not sending them to buyers, is also increasing. Therefore, the solutions for finding and preventing fraud are highly needed.
For this reason, this study explores the model that can find out the frauds in the online C2C second-hand market by examining the postings for transactions. The model is built with the characteristics from postings such as the topic and the linguistic characteristics of the product description, and the characteristics of products, postings, sellers, and transactions. For extracting topics from postings, LDA is used. For the linguistic features of the product description, the number of specific parts of speech, the length of texts, the rate of white spaces, line breaks, and special characters in the writings are used. For product characteristics, the rate of zeros in the price is used. For the posting characteristics, the day and time of the posting and the number of images are used. For seller characteristics, the grade of the seller and the sharing of the email address are used. For transaction characteristics, whether to use a secure transaction is used. The constructed model is then trained by the two machine learning algorithms: XGBoost and Deep learning. Then their performance of detecting fraudulent posting is evaluated and compared. As a result, the model that uses XGBoost showed a higher performance thus selected to provide the detailed findings of exploring fraudulent postings.
The final analysis results show that fraudulent postings have less information, which is also less specific, fewer nouns and images, a higher ratio of the number and white space, and the shorter length than genuine postings do. Also, unlike the fraudulent postings, the genuine postings are focused on the product information, product evaluation, and delivery information.
This study shows that the various features can be extracted from postings written in C2C second-hand transactions and be used to construct an effective model for frauds. The proposed model can be also considered and applied for the other C2C platforms. Overall, the model proposed in this study can be expected to have positive effects on suppressing and preventing fraudulent behavior in online C2C markets.
- Alternative Title
- A Study on the Fraud Detection Model in an Online Second-hand Market
- Alternative Author(s)
- Lee, DongWoo
- Department
- 일반대학원 경영학과
- Advisor
- 민진영
- Awarded Date
- 2021-02
- Table Of Contents
- 표 목차 iv
그림 목차 v
제1장 연구의 필요성 및 목적 1
제2장 문헌 연구 4
제1절 온라인 C2C 거래의 개념 및 특징 4
1. 익명성 및 비대면성 5
2. 시 공간 무제약성 및 전파성 5
3. 중개자의 역할 6
4. 신뢰를 기반으로 한 거래 6
제2절 온라인 C2C 거래물품의 특징 7
제3절 온라인 C2C 중고 거래의 현황 및 규모 8
제4절 온라인 C2C 거래 사기 9
제3장 이론적 배경 12
제1절 거짓말: 언어적 특성의 고려 12
제2절 사기 연구 일반: 신경망 방법의 효과 14
제3절 온라인 C2C 거래 사기 탐지: 특성 추출 및 샘플링 기법 17
제4장 연구모형 19
제5장 방법론 20
제1절 LDA (Latent Dirichlet Allocation) 20
제2절 형태소 분석 21
제3절 XGBoost 22
제4절 딥 러닝 23
제6장 모형적용 과정 및 결과 24
제1절 Data Collection 24
1. Target data 24
2. Data labeling 26
제2절 Feature Filtering (특성 필터링) 27
제3절 Feature Extraction (특성 추출) 29
1. 형태소 분석을 통한 언어적 특성 확인 29
2. 디지털 환경에서의 준언어적 특성 확인 30
3. Bag of Words (BOW)를 이용한 문서의 수치화 30
4. TF-IDF 를 이용한 사기글에서 강조되는 단어 탐색 31
5. LDA(Topic Modeling) 기법을 통한 주제 추출 32
제4절 특성 전처리(Feature Preprocess) 38
1. 범주형 변수 처리 38
2. 수치형 변수 처리 39
제5절 Data Sampling (데이터 샘플링) 40
1. 불균형 데이터셋(Unbalanced dataset) 처리 40
제7장 모델 구축 및 비교 평가 42
제1절 XGBoost 42
1. 학습률(Learning rate) 42
2. 최대 나무 깊이 43
3. 부스팅 횟수 43
제2절 딥 러닝 43
1. 활성함수(Activation Function) 43
2. 은닉층 (Hidden Layer) 44
3. 드롭아웃 (Dropout) 44
제3절 XGBoost 와 딥 러닝 결과 비교 45
1. Confusion matrix 45
2. AUC 점수 46
3. F1 점수 47
제8장 최종 모델 적용 및 분석 결과 48
제1절 특성 중요도 (Feature Importance) 파악 48
제2절 모델에 사용할 최종 특성 선택 49
제3절 최종 분석 결과 51
제9장 분석 결과 논의 53
제 10 장 연구의 학술적, 실무적 시사점 54
제 11 장 연구의 한계점 및 향후 연구 57
제 12 장 결론 57
참고 문헌 60
- Degree
- Master
- Publisher
- 조선대학교 대학원
- Citation
- 이동우. (2021). 온라인 C2C 중고거래 시장에서의 사기 탐지 연구.
- Type
- Dissertation
- https://oak.chosun.ac.kr/handle/2020.oak/16893
