소개글
[경영정보학] 금융기관 정보를 통한 weka분석에 대한 자료입니다.
목차
*금융기업 정보를 WEKA프로그램으로 다양하게 분석
1. 연관분석기법
2. 군집화기법
3. 이산화기법
a.weka 프로그램으로 각각의 기법들을 적용
ㄱ. 연관분석기법으로 분석하는 과정을 캡쳐
ㄴ. 연관분석기법을 통한 결과를 캡쳐
ㄷ. 결과된 다양한 데이터를 분석 내용물 도출해냄
ㄹ. 군집화기법으로 분석하는 과정을 캡쳐
ㅁ. 군집화기법으로 도출된 결과를 캡쳐
ㅇ. 군집화기법으로 도출된 결과내용을 분석함
.
.
.
.
.
(이산화기법도 위와 동일하게 함)
4.각각의 기법들을 결합하여 분석
A.도표,그래프,알고리즘등을 캡쳐(성별,직업,나이,거주지,소득수준...)
여러가지 다양한 요소들을 반영하여 각각 캡쳐
B.위 자료들을 통해서 분석
C.분석된 자료들을 통해서 결과를 도출 내용 설명
.
.
.
.
.
결론:weka프로그램을 통해 금융기관 고객들에 대한 다양한 정보를 얻기 위한 과정이다. 이러한 정보를 얻기위해 여러가지 사항들(성별,직업,나이,거주지,소득수준...)를 분석해야하며 각각의 분석된 자료를 통해서 데이터를 관리한다.
본문내용
WEKA프로그램을 통해서 분류기법,군집화 기법, 연관분석 기법등을 적용하여 분석해보자.
우선 전화 사용자의 이탈유무에 대한 자료 분석을 위하여 전처리 단계를 밟는다.
아래 그림처럼 이산화 알고리즘을 통하여 숫자를 문자로 바꾼다.
아래 그림은 성별에 따라 나이 직업 거주지 지불유형 납입종류 사용총액 기본요금 부가서비스요금 사용기간 고객구분등을 분류한 그래프다.
각각의 항목등을 선택하여 각각의 그래프가 있지만 생략하고 다음단계를 분석한다.
=== Run information ===
Scheme: weka.classifiers.trees.J48 -C 0.25 -B -M 2
Relation:전화이탈자(WEKA용)-weka.filters.unsupervised.attribute.Discretize-F-B10-M-1.0-Rfirst-last-weka.filters.unsupervised.attribute.Discretize-F-B10-M-1.0-Rfirst-last
Instances: 300
Attributes: 11
성별
나이
직업
거주지
지불유형
납입종류
사용총액
기본요금
부가서비스요금
사용기간
고객구분
Test mode: 10-fold cross-validation
=== Classifier model (full training set) ===
J48 pruned tree
------------------
사용기간 = '(132.5-149.5]': 이탈 (31.0)
사용기간 != '(132.5-149.5]'
| 사용기간 = '(92.5-104.5]': 이탈 (30.0)
| 사용기간 != '(92.5-104.5]'
| | 사용기간 = '(104.5-116.5]': 이탈 (30.0)
| | 사용기간 != '(104.5-116.5]'
| | | 사용기간 = '(116.5-132.5]': 이탈 (30.0)
| | | 사용기간 != '(116.5-132.5]'
| | | | 사용기간 = '(-inf-92.5]': 이탈 (28.0/1.0)
| | | | 사용기간 != '(-inf-92.5]': 유지 (151.0/2.0)
Number of Leaves : 6
Size of the tree : 11
Time taken to build model: 0.02 seconds
=== Stratified cross-validation ===
=== Summary ===
Correctly Classified Instances 297 99 %
Incorrectly Classified Instances 3 1 %
Kappa statistic 0.98
Mean absolute error 0.0205
Root mean squared error 0.1011
Relative absolute error 4.0935 %
Root relative squared error 20.2137 %
Total Number of Instances 300
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure Class
0.993 0.013 0.987 0.993 0.99 유지
0.987 0.007 0.993 0.987 0.99 이탈
=== Confusion Matrix ===
a b
참고문헌
weka를 통한 데이타분석,현대데이터마이닝 프로그램
하고 싶은 말
weka 프로그램을 통한 금융기관 고객들에 대한 분석