WEKA프로그램을 통해서 분류기법,군집화 기법, 연관분석기법등을 적용하여 분석해보자.
우선 전화 사용자의 이탈유무에 대한 자료 분석을 위하여 전처리 단계를 밟는다.
아래 그림처럼 이산화 알고리즘을 통하여 숫자를 문자로 바꾼다.
아래 그림은 성별에 따라 나이 직업 거주지 지불유형 납입종류
기법으로는 단순한 산포도나 막대그래프로부터 3차원 영상에 이르기까지 다양하며, 특히 다차원 자료의 시각화를 위한 여러 가지 고난도의 방법들이 개발되고 있다.
- Exploratory Data Analysis(EDA) : 탐색적 데이터분석(EDA)은 사전에 설정된 가정이나 모형에 의존하지 않고 데이터를 탐색하여 흥미 있는
데이터마이닝(Data Mining) 기법으로 사용되는 것이다! 데이터마이닝기법을 수업시간에 배워서 인지 더욱 흥미롭게 느껴졌다. 수많은 고객 정보 중에 대학을 졸업하거나 사회인이 되었을 나이의 고객 정보만을 추출하여 이용하는 것이다. 이렇듯 기업에서는 현재 데이터마이닝기법을 많은 분야에 사용
제1장 데이터마이닝의 개요
1. 데이터마이닝의 정의
1956년 미국의 어느 조그만 마을에 작은 전파상을 운영하는 밀러라는 사람이 있었다. 이 전파상은 수 대에 걸쳐서 내려오는, 그 주위의 여러 다른 마을에도 소문이 난 유명한 가게였다. 물론 주위에는 여러 개의 전파상이 있었지만 유독 밀러씨
데이터를 다루는 데이터마이닝의 경우, 수많은 품목들의 관계속에서 의미있는 관련성을 찾기 위해서는 결과해석에 앞서 연관성의 내용이 일반화 할 수 있는 내용인가를 판단할 수 있도록 각 연관규칙을 비교할 수 있는 비교기준이 필요하다.
따라서 데이터마이닝에서의 연관성 분석 목적은 이러한 품