[데이터 마이닝] 데이터 마이닝(문제정의 및 분석)

 1  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-1
 2  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-2
 3  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-3
 4  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-4
 5  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-5
 6  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-6
 7  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-7
 8  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-8
 9  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-9
 10  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-10
 11  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-11
 12  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-12
 13  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-13
 14  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-14
 15  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-15
 16  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-16
 17  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-17
 18  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-18
 19  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-19
 20  [데이터 마이닝] 데이터 마이닝(문제정의 및 분석)-20
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
[데이터 마이닝] 데이터 마이닝(문제정의 및 분석)에 대한 자료입니다.
목차
Ⅰ. DATA MINING 정의···················································································2

1. 데이터 마이닝의 정의···················································································2
2. 데이터 마이닝 활용 분야··············································································2
3. 데이터 마이닝의 특징···················································································3
4. 데이터 마이닝 절차·························································································3
5. 적용 사례····································································································3

Ⅱ. 문제 정의 및 분석·························································································4

1. 문제설정······································································································4
2. 분석방법······································································································4
3. 풀이 및 분석································································································4
(1) data 입력································································································4
(2)Weka program··························································································7
(3) J48 Tree 알고리즘···················································································8
(4) Naivebayes 알고리즘··············································································10
(5) Cobwed 알고리즘···················································································13
(6) Associate 알고리즘················································································22


Ⅲ. 결론··············································································································23
본문내용
Ⅰ. DATA MINING 정의
1. 데이터 마이닝의 정의
많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다.
데이터베이스로부터 과거에는 알지 못했지만 데이터 속에서 유도된 새로운 데이터 모델을 발견하여 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 광맥을 찾아내듯이 정보를 발견해 내는 것이다. 여기에서 정보 발견이란 데이터에 고급 통계 분석과 모델링 기법을 적용하여 유용한 패턴과 관계를 찾아내는 과정이다. 데이터베이스 마케팅의 핵심 기술이라고 할 수 있다.

2. 데이터 마이닝 활용 분야
- Prediction : 신용카드 거래에서 특정한 거래가 사기일 가능성을 예측하듯이 데이터를 통하여 만들어지 예측모형을 이용하여, 자료의 특정한 속성을 예측한다.

- Regression : 어떤 속성이 다른 속성에 의하여 설명되어지는 관계성을 분석하여, 새로운 사례에 대하여 이러한 속성치를 예측할 수 있는 모델을 구축한다. 예를 들면, 콜센터에서 콜의 빈도와 사용 코드 난이도의 관계성을 찾아 상담을 문의한 고객에게 문의 내용을 미리 예측하여 적절한 안내원이 응대할 수 있도록 한다.

- Classification : 일련의 범주들이 사전에 분류되어 있을 때, 특정한 데이터의 항목이 이러한 분류 체계 중 어디에 속하는 가를 결정한다. 예를 들면, 은행에서 직업과 학력에 따라 신용등급(양호, 보통, 불량)을 부여하고자 할 때, 새로운 고객의 신용등급을 그 고객의 직업과 학력에 따라 분류된다.

- Clustering : 데이터의 여러 속성들을 비교하여 유사한 특성을 갖는 항목들을 함께 묶는다. 군집분석은 유사한 항목들의 집단을 찾아내는데 가장 잘 사용된다. 예를 들면, 유사한 구매행동을 하는 고객들의 군집을 찾아내어 그 군집의 특성을 밝혀낸다.

- Association : 고객들의 거래 형태 데이터에서 서로 연관성이 있는 항목들의 특성을 찾아 Cross/Up selling을 위한 상품을 찾아낸다. 예를 들어 컴퓨터를 구매한 고객들 중에서 프린터를 구입하지 않은 고객들에게 프린터를 추천한다던가, 컴퓨터 교체 주기를 찾아 새로운 모델의 컴퓨터를 추천할 수 있을 것이다.

- Deviation detection : 데이터 중에서 다른 데이터와 구별되는 아주 특별한 속성을 갖고 있는 데이터를 찾아낸다. 앞의 여러 분야는 데이터로부터 일반적으로 적용될 수 있는 패턴을 찾는 것인데 비하여, Deviation detection은 아주 작은 비정상적인 데이터를 찾아내는 작업이다. 예로는, 신용카드 사기를 들 수 있는데, 전체 신용카드 사용 중 사기거래는 매우 극소수에 불과하기 때문이다.

- Model visuallization : 시각화는 발견된 지식을 이해 가능하게 하고 해석 가능하게 만드는 과정에 있어서 중요한 역할을 한다. 아무리 잘 정립된 규칙이라도 그 내용을 눈으로 보여주는 것 보다 빨리 이해시키기는 쉽지 않을 것이다. 시각화 기법으로는 단순한 산포도나 막대그래프로부터 3차원 영상에 이르기까지 다양하며, 특히 다차원 자료의 시각화를 위한 여러 가지 고난도의 방법들이 개발되고 있다.

- Exploratory Data Analysis(EDA) : 탐색적 데이터 분석(EDA)은 사전에 설정된 가정이나 모형에 의존하지 않고 데이터를 탐색하여 흥미 있는 패턴들을 밝히려고 시도한다. 시각과 직관을 위해 데이터의 그래픽 표현이 흔히 사용된다.
하고 싶은 말
도움이 되었으면 좋겠네요^^