제1장 데이터마이닝의 개요
1. 데이터마이닝의 정의
1956년 미국의 어느 조그만 마을에 작은 전파상을 운영하는 밀러라는 사람이 있었다. 이 전파상은 수 대에 걸쳐서 내려오는, 그 주위의 여러 다른 마을에도 소문이 난 유명한 가게였다. 물론 주위에는 여러 개의 전파상이 있었지만 유독 밀러씨
1 – 1. Decision Tree Using User-defined Algorithm(By SAS E-miner)
Splitting Condition : Entropy Reduction
Minimum Number of Observation : 46(1% of Data Set,
To avoid Overfitting & Underfitting)
Test Accuracy = 1266/1389 = 91.74%
Accuracy is increased little as Decision Tree used by C4.5
Because, Decision Tree is sufficiently good classifier.
데이터마이닝은 중요한 패턴이나 경향을 추출하기 위한 목적으로 데이터를 체계적으로 개발하는 것으로 정의된다. 많은 기업에서는 정보기술의 향상과 데이터 저장 비용의 하락으로 대용량의 데이터를 저장 할 수 있다. 방대하고 복잡해진 데이터를 효과적으로 활용하는 방안이 최대 관심이다. 경영
많은 조직은 자동화 된 복잡한 의사 결정에 신경회로망을 사용한다. 신경회로망은 요청된 행동의 방향 패턴을 쉽게 식별할 수 있다. 각각의 회로망은 그들의 활동을 증진 시키기 위해 과거의 경험으로부터 배운다. Technology 구성원의 멤버인 그들은 기계학습법이라고 불린다. 기계학습법은 11장에서 묘
[4] 의사결정나무(Decision Trees)
의사결정나무(Decision Trees)는 분류 또는 예측을 목적으로 하는 어떤 경우에도 사용될 수 있는 기법으로 분석의 정확도보다는 분석과정의 설명이 필요한 경우에 더 유용하게 사용
(1) 세분화(Segmentation)
데이터를 비슷한 특성을 갖는 몇 개의 그룹으로 분할하여 각 그룹별