데이터의 50% 만으로도 활성화 관찰치들 중 83%를 찾을 수 있다. 모형을 구축하지 않았을 때보다 63% 더 증가한 것이다.
test set
이 그래프는 이익도표를 그래프로 나타낸 것으로 모형구축을 하지 않았을 때보다 모형을 구출하는 것이 얼마나 더 적합한지를 확연히 알 수 있게 해준다. 전체 데이터의 50%
Data Mining의 정의
데이터마이닝이라는 것은 방대한 양의 데이터 속에서 쉽게 드러나지않는 유용한 정보를 찾아내는 과정, 데이터간의 숨겨진 관계, 혹은 겉으로 드러나지 않거나 또는 기존의 통계학적 방법을 통해 뽑아내기에는 너무나 복잡한 관계를 찾아내고, 이 관계를 바탕으로 앞날을 예측하는
되었다. <표1>에서는 고객관리의 시대적 변천과정을 보여주고 있는데 정보기술의 영향으로 등장한 데이터 웨어하우스, 데이터마이닝 등의 데이터베이스 기술과 전사적 자원관리(enterprise resource planning), 지식경영(knowledge management)등의 요소 기술들이 결합하여 1990년대에 CRM이 등장하였다.
<중략>
.
사고를 미리 예측하고 조기에 분실이나 도난
을 검색하는 시스템을 개발.
SAS와 Enterprise Miner 를 이용한 데이터마이닝 기법을 사용.
고객의 구매이력 데이터를 이용하여 구매 패턴을 파악하여 구매 가능 고객에게만 발송. DM 매출은 현상유지 하면서 DM 발송비용은 35%절감.
1. 데이터마이닝이란?
데이터마이닝이란 대량 데이터로부터 유용한 정보나 패턴을 추출하는 기법으로서, Gartner Group에서는 ‘대량의 데이터 집합으로부터 수학적인 패턴(규칙, 연관성, 상관관계, 추세, 예측모형 등)을 찾아내고 분석하는 프로세스’로 정의한다. 즉, 대량의 데이터로부터 유용한 정