데이터에서 정보를 캐내는 데이터마이닝 기술이 주목을 받게 되었다. 이 기법은 기업의 생산성 제고와 새로운 패러다임인 데이터베이스 마케팅(Database Marketing), 고객관계관리 (CRM(Customer Relationship Management)), 위험관리(Risk Management)등의 중요성이 크게 부각되면서, 더욱 그 관심의 폭이 증가하고 있다. 이
데이터를 통해 얻어지는 모든 연관성이 의미 있다고 말하기는 곤란하다.
특히 대용량 데이터를 다루는 데이터마이닝의 경우, 수많은 품목들의 관계속에서 의미있는 관련성을 찾기 위해서는 결과해석에 앞서 연관성의 내용이 일반화 할 수 있는 내용인가를 판단할 수 있도록 각 연관규칙을 비교할 수
데이터마이닝에 관한 국제 학술대회(The first international conference on knowledge discovery & data mining)에서 지식 발견은 데이터로부터 유용한 정보를 발견하는 프로세스의 전 과정이라고 정의했고, 데이터마이닝은 지식 발견 프로세스 중에서 데이터로부터 정보를 추출하기 위해서 기법을 적용하는 특정 단계라
[4] 의사결정나무(Decision Trees)
의사결정나무(Decision Trees)는 분류 또는 예측을 목적으로 하는 어떤 경우에도 사용될 수 있는 기법으로 분석의 정확도보다는 분석과정의 설명이 필요한 경우에 더 유용하게 사용
(1) 세분화(Segmentation)
데이터를 비슷한 특성을 갖는 몇 개의 그룹으로 분할하여 각 그룹별
1. 데이터마이닝이란?
데이터마이닝이란 대량 데이터로부터 유용한 정보나 패턴을 추출하는 기법으로서, Gartner Group에서는 ‘대량의 데이터 집합으로부터 수학적인 패턴(규칙, 연관성, 상관관계, 추세, 예측모형 등)을 찾아내고 분석하는 프로세스’로 정의한다. 즉, 대량의 데이터로부터 유용한 정