데이터 마이닝 실습

 1  데이터 마이닝 실습-1
 2  데이터 마이닝 실습-2
 3  데이터 마이닝 실습-3
 4  데이터 마이닝 실습-4
 5  데이터 마이닝 실습-5
 6  데이터 마이닝 실습-6
 7  데이터 마이닝 실습-7
 8  데이터 마이닝 실습-8
 9  데이터 마이닝 실습-9
 10  데이터 마이닝 실습-10
 11  데이터 마이닝 실습-11
 12  데이터 마이닝 실습-12
 13  데이터 마이닝 실습-13
 14  데이터 마이닝 실습-14
 15  데이터 마이닝 실습-15
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
데이터 마이닝 실습에 대한 자료입니다.
목차
1. 모델 선택 기준
-Validation Set의 오분류율
2. 모델 선택(Seed1)
-Tree
3. 분석(Seed1)

4. 평가(Seed1)
- Regression / Tree / Neural Network
5. 분석(Seed3)

6. 모델 선택(Seed3)
-Tree
7. 평가(Seed3)
- Regression / Tree / Neural Network
본문내용

1. 모델 선택 기준

1) 로지스틱 회귀분석
해당 자료는 타겟 변수가 당뇨병의 여부를 나타내는 범주형이다. 따라서 logstic 회귀분석을 통해 변수를 선택한다. 변수를 선택하는 방법으로는 Stepwise 방법을 사용한다.
변수 선택의 방법에는 Forward. Backward, Stepwise가 있다. Forward의 경우에는 한 번 선택된 변수가 제거되지 않는 단점이 존재하고, Backward는 한 번 제외된 변수의 재선택이 불가하고 변수 개수가 많을 경우 다루기 힘들다는 단점이 존재한다. 따라서 Forward 와 Backward 의 방법을 동시에 갖는 매단계마다 선택과 제거를 반복하는 Stepwise 방법을 사용하기로 한다.

2) Tree
Tree를 통한 분석에서 모델은 몇 가지 방법에 의해 평가되는데 그 기준이 되는 방법에는
Entropy 지수, Gini 지수, 카이제곱 통계량, Deviance 등 이 있다. 어떤 기준을 선택하여 Tree 분석을 할지 결정키 위해 위의 기준들을 이용해 반복적으로 오분류율을 구해보았다.
오늘 본 자료
더보기
  • 오늘 본 자료가 없습니다.
해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용,무단 전재·배포는 금지되어 있습니다. 저작권침해, 명예훼손 등 분쟁요소 발견 시 고객센터에 신고해 주시기 바랍니다.