데이터 마이닝 실습

※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.

분야
등록일
페이지/형식
구매가격
적립금

레포트 > 경제경영계열
2013.02.20
15페이지 / hwp
1,700원
51원 (구매자료 3% 적립)

자료 다운로드 네이버 로그인

추천자료

한국연구재단 신입 자기소개서 + 면접질문모음

하나은행 데이터 운용/분석 신입 자기소개서 + 면접질문모음

신한카드 자기소개서 (신입, 경력) + 면접질문모음

나이스평가정보 신입, 경력 자기소개서 + 면접질문모음

SK브로드밴드 경영지원 신입 자기소개서 + 면접질문모음

한국과학기술정보연구원 정규직 자기소개서 + 면접질문모음

한국철도기술연구원 공개채용 자기소개서 + 역량기술서 + 면접예상질문

데이터 마이닝 실습

[인터넷 프로그래밍] 웹 마이닝을 통한 환율 제공 서비스

[고객관리] CRM 레포트

소개글

데이터 마이닝 실습에 대한 자료입니다.

1. 모델 선택 기준
-Validation Set의 오분류율
2. 모델 선택(Seed1)
-Tree
3. 분석(Seed1)

4. 평가(Seed1)
- Regression / Tree / Neural Network
5. 분석(Seed3)

6. 모델 선택(Seed3)
-Tree
7. 평가(Seed3)
- Regression / Tree / Neural Network

본문내용

1. 모델 선택 기준

1) 로지스틱 회귀분석
해당 자료는 타겟 변수가 당뇨병의 여부를 나타내는 범주형이다. 따라서 logstic 회귀분석을 통해 변수를 선택한다. 변수를 선택하는 방법으로는 Stepwise 방법을 사용한다.
변수 선택의 방법에는 Forward. Backward, Stepwise가 있다. Forward의 경우에는 한 번 선택된 변수가 제거되지 않는 단점이 존재하고, Backward는 한 번 제외된 변수의 재선택이 불가하고 변수 개수가 많을 경우 다루기 힘들다는 단점이 존재한다. 따라서 Forward 와 Backward 의 방법을 동시에 갖는 매단계마다 선택과 제거를 반복하는 Stepwise 방법을 사용하기로 한다.

2) Tree
Tree를 통한 분석에서 모델은 몇 가지 방법에 의해 평가되는데 그 기준이 되는 방법에는
Entropy 지수, Gini 지수, 카이제곱 통계량, Deviance 등 이 있다. 어떤 기준을 선택하여 Tree 분석을 할지 결정키 위해 위의 기준들을 이용해 반복적으로 오분류율을 구해보았다.

#데이터 #마이닝 #실습

오늘 본 자료

오늘 본 자료가 없습니다.

이 분야 인기자료

이 분야 신규자료