범주형 척도
범주형 척도는 데이터들을 구분 지어 나눌 수 있는 척도이며 (1)명목척도 (2)서열척도 로 나뉩니다.
명목척도란 수 또는 순서의 개념과는 상관없이 이름만 붙여지는 척도를 말하며, 서열척도는 명목척도와 비슷하게 숫자 또는 연산과는 연관이 없지만, 순서를 구분할 수 있는 척도를 말합
범주형 자료에 대한 그래프의 종류에는 막대도표, 선도표, 영역도표, 원도표 등이 있다.
막대도표 그리기 - 단순
메뉴에서 [그래프]-[막대도표]를 선택하고, 그래프의 형태를 선택한다. 여기서는 [단순]을 선택한다.
양적데이터의 기술통계량
평균, 표준편차 등의 기술통계량을 구한다.
계급을 나
Lift값을 보면 십분위 0에서는 평균보다 실제 활성화된 관찰치를 1.86배 더 포함하고 있다. 십분위 4(1.22배)까지는 구축된 모형이 평균모형보다 더 좋음을 알 수 있다. 누적Lift를 보면 십분위 4까지의 모형의 적합도는 모형 구축을 하지 않았을 때 또는 평균 모형보다 62% 정도 더 적합하다는 것을 알 수 있다
여기서 십분위 0에서의 활성화 비율은 0.84615로써 training set에서의 활성화 비율보다 더 높고 십분위 9의 비율은 0으로 나타나므로 매우 활성화가 잘 되었다고 할 수 있다. 즉 구축된 모형이 여전히 성공적임을 알 수 있다. 하지만 Percent chd와 Predicted Probability사이에 여전히 차이가 있음을 알 수 있다.
cc1의 상자그림을 보면 기존의 이상치가 없어진 것을 볼 수 있다. 하지만 새로운 이상치가 존재한다고 나온다. 하지만 그 값이 극단적이지 않고 그 수가 크므로 이상치를 대체할 경우 cc1의 원래의 분포를 유지하기가 어려우므로 이상치를 대체하지 않기로 한다.
⑥ tax
proc univariate d