범주형 척도
범주형 척도는 데이터들을 구분 지어 나눌 수 있는 척도이며 (1)명목척도 (2)서열척도 로 나뉩니다.
명목척도란 수 또는 순서의 개념과는 상관없이 이름만 붙여지는 척도를 말하며, 서열척도는 명목척도와 비슷하게 숫자 또는 연산과는 연관이 없지만, 순서를 구분할 수 있는 척도를 말합
범주형 자료에 대한 그래프의 종류에는 막대도표, 선도표, 영역도표, 원도표 등이 있다.
막대도표 그리기 - 단순
메뉴에서 [그래프]-[막대도표]를 선택하고, 그래프의 형태를 선택한다. 여기서는 [단순]을 선택한다.
양적데이터의 기술통계량
평균, 표준편차 등의 기술통계량을 구한다.
계급을 나
Lift값을 보면 십분위 0에서는 평균보다 실제 활성화된 관찰치를 1.86배 더 포함하고 있다. 십분위 4(1.22배)까지는 구축된 모형이 평균모형보다 더 좋음을 알 수 있다. 누적Lift를 보면 십분위 4까지의 모형의 적합도는 모형 구축을 하지 않았을 때 또는 평균 모형보다 62% 정도 더 적합하다는 것을 알 수 있다
여기서 십분위 0에서의 활성화 비율은 0.84615로써 training set에서의 활성화 비율보다 더 높고 십분위 9의 비율은 0으로 나타나므로 매우 활성화가 잘 되었다고 할 수 있다. 즉 구축된 모형이 여전히 성공적임을 알 수 있다. 하지만 Percent chd와 Predicted Probability사이에 여전히 차이가 있음을 알 수 있다.
cc1의 상자그림을 보면 기존의 이상치가 없어진 것을 볼 수 있다. 하지만 새로운 이상치가 존재한다고 나온다. 하지만 그 값이 극단적이지 않고 그 수가 크므로 이상치를 대체할 경우 cc1의 원래의 분포를 유지하기가 어려우므로 이상치를 대체하지 않기로 한다.
⑥ tax
proc univariate d
2 x 2 분할표
SPSS에서의 데이터의 입력
변수 설정
tv =1 : TV 광고 시청 , 0: 시청하지 않음
car=1: 자동차 구입 , 0 : 구입 않음
count : 인원수
실습데이터 : tv광고_자동차.sav
기대빈도란 TV 광고시청여부와 자동차구입여부가 아무런 관계가 없을 때의 기대되는 빈도이고, 관측빈도
1.통계학의 정의
통계학은 특별한 의도나 목적을 가지고 조사 연구할 때 자료의 수집방법뿐만 아니라
측정된 자료를 정리하여 정보화하고 그러한 정보를 바탕으로 의사결정을 하는데 있어서
과학적이고 효율적인 방법을 연구 개발하는 학문이다.
2.통계학의 분류
1)기술 통계학
관찰대상 전체에
1. 서 론
1.1 조사의 배경과 목적
한 동안 수도이전 문제로 많은 국민들과 정치, 경제계의 관심이 헌법 재판소에 집중되었던 것을 대부분 알고 있을 것이다. 결국은 위헌 판결로 수도이전 계획이 무산되었지만 아직도 충청권 일부 지역에서는 시민들의 가두시위와 헌재 재판관들을 사직시켜야하니