대체하는 방법은 인위적으로 상관관계를 상승시키는 단점이 있으며 하나의 관측치에 여러 변수가 미싱인 경우에 적용하기가 어렵다.
Rubin(1987)에 의해 처음 제시된 Multiple Imputation 방법은 결측치를 예측된 분포에서 추출된 값으로 대체한 완전한 데이터 집합을 m(m>1)개 만들어서 모수를 측정한 후 모수
여기서 십분위 0에서의 활성화 비율은 0.84615로써 training set에서의 활성화 비율보다 더 높고 십분위 9의 비율은 0으로 나타나므로 매우 활성화가 잘 되었다고 할 수 있다. 즉 구축된 모형이 여전히 성공적임을 알 수 있다. 하지만 Percent chd와 Predicted Probability사이에 여전히 차이가 있음을 알 수 있다.
Ⅰ. 서 론
1. 조사의 계기
➀. 구직자가 원하는 회사에 관한 기사
[서울=연합뉴스] 구직자 89%, 연봉 2천600만원 줘야 입사지원" 구정모 기자
구직자들 상당수가 기업이 최소한 연봉을 2천600여만원을 줘야 입사 지원하겠다는 설문조사 결과가 나왔다. 취업포털 커리어에 따르면 4년제 대졸 구직
Ⅰ. 서 론
우리나라 이동통신서비스는 작년 IT 산업 수출액이 700억 달러를 넘었다고 한다. IT 산업이 국민 총생산의 13%를 차지한다고 하니 IT 산업은 국가 경제를 이끄는 핵심동력이라고 할 수 있다. 뿐만 아니라 최근 경제협력개발기구(OECD)에서 펴낸 ‘IT 분야 국제화 보고서’ 에 따르면 회원국 중
(연습문제 1번) R을 사용하여 다음의 자료로 3개의 열을 갖는 데이터프레임을 만드시오 (이때 각 변수 의 이름은 name, height, weight로 한다). 이 자료에서 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)만 배열로 추출하시오.
x1 <- c("kim", "lee", "park")
x2 <- c(170, 160, 180)
x3 <- c(60, 55, 75)
df <- data.frame(name=x1,