WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교

 1  WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교-1
 2  WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교-2
 3  WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교-3
 4  WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교-4
 5  WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교-5
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
WEIGHTLOSS DATA의분산 분석과 다중회귀모형의 비교에 대한 자료입니다.
본문내용
1번문제. WEIGHTLOSS DATA의 분산분석과 다중회귀모형의 비교
5 -
1. 목 적
① 다중회귀분석과 분산분석의 차이를 이해
② 가변수의 이용을 통해 각각의 상황에 대한 결과예측
2-1. 다중회귀분석과 분산분석의 차이를 이해

가변수를 이용한 다중회귀분석에서의 결과에서 앞서 실시한 분산분석의 ANOVA Table과 동일한 결과가 나타났다. 결국 회귀분석에 있어서의 분산분석(analys of variance : ANOVA)는 총변동(TSS)을 회귀선에 의하여 설명되는 변동과 설명되지 않는 변동으로 분활하여 모형의 적합성을 분석하는 방법임을 확인할수 있다.
그러나 분산분석에서는 각 집단에 대한 평균비교에 목적이 있는 반면, 가변수를 이용한 다중회귀에서는 결과로써 각각의 가변수에 대한 가중치가 주어짐으로써 각 상황이 주어졌을 때의 결과에 대한 예측을 목적으로 하는 차이가 있다.
2-1. 가변수의 이용을 통해 각각의 상황에 대한 결과예측
앞서 실시한 분산분석에서 모형의 적합성과 함께 R2값이 주어짐으로써 회귀선에 DATA의 적합정도를 0.5651로 나타났었다. 때문에 모든 변수를 모형에 삽입하여 다중회기를 실시하였을때 D1,D2,D3(복용량)의 P값이 모두 0.05보다 매우 크게 나타났다.
즉, 복용량은 체중감소에 영향을 미치지 못한다는 귀무가설을 기각할수 없게 된다.
복용량(D1-D3)을 모형에서 제거하고 실시한 회귀분석결과는 R2 값은 0.56에서 0.52로 감소하였지만, 변수가 많아질수록 증가하는 R2값의 성격상, 수정된 R2값으로 비교가 보다더 타당하다.
수정된 R2값의 경우는 0.44에서 0.47로 증가되므로써 앞선 모형보다 복용량이 제거된 모형이 보다더 적합하다는 판단을 내릴수 있다.
최종 모형식은
hat y ~=~ -8.75 + 6.38X_e1 + 3.50X_e2
수정된 R2 : 0.47