국문초록
이진 데이터는 일상 생활에서 자주 접할 수 있는 데이터이다. 이진 데이터를 회귀 분석하는 방법으로 로지스틱(Logistic), 프로빗(Probit), Cauchit, Complementary log-log 모형이 주로 쓰이는데, 이 방법 이외에도 Liu (2004)가 제시한 t 분포를 이용한 로빗(Robit) 모형, Kim 등 (2008)에서 제시한 일반화 t-link 모형을 이용한 방법 등이 있다. 유연한 분포를 이용하면 유연한 회귀 모형이 가능해지는 점에 착안하여, 이 논문에서는 Theodossiou (1998)에서 제시된 기운 일반화 t 분포 (Skewed Generalized t Distribution)의 이용하여 우도 함수를 최대로 하는 이진 데이터 회귀 모형을 소개한다. 기운 일반화 t 분포를 R glm 함수, R sgt 패키지를 연결하여 이 논문에서 제시한 방법을 R로 분석할 수 있는 방법을 소개하고, 피마 인디언(Pima Indian) 데이터를 분석한다.
영문초록
We frequently encounter binary data in real life. Logistic, Probit, Cauchit, Complementary log-log models are often used for binary data analysis. In order to analyze binary data, Liu (2004) proposed a Robit model, in which the inverse of cdf of the Student's t distribution is used as a link function. Kim et al. (2008) also proposed a generalized t-link model to make the binary regression model more exible. The more exible skewed distributions allow more exible link functions in generalized linear models. In the sense, we propose a binary data regression model using skewed generalized t distributions introduced in Theodossiou (1998). We implement R code of the proposed models using the glm function included in R base and R sgt package. We also analyze Pima Indian data using the proposed model in R.
추천자료
[mis, 경영정보시스템] 의사결정나무(decision tree)
[정보처리,정보처리기사,정보처리산업기사,기사,산업기사,기출문제,요점정리] 정보처리기사,산업기사 요점정리 및 기출문제
[환경과학] 환경오염
[유통관리사시험] 유통관리사2급모의고사및2006년~2008년2차시험및핵심요약
[심리] 심리학 용어집(한영)
[통계학]통계학개론
[교육] 교육학레포트모음입니다.
7차현대문법총정리
[면접상식]면접상식용어풀이(경제,행정,상식관련용어정리200pageㄱ~ㅎ,a~z)
문화콘텐츠의 이해와 발전