분야    
발행기관
간행물  
발행연도  
발행기관 : 한국STATA학회44 개 논문이 검색 되었습니다.
Stata 16에서 Meta 분석 (1)
민인식  한국STATA학회, The Korea Journal of Stata [2021] 제6권 제1호, 17~34페이지(총18페이지)
유사한 연구주제에서 얻은 분석 결과를 데이터로 재구성하여 통계 분석하는 메타분석은 Heatlhcare 분야에서 최근 다양하게 활용되고 있다. Stata 16버전에서는 메타분석을 위한 공식 명령어 체계를 포함하고 있다. 본 연구에서는 Stata 16버전의 메타분석 명령어를 소개하는 것을 주요한 내용으로 삼는다. Effects size 모델링 방법을 설명하고 메타 데이터를 정의하는 명령문을 소개한다. overall effect size를 추정결과를 보여주는 meta summarize와 meta forestplot 명령어의 구체적 활용 예시를 보여준다. 후속 연구에서는 출판편의 (publication bias), funnel plot 그리고 meta regression을 자세히 설명하고자 한다.
TAG Meta, effect size, fixed-effects, random-effects, common-effect
통계청 100대 지표 웹크롤링 : smart_kosis100_v2 명령어
민인식  한국STATA학회, The Korea Journal of Stata [2021] 제6권 제1호, 35~49페이지(총15페이지)
본 연구에서는 최근 개편된 KOSIS에서 제공하는 우리나라 주요 100대 통계지표를 웹크롤링하는 코드인 smart_kosis100 패키지를 보완한 smart_kosis100_v2를 소개한다. smart_kosis100_v2를 이용하면 쉽게 웹크롤링하여 stata 데이터 파일로 구축할 수 있는 장점이 있다. 활용 예제로써 합계출산율 예측에 영향을 미치는 요인을 분석을 제시한다. 이 때, 많은 예측인자(predictor)가 있는 모형에서 예측성과를 판단할 수 있는 머신러닝 기법 중 하나인 Random Forest를 적용한다. 또한 합계출산율 예측에서 가장 중요한 요인을 나타내는 Importance index를 산출하고 시각적으로 제시한다.
TAG KOSIS, 100대 지표, smart_kosis100_v2, Random Forest
Data Management를 위한 Stata tips
김완석  한국STATA학회, The Korea Journal of Stata [2021] 제6권 제1호, 51~59페이지(총9페이지)
본 논문에서는 필자가 Stata를 사용하면서 터득한 tip들 3가지를 소개 한다. 우선 워킹 디렉토리 (working directory)와 rawdata가 담긴 폴더를 유기적으로 구분하여 원활히 작업하는 팁을 소개한다. 또한 문자변수를 숫자변수로 변환하는데 있어 방해가 되는 값을 쉽게 찾아내는 명령문에 대해 소개한다. 마지막으로 bysort, reshape, egen concat함수, subinstr 함수를 사용하여 각 그룹마다 리스트를 옆으로 깨끗하게 나열하는 방법을 소개한다.
TAG c, pwd, real함수, reshape, egen concat함수
Stata 16에서 python 활용 (1)
민인식  한국STATA학회, The Korea Journal of Stata [2021] 제6권 제1호, 1~16페이지(총16페이지)
Stata 16버전은 python과 호환되어 통계분석을 할 수 있는 기능이 있다. Stata에서 실행된 결과를 python으로 가져올 수도 있고 python output을 Stata로 가져와서 후속 작업을 할 수도 있다. python이 최근 빅데이터 분석에 활발하게 사용되는 현실에 비추어 Stata와 python의 협업은 Stata의 활용도를 더 넓힐 수 있을 것으로 예상한다. 본 논문에서는 Stata에서 python을 활용하는 기초적인 내용을 소개한다. 환경설정, 데이터 파일 불러오기, 기초통계량 계산, 선형회귀모형 추정을 위한 python 코드를 설명하고 그 결과를 제시한다.
TAG Stata, python, 파이썬, pandas, 선형회귀모형
Revisiting Panel Data Analysis (3) : Stata와 R 코딩
민인식  한국STATA학회, The Korea Journal of Stata [2018] 제5권 제2호, 1~16페이지(총16페이지)
본 논문에서는 패널 선형회귀모형으로 varying coefficients 모형을 소개한다. 추정방법으로 고정효과와 확률효과 추정에 대해 자세히 설명한다. 관찰된 설명변수와 group heterogeneity 상관관계 여부에 따라 고정효과 또는 확률효과 추정량이 더 적절할 수 있다. 특히 내생성 문제가 있는 모형에서는 고정효과 추정량만이 일치추정량이 된다. group heterogeneity뿐 아니라 time heterogeneity까지 고려한 two-way effects 모형에 대해서도 설명한다. 각 추정방법에 대한 Stata와 R 코드를 제시하고 있다.
TAG KLIPS, Stata, R, 고정효과, 확률효과
Crossed Random Effects 모형
민인식  한국STATA학회, The Korea Journal of Stata [2018] 제5권 제2호, 17~28페이지(총12페이지)
본 논문에서는 멀티레벨의 특정한 형태인 Crossed Random Effects모형에 대해 설명한다. 이 모형은 병원-환자, 동아리-학생과 같이 하위레벨의 관즉치가 여러 상위 레벨에 포함될 수 있는 non-nested two-level에서 추정할 수 있다. 세부적으로 첫째, 횡단면 데이터에서 오차항 가정과 Crossed Random Effects모형을 살펴보고 둘째, 시간변수가 하위레벨인 패널 데이터에서의 Crossed Random Effects모형 주정에 대해 설명한다. 이때 상위레벨 이질성은 확률효과로 포함하고 시간 이질성은 고정효과로 사용한 모형을 제시한다. 마지막으로 추정방법에 대한 Stata코드를 제시한다.
TAG Crossed Random Effects, 멀티레벨, 고정효과, Stata
Stata를 이용한 KOSIS 100대 지표 웹크롤링
민인식  한국STATA학회, The Korea Journal of Stata [2018] 제5권 제2호, 29~38페이지(총10페이지)
본 연구에서는 KOSIS에서 제공하는 우리나라 100대 통계지표를 Stata를 활용하여 웹크롤링하는 코드를 소개한다. 저자가 직접 만든 smart_kosisl00 패키지를 이용하여 100대 지표 중 연구자가 원하는 지표의 최근 몇 년간 수치를 자동으로 가져와서 새로운 데이터 세트로 만들 수 있다. 활용 예제는 다수의 통계지표를 크롤링한 후 관심 있는 두 지표(합계출산율과 혼인건수)의 추세 그래프를 작성한다. 또한 PCA(Principal Component Analysis)를 통해 56개 지표를 이용하여 우리나라를 대표하는 하나의 지표를 생성하는 Stata 예제를 제시한다.
TAG KOSIS 100대지표, smart_kosis100, 웹크롤링, PCA
Panel linear with correlated regression heterogeneity
민인식  한국STATA학회, The Korea Journal of Stata [2018] 제5권 제2호, 39~50페이지(총12페이지)
본 연구에서는 correlated heterogeneity 가정을 고려한 패널 선형 모형에 대해 설명한다. 세부적으로 첫째, 그룹 이질성(group heterogeneity)과 시간 가변 설명변수가 상관관계가 있는 경우를 고려한 Correlated Random Effects(CRE) 모형에서 Random Intercept를 가정한 경우에 대해 살펴보고, 둘째, 전통적인 Hausman 검정보다 오차항의 동분산성 가정 위배에 대해 유연한 Robust Hausman 검정을 설명한다. 마지막으로 CRE 모형 중 Correlated Random Slope를 가정한 모형을 제시한다.
TAG 패널 선형모형, Correlated Random Effects, Correlated Random Slopes
Stata에서 Unicode 처리 (2) : wordcloud를 중심으로
유혜림  한국STATA학회, The Korea Journal of Stata [2018] 제5권 제2호, 51~58페이지(총8페이지)
비정형 데이터인 텍스트 분석 시, 한국어/한글은 Unicode 표기와 단어 분석 시 주의하여야 한다. 본 논문에서는 Stata 14버전 이상에서 Unicode 관련 명령어를 이용하여 비정형 텍스트데이터에서 단어 빈도분석 및 wordcloud활용방안을 제시한다. 단어 분석 시 불필요한 문장부호와 조사, 다빈도 명사, 결측치를 삭제한 후, 비정형 데이터에 서 자주 나타나는 단어에 대한 빈도 분석한 후, wordcloud를 생성하여 빈도 분석 결과를 시각화 할 수 있는 Stata코딩을 제시한다.
TAG Stata, Unicode, wordcloud
Stata 15버전에서 통계지도 작성
민인식  한국STATA학회, The Korea Journal of Stata [2018] 제5권 제1호, 1~15페이지(총15페이지)
Stata 15버전이 2017년 여름 출시되면서 User-written program으로 사용되던 spmap 명령어를 공식 명령어로 내장하게 되었다. 본 논문에서는 Stata 15버전에서는 공식 명령어인 spshape2dta, spset 그리고 grmap 명령어를 소개하고 활용방법을 논의한다. 통계청의 SGIS 사이트에서 다운로드 받은 시군구 지도경계 데이터를 이용하여 지도를 작성한다. 그 지도 위에 표현하고자 하는 통계자료는 19대 대통령선거에서 (국민의당+바른정당) 합계 득표율을 사용한다. 250개 시군구별로 해당 득표율을 생성한 후 통계지도를 작성하는 Stata 코딩을 제시한다.
TAG Stata, grmap, 통계지도, 19대 대통령선거, shape file
 1  2  3  4  5