분야    
발행기관
간행물  
발행연도  
발행기관 : 성균관대학교 응용통계연구소 AND 간행물명 : 통계연구189 개 논문이 검색 되었습니다.
Comparing EM-type Algorithm and "mixtools" Packages in R When Estimating Parameters of Mixture Models
( Nam Hwa Lee )  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 1~16페이지(총16페이지)
TAG EM-type Algorithm, Normal Mixture Model, Skew Normal Mixture Model, Density Estimation
담배 소비량 데이터에 대한 시계열 모형 적합 및 비교분석
박서영  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 17~28페이지(총12페이지)
본 연구에서는 1990년 1월부터 2017년 12월까지 총 28년간의 월별 국내 담배소비량의 시계열 자료를 활용하여 통계적 특성을 확인하고 향후 담배소비량 예측에 적합한 모형을 도출하고자 한다. 시계열 분석 모형들 가운데 정상시계열인 ARMA와 변동성을 포함한 시계열 모형인 GARCH, GJR-GARCH 모형을 사용하고자 한다. 또한 담배 가격을 새로운 변수로 설정하여 ARMAX 모형과 GARCH-X 모형을 적합시켰다. 최종적으로 선택된 모형을 바탕으로 향후 2년간의 월별 담배소비량을 예측하였다.
TAG ARMA, ARCH Effect, GARCH, GJR-GARCH, ARMAX, GARCH-X
다변량 적응회귀 스플라인 모형의 성능 비교 연구
조수민  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 29~39페이지(총11페이지)
설명변수와 반응변수 사이의 비선형적인 관계를 모형화하는 방법 중에 하나로 다변량 적응회귀 스플라인 모형이 Friedman(1991)에 의해 제안되었다. 다변량 적응회귀 스플라인 모형은 다중선형 회귀모형에서 사용되는 최소제곱법과 변수선택방법, 그리고 스플라인 기저 변환을 이용하며, 적합 결과를 해석하기 쉽고 계산이 빠르다는 장점이 있다. 본 연구에서는 다변량 적응회귀 스플라인 모형, 그 중에서도 전진선택 방법을 택했을 때의 적합 알고리즘을 설명하고, 이것을 모의실험을 통해 다항회귀 모형, 의사결정나무 모형과 함께 비교한다.
TAG MARS, Multivariate Adaptive Regression Spline, Nonparametric regression, basis expansion, spline regression model
NAVER와 KAKAO API를 이용한 지도 package
조수빈  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 41~52페이지(총12페이지)
본 논문은 R 프로그램 내부의 ggmap package의 지도 시각화를 한국의 환경에 맞게 개량하는데 목표를 두고 있다. ggmap 내부함수 중 getmap함수는 Google 지도 api를 바탕으로 작동하는데 이는 한국의 환경에서 오류가 많아 사용자들이 사용하는데, 불편을 겪고 있다. 또한, 시각화에서 주요하게 사용되는 geocode 또한 Google API를 사용하면 많은 오류가 있어 이러한 문제를 해결하는 것에 본 논문은 주목하고 있다. 이러한 문제를 해결하기 위해 본 논문은 한국의 대표적인 IT 회사인 NAVER와 KAKAO의 API를 이용해 package를 제작하기로 하였다. 본 논문에서는 이러한 패키지를 작성한 방법에 대해 살펴보고 다음으로 내부함수들에 관해 설명하도록 하겠다. 마지막으로는 함수들의 활용 예시...
TAG R package, 시각화, API, nkmap
초등학령기 아동의 전반적인 삶의 만족감에 영향을 미치는 요인 탐색
이여경  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 53~66페이지(총14페이지)
본 연구에서는 초등학령기인 7~12세 아동의 사회 및 정서발달, 또래와의 관계, 부모의 특성, 아동과 부모의 관계, 학교환경의 특성을 알아보고, 아동의 삶의 만족도에 가장 많은 영향을 미치는 요인을 탐색, 예측하는 것을 목적으로 하였다. 이를 위해 한국아동패널 10차년도 자료 중 본 연구의 목적에 부합하는 문항에 관하여 응답한 2,150명의 자료를 활용하여 LASSO 분석을 실시하였다. 그 결과 65개의 변수 중 13개의 변수가 선택되었으며, 아동과 관련된 변수로는 자아존중감, 학교 선호도, 시간 사용 만족도, 또래에 대한 신뢰감, 소외감, 또래와의 의사소통 능력, 교사 선호도, 아동이 생각하는 부모의 학업 관심도, 친구의 수가 선택되었고, 부모와 관련된 변수는 아버지의 음주양, 일과 가족간의 갈등정도, 어머니의 음주 횟수, 음주양이 선택되었다...
TAG LASSO, Variable Selection, 한국아동패널, 삶의 만족도, Regression A nalysis
클래스 불균형 해결을 위한 표본추출 방법의 직장 퇴사 데이터에 대한 비교연구
장동환  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 67~76페이지(총10페이지)
본 연구에서는 각 그룹에 해당하는 데이터의 비율이 현저한 차이를 보이는 클래스 불균형 문제에 대해서 여러 해결 방법들에 대한 비교 연구를 하고자 한다. 표본추출 방법 네 가지를 적용한 각각의 데이터를 생성한 후, 반응변수가 이항 범주형 자료일 때 적합할 수 있는 로지스틱 회귀분석을 이용하여 모형 적합을 해보고, 각 모델의 예측력을 평가하기 위해서 혼동행렬과 ROC 곡선을 통하여 확인한다.
TAG 클래스 불균형, 표본추출, 로지스틱 회귀분석, SMOTE, 혼동행렬, ROC 곡선, AUC
은행의 텔레마케팅 성공 여부 예측 모형 구축
오상곤  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 77~86페이지(총10페이지)
본 연구에서는 포르투갈 은행의 텔레마케팅 결과에 따른 고객의 정기 예금 가입여부를 예측하고자 한다. 위 데이터는 불균형 데이터이기 때문에 기존의 모형을 적합시킬 때 여러 가지 문제들이 발생한다. 따라서 기존 데이터와 SMOTE 기법을 사용한 데이터셋을 가지고 랜덤 포레스트, XGBoost, 서포트 벡터 머신, 인공 신경망, KNN 등의 여러 가지 기계 학습 기법들을 훈련시킨 후, 예측 모형의 성능을 비교하고 스태킹을 통해 기존 모델의 성능을 높이는 방법에 대해 고찰하고자 한다.
TAG Random Forest, XGBoost, Support Vector Machine, Neural Network, KNN, Stacking, SMOTE, Imbalanced Data
수온에 따른 어획량 예측과 어류 및 수산 종목 소비자물가지수의 개입
곽나영  성균관대학교 응용통계연구소, 통계연구 [2020] 제21권 87~100페이지(총14페이지)
본 연구는 시계열 분석 모형 중 ARIMA 모형과 전이함수 모형으로 어획량을 예측하고자 한다. 이를 위해 5종류의 어류 어획량(조기, 고등어, 갈치, 멸치, 오징어) 자료와 어획량에 민감한 영향을 끼칠 것으로 예상하는 수온 자료를 사용하였다. 또한, 2011년 동일본 대지진과 후쿠시마 원전폭발 사고가 어류 및 수산 종목의 소비자물가지수에 미치는 영향을 개입 분석을 통해 알아본다.
TAG Time series data, ARIMA model, Intervention analysis, Transfer Function model
Comparative Study for Prediction of Neural Network models
( Jinwoo Cho )  성균관대학교 응용통계연구소, 통계연구 [2018] 제20권 1~12페이지(총12페이지)
본 연구는 시계열 분석 모형 중 ARIMA 모형과 전이함수 모형으로 어획량을 예측하고자 한다. 이를 위해 5종류의 어류 어획량(조기, 고등어, 갈치, 멸치, 오징어) 자료와 어획량에 민감한 영향을 끼칠 것으로 예상하는 수온 자료를 사용하였다. 또한, 2011년 동일본 대지진과 후쿠시마 원전폭발 사고가 어류 및 수산 종목의 소비자물가지수에 미치는 영향을 개입 분석을 통해 알아본다.
TAG ARIMA, Neural Network, Stochastic Process, Deterministic process, Time series
HAR-RV 모형과 전진 신경망 모형을 활용한 실현 변동성의 추세 재현 능력 비교 분석
김재율  성균관대학교 응용통계연구소, 통계연구 [2018] 제20권 81~93페이지(총13페이지)
본 논문은 주식시장에서 변동성의 추세를 재현 하는 데 있어서 최근에 많이 활용되고 있는 지표인 실현 변동성(Realized Volatility:=RV)을 두 가지 모형을 이용하여 적합시킨 결과를 토대로 주어진 실현 변동성 데이터에서 시험군 실현 변동성의 추세 재현 능력을 비교분석 한다. 첫째, 실현 변동성을 정의하고, 실현 변동성 시계열이 가지는 특징에 대해서 설명한다. 둘째, 기존의 HAR-RV 모형과 Feed-forward 신경망을 소개하고 어떤 특징을 가지고 있는 모형인지 설명한다. 셋째, 실증 데이터를 통해서 HAR-RV 모형과 전진 신경망(Feed-forward Neural Network) 모형을 활용하여 예측된 결과를 토대로 시험군 실현변동성 시계열의 추세 재현 능력을 비교한다. 마지막으로 이 두 가지 모형을 활용한 비교분석...
TAG 실현 변동성 (RV), HAR-RV 모형, 전진 신경망 (Feed-forward NN)
 1  2  3  4  5  6  7  8  9  10