분야    
발행기관
간행물  
발행연도  
발행기관 : 한국통계학회 AND 간행물명 : 응용통계연구1937 개 논문이 검색 되었습니다.
함수형 선형모형에서의 B-스플라인에 기초한 검정
손지훈 ( Jihoon Sohn ) , 이은령 ( Eun Ryung Lee )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 607~618페이지(총12페이지)
현대 과학기술의 발전으로 인해 함수 형태의 자료(functional data)는 기상학, 생물의학과 다양한 분야에서 발생하고 있으며 이러한 자료를 분석하는 것은 새롭고 흥미로운 통계과제라 할 수 있다. 스칼라 반응변수를 가진 함수형 선형회귀 모형(functional linear regression models with scalar response)은 널리 사용되는 함수형 자료 분석기법 중의 하나라 할 수 있고 이 회귀 모형에서 함수형 자료 (설명변수) 가 스칼라 반응변수에 영향력을 미치는지 검정하는 것은 중요한 문제라 할 수 있다. 최근, Kong 등은 함수형 주성분분석(functional principle component analysis)에 의한 차원 축소, 즉, 함수형 주성분분석 결과 얻어지는...
TAG functional linear regression, functional association test, Wald test, functional principal component analysis, eigenfunctions, B-spline basis, 함수형 선형 회귀, 함수형 연관성 검정, 왈트 검정, 함수형 주성분분석, 고유함수기저, B-스플라인 기저
순수 베이지안 분류기 모델을 사용하여 이상지질혈증을 예측하는 노모 그램 구축
김민호 ( Min-ho Kim ) , 서주현 ( Ju-hyun Seo ) , 이긍희 ( Jea-young Lee )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 619~630페이지(총12페이지)
이상지질혈증은 한국인의 대표적인 성인병이며 지속적인 관리가 필요한 만성질환이다. 또한 고혈압이나 당뇨병과 함께 심혈관계 질환의 위험 요인으로 잘 알려져 있다. 하지만 혈관 질환은 검사 없이는 질병 판단을 하기 어려운 것이 현실이다. 본 연구에서는 이상지질혈증의 인지와 예방을 위하여 관련된 위험 요인을 확인한다. 이들을 종합하여 시각화하면서 발병률 예측까지 가능한 통계적 도구 노모그램을 구축하였다. 데이터는 국민건강영양조사 6기, 7기 제1차년도 (2013-2016) 데이터를 사용하였다. 분석 순서로는 먼저 이상지질혈증의 총 12가지 위험 요인을 교차분석을 통해 확인하였다. 그리고 순수 베이지안 분류기를 이용하여 이상지질혈증에 대한 모형으로 노모그램을 구축하였다. 구축한 노모그램은 ROC 곡선과 Calibration plot을 사용하여 신뢰성을 검증하였다. 마...
TAG Dyslipidemia, risk factor, na□ve Bayesian classifier, nomogram, 이상지질혈증, 위험요인, 순수 베이지안 분류기, 노모그
응답률이 선형인 표본조사에서 편향 보정 추정
정희영 ( Hee Young Chung ) , 신기일 ( Key-il Shin )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 631~642페이지(총12페이지)
다수의 항목무응답이 발생한 표본조사에서는 추정의 정확성이 떨어진다. 이를 해결하기 위한 많은 방법이 개발되었으나 응답률이 관심변수에 의해 영향을 받는 경우임에도 이를 고려하지 않고 랜덤으로 무응답이 발생한다는 가정 하에서 사용하는 무응답 처리 방법을 사용하게 되면 편향이 발생하는 것으로 알려져 있다. Chung과 Shin (2017)과 Min과 Shin (2018)은 응답률이 관심변수의 함수인 경우에서 발생된 편향을 적절히 처리하여 추정의 정확성을 향상시키는 방법을 제안하였다. 본 연구에서는 응답률 함수가 선형(linear)이면서 초모집단 모형의 오차가 정규분포를 따르는 경우를 살펴보았으며 층별 모집단 수가 편향 보정에 영향을 주는지도 살펴보았다. 모의실험을 통하여 제안된 추정량의 성능을 살펴보았으며 실제 자료 분석을 통해 이를 확인하였다.
TAG linear inclusion probability, sample distribution, regressive model, sample weight, 선형 표본 포함확률, 표본 분포, 회귀모형, 표본 가중치
반복조사에서 설계요소를 반영한 표본수 결정
박인호 ( Inho Park ) , 황현길 ( Hyeon Gil Hwang )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 643~652페이지(총10페이지)
본 연구에서는 반복조사의 표본재설계에서 설계요소를 반영한 표본수 결정 방법을 제안하였다. 제안된 방법은 다단추출과 층화다단추출 등에 적용할 수 있으며 시점간 모집단 구성 변화, 집락효과, 표본할당 등의 주된 설계요소가 갖는 표본오차에 대한 영향력을 구분하여 반영하므로 보다 전략적인 표본수 결정이 가능할 수 있다.
TAG repeated survey, coefficient of variation, design effect formula, stratified multistage sampling, 반복조사, 상대표준오차, 설계효과모형식, 층화다단추출
종양 이질성을 검정을 위한 통계적 방법론 연구
이동녘 ( Dong Neuck Lee ) , 임창원 ( Changwon Lim )  한국통계학회, 응용통계연구 [2019] 제32권 제3호, 331~348페이지(총18페이지)
전이성 종양의 성장패턴 차이와 변화율에 따른 종양 이질성(tumor heterogeneity)을 파악하는 것은 종양세포의 약물에 대한 민감성을 파악하고 적절한 치료법을 찾아내기 위해 중요하다. 일반적으로 N개의 표본의 집단이 구분된다면 t-test 혹은 ANOVA 분석을 통해 집단별 평균의 차이에 대한 검정이 가능하다. 그러나 본 논문에서 다루는 데이터와 같이 집단이 구분되지 않는 경우 이러한 방법들은 사용될 수 없다. 표본들 사이의 이질성을 검정하기 위한 통계적 방법들이 연구되어 왔다. 최소 조합 t-검정 방법은 그 중 하나이다. 본 논문에서는 상이한 비율로 데이터를 양분하는 조합도 고려하는 최대 조합 t-검정 방법을 제안한다. 한편, 표본의 이질성을 검정하는 것이 군집분석에서 최적의 군집의 개수가 2개 이상인지를 검정하는 것...
TAG heterogeneity, k-means clustering, gap statistic, determining the number of clusters, 이질성, k-평균 군집화, gap 통계량, 최소 조합 t-검정, 최대 조합 t-검정, 최적 군집 개수
이분형 자료의 분류문제에서 불균형을 다루기 위한 표본재추출 방법 비교
박근우 ( Geun U Park ) , 정인경 ( Inkyung Jung )  한국통계학회, 응용통계연구 [2019] 제32권 제3호, 349~374페이지(총26페이지)
이분형 자료의 분류에서 자료의 불균형 정도가 심한 경우 분류 결과가 좋지 않을 수 있다.이런 문제 해결을 위해 학습 자료를 변형시키는 등의 연구가 활발히 진행되고 있다. 본 연구에서는 이러한 이분형 자료의 분류문제에서 불균형을 다루기 위한 방법들 중 표본재추출 방법들을 비교하였다. 이를 통해 자료에서 희소계급의 탐지를 보다 효과적으로 하는 방법을 찾고자 하였다. 모의실험을 통하여 여러 오버샘플링, 언더샘플링, 오버샘플링과 언더샘플링 혼합방법의 총 20가지를 비교하였다. 분류문제에서 대표적으로 쓰이는 로지스틱 회귀분석, support vector machine, 랜덤포레스트 모형을 분류기로 사용하였다. 모의실험 결과, 정확도가 0.5 이상이면서 민감도가 높았던 표본재추출방법은 random under sampling (RUS)였다. 그 다음으로 민감도가 높...
TAG imbalanced-learn, imbalanced binary data, under-sampling, over-sampling, 불균형 학습, 불균형 이분형 자료, 언더샘플링, 오버샘플링
패널조사에서 비연속 응답 그룹 편향 보정을 위한 복합가중값
최형아 ( Hyunga Choi ) , 김영원 ( Youngwon Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제3호, 375~389페이지(총15페이지)
패널 자료는 자료가 축적되는 만큼 그 가치가 증대된다. 이와 동시에 장기추적에 따른 표본이탈은 자료의 신뢰성을 떨어뜨린다. 국내·외 대부분의 패널조사에서 가중값 보정을 통해 표본 이탈 문제를 해결하고 있다. 본 논문에서는 패널자료에서 차수별 응답여부에 따라 연속 응답 그룹과 비연속 응답 그룹으로 나누고, 비연속 응답 그룹에 대한 적정 가중값 산출방법을 검토하였다. 연속/비연속 응답그룹을 구분하여 비연속 응답 그룹의 응답자 특성을 반영한 복합추정 방식의 가중값 작성방법을 제안하고, 그룹의 구분 없이 작성하였던 기존의 가중값 작성방법과 새로 제안한 복합추정 방식의 가중값 산출방법의 효율성을 모의실험과 실증분석을 통해 살펴보았다. 결과적으로 새로 제안한 복합추정 방식의 가중값 산출방법은 기존 방법 보다 편향을 대폭 감소시킴을 모의실험을 통해 볼 수 있었다. 한...
TAG panel survey, weight, composite estimation type weight, non-continuous response group, 패널조사, 가중값, 복합추정 가중값, 비연속 응답 그룹
에어비앤비(Airbnb) 웹 로그 데이터를 이용한 고객 행동 예측
안효인 ( Hyoin An ) , 최유리 ( Yuri Choi ) , 오래은 ( Raeeun Oh ) , 송종우 ( Jongwoo Song )  한국통계학회, 응용통계연구 [2019] 제32권 제3호, 391~404페이지(총14페이지)
그동안의 고객 행동에 대한 예측은 주로 고객이 가지는 고정적인 특성을 이용해왔다. 최근에는 점차 고객들의 활동이 오프라인에서 온라인으로 이동하면서 각 고객의 웹 로그를 추적하는 일이 가능해졌다. 그러나 방대한 양의 웹 로그 데이터를 수집할 수 있게 된 반면, 이에 대한 연구는 로그 데이터를 정리하거나 기술적인 특성만을 설명하는 것에 그쳤다. 본 연구에서는 웹사이트 Kaggle에서 제공하는 Airbnb 고객들의 성별, 연령 등의 기본 정보 및 웹 로그가 포함된 데이터셋을 이용하여 첫 숙소 예약까지 걸리는 개인의 의사 결정 시간을 예측하였다. Lasso, SVM, Random Forest, XGBoost 등 다양한 방법론을 활용하여 최적의 모형을 찾고, 웹 로그 데이터의 유무에 따른 예측오차를 비교하여 웹 로그의 효용성을 확인하였다. 결과적으로 오분류율이 ...
TAG web log, customer behavior prediction, machine learning, data mining, 웹 로그, 고객 행동 예측, 기계학습, 데이터 마이닝
주거용 건물의 전력 사용량에 대한 시계열 분석 및 예측
박경미 ( Kyeongmi Park ) , 김재희 ( Jaehee Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제3호, 405~421페이지(총17페이지)
얼마나 많은 에너지를 사용하느냐에 대한 예측은 사회에서 중요한 이슈이다. 특히 주거 건물은 건물의 특성상 다른 건물에 비해 예측하기 힘들다. 본 논문에서는 주거용 건물의 전력 사용량에 대한 시계열 분석의 방법들을 설명하고자 한다. 일반적으로 온도는 전력 사용량과 밀접한 관련이 있다고 알려져 있다. 변수들 사이에 공적분 관계가 존재한다면, 시간에 따른 오차를 조정하는 방법인 오차수정모형을 적용한다. 전력 사용량과 온도를 포함한 변수들 사이에 공적분 관계가 있음을 보이고, 새로운 온도 반응 함수를 정의하여 온도 효과를 고려한 오차수정모형을 적용하고자 한다.
TAG ECM, cointegration, electricity demand, residential building, temperature response function, 오차수정모형, 공적분, 전력 사용량, 주거용 건물, 온도반응함수
토픽 분석을 이용한 학생부종합전형의 쟁점 분석
홍영희 ( Younghee Hong )  한국통계학회, 응용통계연구 [2019] 제32권 제3호, 423~434페이지(총12페이지)
지난 2018년, 우리사회를 뜨겁게 달구었던 이슈 중 하나로 대입제도 개편에 관한 논쟁을 꼽을 수 있겠다. 그 중에서도 학생부종합전형에 대한 쟁점이 무엇인가를 파악하기 위해 감시와 비판이라는 언론의 기능에 주목하여 관련 뉴스기사에 대한 토픽 분석을 시도해 보았다. 그 결과 수능체제 개편 논의가 비중있는 주제로 등장하여 수능시험에 대한 한국 사회의 민감성을 보여 주었다. 학생부종합전형과 직접적 관련이 있는 주제로는 학생부종합전형의 세부적인 선발 요소에 대한 논의가 등장하였고, 대입전형의 공정성에 관한 논의와 밀접한 관계를 보였다.
TAG topic analysis, news article, admission officer system, 토픽 분석, 뉴스 기사, 학생부종합전형
 11  12  13  14  15  16  17  18  19  20