분야    
발행기관
간행물  
발행연도  
발행기관 : 한국통계학회 AND 간행물명 : 응용통계연구1937 개 논문이 검색 되었습니다.
CNN 모형을 이용한 서울 아파트 가격 예측과 그 요인
이현재 ( Hyunjae Lee ) , 손동희 ( Donghui Son ) , 김수진 ( Sujin Kim ) , 오세인 ( Sein Oh ) , 김재직 ( Jaejik Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 603~614페이지(총12페이지)
본 연구는 이미지 데이터에 대한 예측 모형으로 뛰어난 성능을 보여온 convolutional neural networks (CNN) 모형을 이용하여 서울 아파트 가격의 예측과 서울 각 지역 아파트들의 가격결정요인들을 연구한다. 이를 위해 강, 녹지, 고도와 같은 자연환경요인, 버스정류장, 지하철역, 상권, 학교 등과 같은 기반시설요소, 일자리수, 범죄율 등의 사회경제요소들을 설명변수로 고려하고, CNN 모형이 이미지 데이터에 좋은 성능을 보여온 것을 기반으로 이 설명변수들의 값들을 CNN 모형 입력층으로써 이미지 채널의 픽셀값과 같은 역할을 하도록 변환하여 아파트 가격의 예측과 가격결정요인에 대한 해석을 시도한다. 덧붙여 본 연구에서 사용된 CNN 모형은 자연환경요인과 기반시설요인 변수들을 각 아파트를 중심으로 하는 각 입력...
TAG convolutional neural networks, image data, spatial data, apartment price, CNN모형, 이미지데이터, 공간데이터, 아파트가격
텍스트 마이닝에서 심층 신경망을 이용한 문서 분류
이보희 ( Bo-hui Lee ) , 이수진 ( Su-jin Lee ) , 최용석 ( Yong-seok Choi )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 615~625페이지(총11페이지)
문서-용어 빈도행렬은 그룹정보가 존재하는 문서들의 용어를 추출한 것으로 일반적인 텍스트 마이닝에서의 자료이다. 본 연구에서는 연구 분야 성격에 따른 문서 분류를 위해 문서-용어 빈도행렬을 생성하고, 전통적인 용어 가중치함수인 TF-IDF와 최근 잘 알려진 용어 가중치 함수인 TF-IGM을 적용하였다. 또 용어 가중치가 적용된 문서-용어 가중행렬에 문서분류 정확도 향상을 위해 핵심어를 추출하여 문서-핵심어 가중행렬을 생성하였다. 핵심어가 추출된 행렬을 바탕으로, 심층 신경망을 이용해 문서를 분류하였다. 심층 신경망에서 최적의 모델을 찾기 위해 매개변수인 은닉층과 은닉노드수를 변화해가며 문서 분류 정확도를 확인하였다. 그 결과 8개의 은닉층을 가진 심층 신경망 모델이 가장 높은 정확도를 보였으며 매개변수 변화에 따른 모든 TF-IGM 문서 분류 정...
TAG document classification, deep neural network, term weighting, text mining, keyword extraction, 문서 분류, 심층 신경망, 용어 가중치, 텍스트 마이닝, 핵심어 추출
순환신경망을 이용한 질병발생건수 예측
이승현 ( Seunghyeon Lee ) , 여인권 ( In-kwon Yeo )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 627~637페이지(총11페이지)
본 논문에서는 건강보험심사평가원에서 제공한 약 120만명의 2014년 고령환자의료자료(HIRA-APS-2014-0053)과 기상자료를일반화추정방정식(generalized estimating equation; GEE)모형과long short term memory (LSTM)기반 순환신경망(recurrent neural network; RNN) 모형으로 분석하여 기상 조건에 따른 주요 주상병의 발생 빈도를 예측한다. 이를 위해 환자가 의료 서비스를 받은 기관의 지역을 이용하여 환자의 거주지를 추정하고 해당 지역의 주별 기상 관측소 자료와 의료자료를 병합하였다. 질병 발생 상태를 세 개의 범주(질병에 걸리지 않음, 관심 주상병발생, 다른 질병 방생)로 나누었으며 각 범주에 속...
TAG elderly patient medical data, weather data, GEE, RNN, 고령환자의료자료, 기상자료
새로운 우리나라 불확실성 지수의 작성
이긍희 ( Geung-hee Lee ) , 조주희 ( Joo-hee Cho ) , 조진경 ( Jin-gyeong Jo )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 639~653페이지(총15페이지)
COVID-19 대유행, 미·중 무역분쟁, 글로벌 금융위기 등 대내외 환경변화에 따른 경제불확실성이 증가하고 있다. 경제불확실성은 경제 전반의 성장을 지연·제약하고 있어 정책 수행과 경제분석에서 경제불확실성을 측정하는 것이 중요하다. Baker 등 (2016) 등은 주요 언론사의 기사의 키워드를 분석하여 우리나라를 포함한 주요국의 경제불확실성(economic policy uncertainty) 지수를 산출하여 공개하고 있다. 그런데 Baker 등의 우리나라 경제불확실성 지수는 키워드 선정, 기사 수집 방법, 대상 언론사의 선정 등에 있어 우리나라 상황을 충분히 반영하지 못하고 있다. 이 논문에서는 우리나라 상황에 맞게 우리나라 경제불확실성 지수를 수정·보완하여 작성하고, 그 유용성을 거시경제 통계와의 관련성, 예측력과 경제분석 측면에서 ...
TAG economic policy uncertainty index, text-mining, impulse response analysis, cross-correlation, forecasting performance, 경제불확실성, 텍스트 마이닝, 불확실성, 충격반응분석, 교차상관분석, 예측력
COVID-19 펜데믹에 대한 GSADF 버블 검정 분석
신지원 ( Jiwon Shin ) , 신동완 ( Dong Wan Shin )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 655~664페이지(총10페이지)
우리는 버블 검정과 이에 해당하는 date-stamping 방법을 통해 주요 국가의 COVID-19 일일 신규 확진자 수 데이터를 분석하였다. 2020.06.30 현재 미국, 브라질, 러시아, 스페인, 터키, 중국, 한국은 확진자 수가 지수적으로 급증하는 공황 상태를 벗어나 어느정도 COVID-19 질병에 대한 통제가 이루어지고 있는 상태임을 확인하였으나 인도는 COVID-19 급증기가 지속되고 있어 한동안 국가적 공황 상태가 지속 될 것으로 평가되었다. 한국은 1차 확산(2020.02.20-2020.03.06)이 지나가고 2020.05.27 에 재 확산기에 잠깐 진입하여 다시 위기를 맞이했다가 최근 2020.06.01 이후 다시 안정기에 재 진입하여 신규 확진자 수가 크게 늘지 않고 안정적이게 유지하고 있다.
TAG COVID-19, GSADF, Bubble test, Bubble date-stamping
기하평균에 대한 소고
여인권 ( In-kwon Yeo )  한국통계학회, 응용통계연구 [2020] 제33권 제4호, 357~364페이지(총8페이지)
이 소고에서는 기하평균의 성질과 기하평균과 관련된 통계적 추론에 대한 알아 본다. 로그변환-역변환을 통해 얻어진 통계적 추론 결과가 기하평균과 관련이 있다는 것을 보이고 이 과정에서 유도된 결과를 어떻게 해석해야 하는지를 설명한다.
TAG geometric mean, logarithmic transformation, exponential function, 기하평균, 로그변환, 지수함수
내재된 인자회귀모형의 베이지안 분석법
경민정 ( Minjung Kyung )  한국통계학회, 응용통계연구 [2020] 제33권 제4호, 365~377페이지(총13페이지)
선형모형에서 두개 이상의 설명변수들 사이에 존재하는 다중공선성 문제를 변수들 간에 내재되어 있는 공통의 구조인 인자를 구성하고, 인자들을 회귀변수로 사용하여 해결하는 인자회귀모형에 대하여 논의한다. 무한개로 가정 가능한 내재된 인자 중 유의미한 인자적재행렬을 구성하기 위하여 벌점모수의 값이 큰 LASSO 사전분포를 적용하는 베이지안 추정법을 사용한다. 결정된 인자적재행렬과 다른 모수들의 추정값을 각 설명변수의 선형모수로 역변환 하여, 새로운 관측값에 대한 예측 모형으로도 사용한다. 제안한 방법을 제품 서비스 관리 자료에 적용하여 정해진 인자의 개수에 대한 인자가 일반적인 공통인자회귀모형과 동일한 결과를 나타냄을 확인하였고, 일반적인 공통인자회귀모형과 비교를 위해 계산한 평균 제곱 오차값이 더 작다는 것을 알 수 있었다.
TAG Bayesian latent factor model, LASSO prior, Gibbs sampling, 베이지안 내재된 인자모형, LASSO 사전분포, 깁스표집법
의료, 보건, 역학 분야에서 생산되는 준경쟁적 위험자료를 분석하기 위한 통계적 모형의 개발과 임상분석시스템 구축을 위한 연구
김진흠 ( Jinheum Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제4호, 379~393페이지(총15페이지)
사망과 같은 종말 사건은 중간 사건을 중도절단 시킬 수 있지만 재발과 같은 중간 사건은 종말 사건을 중도절단 시킬 수 없는 자료를 준경쟁위험 자료라고 하는데 의학 및 보건, 역학 분야에서는 이와 같은 자료를 자주 접하게 된다. 본 논문에서는 질병-사망 모형에 포함된 세 가지 전이 시간이 모두 구간중도절단된 준경쟁위험 자료를 분석하기 위해 정규 프레일티를 가진 와이블 회귀모형을 제안하였다. 각 개체는 중간 사건과 종말 사건의 발생 여부에 따라 다섯 가지 유형으로 구분되는데 유형별로 조건부 우도함수를 유도하였다. 조정중요표본추출법을 써서 주변 우도함수를 유도한 후 반복의사뉴톤 알고리즘을 써서 최적 추정량을 얻었다. 제안한 추정 방법의 소표본 성질을 살펴보기 위해 모의실험을 수행하였으며 또한 제안한 추정 방법을 Personnes Ag´ees Quid (P...
TAG EM algorithm, illness-death model, interval censoring, normal frailty, semi-competing risks data, EM 알고리즘, 질병-사망 모형, 구간중도절단, 정규 프레일티, 준경쟁위험 자료
Index of Union와 다른 정확도 측도들
홍종선 ( Chong Sun Hong ) , 최소연 ( So Yeon Choi ) , 임동휘 ( Dong Hui Lim )  한국통계학회, 응용통계연구 [2020] 제33권 제4호, 395~407페이지(총13페이지)
최적분류점에 대한 대부분의 정확도 측도들은 두 종류의 누적분포함수와 확률밀도함수를 기반으로 정의하거나 또는 ROC 곡선과 AUC를 기반으로 정의하는 방법으로 구분하는데, Unal (2017)은 두 가지 방법을 혼합하여 누적분포함수와 AUC를 모두 고려하는 정확도 측도 Index of Union (IU) 통계량을 제안하였다. 본 연구에서는 IU 통계량을 포함한 열 개의 정확도 측도들을 여섯 종류의 범주로 구분하여 각 범주에 속하는 측도들을 비교하면서 IU의 장점을 연구한다. 다양한 정규혼합분포를 설정하여 각각의 측도들에 대응하는 최적분류점들을 구하고 각 분류점에 대응하는 제1종과 제2종 오류 그리고 두 종류의 오류합을 구해서 오류들의 크기를 비교하면서 분류정확도 측도들의 판별력을 비교하면서 IU의 성격과 특징을 탐색한다. 두 종...
TAG accuracy, discriminant, sensitivity, specificity, threshold, 민감도, 분류점, 정확도, 판별, 특이도
전수층 무응답 편향보정 추정법에 관한 연구
정희영 ( Hee Young Chung ) , 신기일 ( Key-il Shin )  한국통계학회, 응용통계연구 [2020] 제33권 제4호, 409~420페이지(총12페이지)
사업체조사에서는 흔히 수정절사법이 사용되며 이 방법을 사용함으로써 표본의 수를 줄이면서도 추정의 정확성을 향상 시킬 수 있다. 그러나 전수층의 무응답률은 크게 높아지고 있으며 예비표본을 이용한 표본대체가 불가능하기 때문에 전수층에서 발생한 무응답은 추정의 정확성을 크게 떨어뜨리고 있다. 특히 무응답이 관심변수에 영향을 받는 경우에는 편향이 발생할 가능성이 매우 높기 때문에 이를 적절히 처리하는 것은 매우 중요하다. 본 연구에서는 전수층에서 발생한 무응답을 적절히 처리하는 방법의 하나로 편향보정 추정법을 제안하였다. 특히 Chung과 Shin(2020)에서 제안한 편향보정 추정량을 전수층 편향보정에 적용하였으며 전수층이라는 특수한 경우에 맞는 새로운 추정 방법을 제안하였다. 또한 모의실험을 통해 제안된 방법의 우수성을 살펴보았으며 실제 자료 분석을 실시하여 본...
TAG super population model, linear response rate model, power response rate model, gamma distribution, log-normal distribution, 초모집단 모형, 선형 응답률 모형, 파워형 응답률 모형, 감마분포, 로그-정규분포
 1  2  3  4  5  6  7  8  9  10