분야    
발행기관
간행물  
발행연도  
발행기관 : 한국통계학회 AND 간행물명 : 응용통계연구1903 개 논문이 검색 되었습니다.
경험적 영향함수와 표본영향함수의 차이 및 보정에 관한 연구
강현석 ( Hyunseok Kang ) , 김홍기 ( Honggie Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 527~540페이지(총14페이지)
이상치에 대한 적절한 선별과 배제없이 모든 데이터를 종합적으로 분석하게 되는 경우 데이터 분석을 통해 얻은 결과의 신뢰성과 해석의 일반성에 치명적인 위협을 받을 수 있다. 따라서 데이터의 분석 과정에서 이러한 이상치를 판별하고, 이상치가 통계량, 통계적 모형에 어떠한 영향을 주는 지에 대한 분석은 매우 중요한 일이라 할 수 있다. Hampel이 영향함수를 활용하여 이상치를 판별할 수 있는 방법을 소개한 이후, 이상치를 판별하기 위한 방법론으로 영향함수가 폭넓게 활용되어 왔다. 영향함수에는 경험적 영향함수와 표본영향함수가 있으며, 경험적 영향함수를 활용해 표본영향함수를 근사 추론하여 하나의 관측값이 제거되었을 때 통계량에 미치는 영향을 예측하는 방법론이 주로 활용되었다. 본 연구에서는 표본평균, 표본분산, 표본표준편차의 표본영향함수 유도를 통해 경험적 영...
TAG influence function, outlier, empirical influence function, sample influence function, 영향함수, 이상치, 경험적 영향함수, 표본영향함수
민감도와 특이도 직선을 이용한 부분 AUC
홍종선 ( Chong Sun Hong ) , 장동환 ( Dong Hwan Jang )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 541~553페이지(총13페이지)
Receiver operating characteristic (ROC) 곡선은 민감도와 특이도로 표현되며, ROC 곡선을 이용하는 최적분류점도 민감도와 특이도만을 반영하지만, 본 연구에서는 질병률과 효용을 추가하여 고려하는 기대효용함수를 연구한다. 특히 교차하는 ROC 곡선들의 area under the ROC curve (AUC) 값들이 유사한 경우에 특정한 부분의 부분 AUC를 비교해야 한다. 본 연구에서는 정의된 민감도 직선과 특이도 직선을 바탕으로 각각 높은 민감도와 특이도를 나타내는 부분 AUC를 제안한다. ROC 곡선들이 교차하고 동일한 AUC 값을 갖는 다양한 분포함수를 설정하여, 민감도 직선과 특이도 직선을 이용하여 구한 부분 AUC를 비교하면서 모형의 판별력을 향상시키는 방법을 제안...
TAG AUC, sensitivity, specificity, threshold, utility, 민감도, 분류점, 특이도, 효용
고혈압 예측을 위한 노모그램 구축 및 비교
김민호 ( Min Ho Kim ) , 신민석 ( Min Seok Shin ) , 이제영 ( Jea Young Lee )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 555~567페이지(총13페이지)
고혈압은 발병률이 꾸준히 증가하고 있을 뿐 아니라, 심혈관 질환과 같은 2차 질병의 주된 위험 요인이 되었다. 게다가 고혈압은 뇌졸중, 혈관성 치매와 같은 다른 합병증을 유발하는 질병이다. 따라서 고혈압 발병률을 예측하는 것은 중요한 일이다. 본 연구에서, 고혈압 발병률을 예측할 수 있는 노모그램을 구축하였다. 데이터는 2013년부터 2016년까지의 국민건강영양조사로부터 얻어졌다. 복합 표본의 특성을 고려하여 Rao-Scott chi-squared test를 통해 고혈압에 영향을 미치는 10가지 요인을 규명하였다. 하지만 로지스틱 회귀분석 시, 흡연 상태와, 운동 유무는 유의하지 않았다. 따라서 8개의 주 효과를 고혈압의 위험요인으로 최종 선별하였다. 그리고 최종 선별된 위험 요인들로 로지스틱 노모그램과 베이지안 노모그램을 제시 및 비교하였다. 마지막...
TAG hypertension, logistic regression, na¨ıve Bayesian classifier, nomogram, risk factor, 고혈압, 로지스틱 회귀분석, 순수 베이지안 분류기, 노모그램, 위험 요인
대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형
방성완 ( Sungwan Bang ) , 김재오 ( Jaeoh Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 569~578페이지(총10페이지)
분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할...
TAG divide and conquer, kernel, quadratic programming, quantile regression, 분할정복 알고리즘, 커널, 이차계획법, 분위수 회귀모형
게임 룰에 따른 두 팀 간에 벌이는 가위바위보 게임 수 비교
조대현 ( Daehyeon Cho )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 579~590페이지(총12페이지)
우리는 게임에 앞서 먼저 가위바위보 게임을 통하여 공격할 팀을 결정하곤 한다. 가위바위보 게임은 둘 중 혹은 여러 사람 중에서 하나를 선택하고자 할 때도 사용된다. 두 팀 중 한 팀을 선택하고자 할 때 가위바위보 게임을 사용할 경우 다양한 승부 결정방식이 존재한다. 각 팀에서 1명씩 가위바위보 게임을 하여 승자가 다른 팀의 남은 사람과 계속하여 상대 팀의 남은 자가 없는 경우 승자 팀이 최종 승리하는 승부 결정방식을 생각할 수 있다. 참여한 모든 사람이 함께 가위바위보 게임을 하여 매 게임에서 승자들의 수가 많은 팀이 승리하는 경우와 한 팀에만 승자가 남는 경우 그 팀이 승리하는 승부 결정방식도 고려할 수 있다. 본 연구에서는 승부 결정방식에 따라 게임이 끝날 때까지 가위바위보의 총 게임 수에 대한 평균과 분산을 구하는 방법을 연구하였다.
TAG Rock-Paper Scissors, mean, number of cases, variance, 가위바위보 게임, 경우의 수, 평균, 분산
자기조직화지도에서 연결강도에 기반한 새로운 군집타당성지수
김상민 ( Sangmin Kim ) , 김재직 ( Jaejik Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 591~601페이지(총11페이지)
자기조직화지도는 고차원의 원자료를 노드들로 이루어진 저차원의 공간으로 투영하는 비지도학습 방법이다. 이 방법은 고차원의 자료를 노드들을 사용하여 2 또는 3차원의 공간에서 시각화할 수 있고, 이를 통해 자료의 특성을 탐색하는데 유용하다. 자료의 구조를 파악하기 위해 종종 노드들에 대한 군집분석을 시도하는데, 군집분석의 중요한 문제중 하나는 군집의 개수를 결정하는 것이다. 이 문제를 해결하기 위해 다양한 군집타당성지수들이 지금까지 개발되어 왔고, 이러한 지수들은 자기조직화지도의 노드들의 군집분석에 직접적으로 적용될 수 있다. 그러나, 자기조직화 지도가 원자료의 위상적 특성을 저차원 공간에 반영할 수 있다는 특징을 갖는데 반해, 이러한 일반적인 지수들은 이를 고려하지 않는 문제가 있다. 이에 본 연구에서는 원자료의 위상적 특성을 고려한 노드들 사이의 연결강도를 ...
TAG cluster validity index, self-organizing map, connectivity, cluster analysis, 군집타당성지수, 자기조직화지도, 연결강도, 군집분석
CNN 모형을 이용한 서울 아파트 가격 예측과 그 요인
이현재 ( Hyunjae Lee ) , 손동희 ( Donghui Son ) , 김수진 ( Sujin Kim ) , 오세인 ( Sein Oh ) , 김재직 ( Jaejik Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 603~614페이지(총12페이지)
본 연구는 이미지 데이터에 대한 예측 모형으로 뛰어난 성능을 보여온 convolutional neural networks (CNN) 모형을 이용하여 서울 아파트 가격의 예측과 서울 각 지역 아파트들의 가격결정요인들을 연구한다. 이를 위해 강, 녹지, 고도와 같은 자연환경요인, 버스정류장, 지하철역, 상권, 학교 등과 같은 기반시설요소, 일자리수, 범죄율 등의 사회경제요소들을 설명변수로 고려하고, CNN 모형이 이미지 데이터에 좋은 성능을 보여온 것을 기반으로 이 설명변수들의 값들을 CNN 모형 입력층으로써 이미지 채널의 픽셀값과 같은 역할을 하도록 변환하여 아파트 가격의 예측과 가격결정요인에 대한 해석을 시도한다. 덧붙여 본 연구에서 사용된 CNN 모형은 자연환경요인과 기반시설요인 변수들을 각 아파트를 중심으로 하는 각 입력...
TAG convolutional neural networks, image data, spatial data, apartment price, CNN모형, 이미지데이터, 공간데이터, 아파트가격
텍스트 마이닝에서 심층 신경망을 이용한 문서 분류
이보희 ( Bo-hui Lee ) , 이수진 ( Su-jin Lee ) , 최용석 ( Yong-seok Choi )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 615~625페이지(총11페이지)
문서-용어 빈도행렬은 그룹정보가 존재하는 문서들의 용어를 추출한 것으로 일반적인 텍스트 마이닝에서의 자료이다. 본 연구에서는 연구 분야 성격에 따른 문서 분류를 위해 문서-용어 빈도행렬을 생성하고, 전통적인 용어 가중치함수인 TF-IDF와 최근 잘 알려진 용어 가중치 함수인 TF-IGM을 적용하였다. 또 용어 가중치가 적용된 문서-용어 가중행렬에 문서분류 정확도 향상을 위해 핵심어를 추출하여 문서-핵심어 가중행렬을 생성하였다. 핵심어가 추출된 행렬을 바탕으로, 심층 신경망을 이용해 문서를 분류하였다. 심층 신경망에서 최적의 모델을 찾기 위해 매개변수인 은닉층과 은닉노드수를 변화해가며 문서 분류 정확도를 확인하였다. 그 결과 8개의 은닉층을 가진 심층 신경망 모델이 가장 높은 정확도를 보였으며 매개변수 변화에 따른 모든 TF-IGM 문서 분류 정...
TAG document classification, deep neural network, term weighting, text mining, keyword extraction, 문서 분류, 심층 신경망, 용어 가중치, 텍스트 마이닝, 핵심어 추출
순환신경망을 이용한 질병발생건수 예측
이승현 ( Seunghyeon Lee ) , 여인권 ( In-kwon Yeo )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 627~637페이지(총11페이지)
본 논문에서는 건강보험심사평가원에서 제공한 약 120만명의 2014년 고령환자의료자료(HIRA-APS-2014-0053)과 기상자료를일반화추정방정식(generalized estimating equation; GEE)모형과long short term memory (LSTM)기반 순환신경망(recurrent neural network; RNN) 모형으로 분석하여 기상 조건에 따른 주요 주상병의 발생 빈도를 예측한다. 이를 위해 환자가 의료 서비스를 받은 기관의 지역을 이용하여 환자의 거주지를 추정하고 해당 지역의 주별 기상 관측소 자료와 의료자료를 병합하였다. 질병 발생 상태를 세 개의 범주(질병에 걸리지 않음, 관심 주상병발생, 다른 질병 방생)로 나누었으며 각 범주에 속...
TAG elderly patient medical data, weather data, GEE, RNN, 고령환자의료자료, 기상자료
새로운 우리나라 불확실성 지수의 작성
이긍희 ( Geung-hee Lee ) , 조주희 ( Joo-hee Cho ) , 조진경 ( Jin-gyeong Jo )  한국통계학회, 응용통계연구 [2020] 제33권 제5호, 639~653페이지(총15페이지)
COVID-19 대유행, 미·중 무역분쟁, 글로벌 금융위기 등 대내외 환경변화에 따른 경제불확실성이 증가하고 있다. 경제불확실성은 경제 전반의 성장을 지연·제약하고 있어 정책 수행과 경제분석에서 경제불확실성을 측정하는 것이 중요하다. Baker 등 (2016) 등은 주요 언론사의 기사의 키워드를 분석하여 우리나라를 포함한 주요국의 경제불확실성(economic policy uncertainty) 지수를 산출하여 공개하고 있다. 그런데 Baker 등의 우리나라 경제불확실성 지수는 키워드 선정, 기사 수집 방법, 대상 언론사의 선정 등에 있어 우리나라 상황을 충분히 반영하지 못하고 있다. 이 논문에서는 우리나라 상황에 맞게 우리나라 경제불확실성 지수를 수정·보완하여 작성하고, 그 유용성을 거시경제 통계와의 관련성, 예측력과 경제분석 측면에서 ...
TAG economic policy uncertainty index, text-mining, impulse response analysis, cross-correlation, forecasting performance, 경제불확실성, 텍스트 마이닝, 불확실성, 충격반응분석, 교차상관분석, 예측력
 1  2  3  4  5  6  7  8  9  10 
사업자등록번호 220-87-87785 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.070-8809-9397
개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1765호 이메일 help@reportshop.co.kr
copyright (c) 2009 happynlife. steel All reserved.