분야    
발행기관
간행물  
발행연도  
발행기관 : 한국통계학회 AND 간행물명 : 응용통계연구1937 개 논문이 검색 되었습니다.
한계와 이상치가 있는 결측치의 로버스트 다중대체 방법
박유성 ( Yousung Park ) , 오도영 ( Do Young Oh ) , 권태연 ( Tae Yeon Kwon )  한국통계학회, 응용통계연구 [2019] 제32권 제6호, 889~898페이지(총10페이지)
항목 무응답(item missing)이 발생한 설문조사에서 결측이 포함된 변수에 이상치(outlier)의 존재와 다른 설문문항 항목과의 논리적 한계(boundary) 조건들이 유의미하다면 결측치 대체문제는 매우 복잡해진다. 한계가 있는 결측값들을 포함한 변수에 이상치가 존재하는 경우, 기존의 회귀분석에 근거한 결측치 대체방법은 편향된 대체값 그리고 한계를 만족하지 않은 대체값을 제시할 가능성이 있다. 이에 본 논문은 회귀모형에 기반을 두고 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건이 자료에 존재하는 경우, 다양한 로버스트 회귀모형과 다중대체 방법의 조합을 통해 해결점을 모색하고자 한다. 이를 위해 이들 방법들의 최적의 조합을 다양한 시나리오별로 모의실험을 통하여 찾아보고 이에 대하여 논의하였다.
TAG break-down point, robust regression, Bayesian multiple imputation, 붕괴점, 로버스트 회귀분석, 베이지안 다중대체
하이브리드 드롭아웃
박종선 ( Chongsun Park ) , 이명규 ( Myeonggyu Lee )  한국통계학회, 응용통계연구 [2019] 제32권 제6호, 899~908페이지(총10페이지)
수 많은 모수들을 가지고 있는 방대한 심층신경망은 매우 강력한 기계학습 방법이지만 모형의 과도한 융통성으로 인하여 과적합문제를 내포하고 있다. 드롭아웃 방법은 크기가 큰 신경망의 과적합 문제를 해결하는 다양한 방법들 중 하나이며 매우 효과적인 방법으로 알려져 있다. 드롭아웃 방법은 훈련과정에서 각각의 표본에 다른 모형을 적용하는 데 이들 모형은 입력과 은닉층의 노드들을 무작위로 제거한 모형들 중에 임의로 선택된다. 본 연구에서는 임의로 선택된 모형에 둘 이상의 표본을 적용하여 모형의 가중치들에 대한 추정치의 안정성을 높이는 하이브리드 드롭아웃 방법을 제시하였다. 실제 자료를 이용한 시뮬레이션 결과 노드의 선택확률과 모형의 적합에 사용되는 표본의 수를 적절하게 선택하여 기존의 방법에 비하여 추정치의 변동성이 감소시킬 수 있었으며 동시에 검증자료에 대한 최저오...
TAG deep neural network, dropout, co-adaptation, overfitting, hybrid method, 심층신경망, 드롭아웃, 공적응, 과적합, 하이브리드방법
비정상 자기회귀모형에서의 벌점화 추정 기법에 대한 연구
나옥경 ( Okyoung Na )  한국통계학회, 응용통계연구 [2019] 제32권 제6호, 909~922페이지(총14페이지)
벌점화 추정 기법 중 adaptive LASSO 방법은 모형 선택과 모수 추정을 동시에 할 수 있는 유명한 방법으로 이미 정상 자기회귀모형에서 연구된 적이 있다. 본 논문에서는 이를 확장하여 확률보행과정과 같은 비정상 자기회귀모형에서 adaptive LASSO 추정량이 갖는 성질을 모의실험을 통해 연구하였다. 다만 비정상 자기회귀모형에서는 단위근의 존재 여부를 판단하는 것과 모형의 차수를 선택하는 것이 가장 중요하므로, 이를 위해 원 자기회귀모형이 아닌 ADF 검정에서 고려하는 회귀모형으로 변환하여 adaptive LASSO를 적용하였다. 일반적으로 Adaptive LASSO를 적용할 때 조절모수의 선택이 가장 중요한 문제이며, 본 논문에서는 교차검증, AIC, BIC 세 가지 방법을 이용하여 조절모수를 선택하였다. 모의실험 결과를...
TAG AR model, unit-root, order selection, adaptive LASSO, 자기회귀누적이동평균 모형, 단위근, 차수 선택, 벌점화 추정방법
종이신문 열독자의 특성이 정기구독 여부에 미치는 영향에 대한 로지스틱 회귀분석
이세영 ( Seyoung Lee ) , 김재희 ( Jaehee Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 653~669페이지(총17페이지)
뉴미디어의 등장과 발달로 인해, 과거 미디어의 대부분을 차지한 종이신문의 이용량이 점차 줄어들어 종이신문의 정기구독률이 2016년 14%로 매우 저조하게 나타났다. 따라서 본 연구는 종이신문 정기구독 여부에 영향을 미치는 열독자 요인을 파악하고자 수행되었다. 이를 위해 한국 언론 진흥재단의 2016년과 2017년의 언론수용자 의식조사의 자료를 분석에 사용하였다. 열독자의 성별, 연령, 학력, 가구소득, 열독일수, 열독시간, 열독분량을 열독자의 특성으로 지정하였으며, 정기구독 여부에 열독자의 어떠한 특성이 영향을 미치는지 알아보기 위해 다중 로지스틱 회귀를 적합하고 해석하였다.
TAG 로지스틱 회귀모형, 언론수용자의식조사, 정기구독, 종이신문, 수용자 작용 특징(ROC) 곡선, logistic regression, audience survey of Korea press foundation, audience attribute, newspaper subscription, receiver operating characteristic (ROC)
다변량 시계열 자료를 이용한 부정맥 예측
이민혜 ( Minhai Lee ) , 노호석 ( Hohsuk Noh )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 671~681페이지(총11페이지)
최근에 부정맥 환자가 증가하면서 머신러닝을 이용한 부정맥을 예측하는 연구가 활발하게 진행되고 있다. 기존의 많은 연구들은 특정한 시점의 RR 간격 데이터에서 추출한 특징변수 다변량 데이터에 기반하여 부정맥을 예측하였다. 본 연구에서는 심장 상태가 시간에 따라 변해가는 패턴도 부정맥 예측에 중요한 정보가 될 수 있다고 생각하여 일정한 시간 간격을 두고 특징변수의 다변량 벡터를 추출하여 쌓음으써 얻어지는 다변량 시계열 데이터로 부정맥을 예측하는 것의 유용성에 대해 살펴보았다. 1-Nearest Neighbor 방법과 그것을 앙상블(ensemble)한 learner를 중심으로 비교했을 경우 시계열의 특징을 고려한 적절한 시계열 거리함수를 선택하여 시계열 정보를 활용한 다변량 시계열 데이터 기반 방법의 분류 성능이 더 좋게 나오는 것을 확인하였다.
TAG 부정맥예측, 다변량 시계열, 최근접이웃방법, 시계열 간 거리함수, 심실빈맥, arrhythmia prediction, multivariate time series, 1-nearest neighbor, time series distance function, ventricular tachycardia
면대면 강의실 환경에서 전자교과서를 이용한 기초 통계학 수업
최숙희 ( Sookhee Choi ) , 한경수 ( Kyungsoo Han )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 683~692페이지(총10페이지)
최근에는 기술의 도움 없이 통계를 가르친다는 것은 상상조차 하기 어렵다. 기술의 발전은 기초 통계학을 가르치는 방식과 교과서의 형태를 바꾸고 있다. 거의 모든 학생들이 항상 모바일 기기를 가지고 다니기 때문에 통계학 교과서를 디지털 형태로 제공한다면 학습자는 언제 어디서든 배울 수 있을 것이다. 또한 스마트폰은 학생들이 강의에 더 집중할 수 있도록 수업시간에 질의응답에 사용될 수 있다. 본 논문은 면대면 강의실에서 전자교과서를 이용할 때 발생하는 데이터를 분석하고 향후 전자교과서의 연구 방향을 제안한다.
TAG 기초 통계학, 기술, 통계교육, 전자교과서, introductory statistics, technology, statistics education, e-textbook
절단된 분포를 이용한 인공신경망에서의 초기값 설정방법
김민종 ( Minjong Kim ) , 조성철 ( Sungchul Cho ) , 정혜린 ( Hyerin Jeong ) , 이영섭 ( Yungseop Lee ) , 임창원 ( Changwon Lim )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 693~702페이지(총10페이지)
딥러닝은 대용량의 데이터의 분류 및 예측하는 방법으로 각광받고 있다. 데이터의 양이 많아지면서 신경망의 구조는 더 깊어 지고 있다. 이때 초기값이 지나치게 클 경우 층이 깊어 질수록 활성화 함수의 기울기가 매우 작아지는 포화(Saturation)현상이 발생한다. 이러한 포화현상은 가중치의 학습능력을 저하시키는 현상을 발생시키기 때문에 초기값의 중요성이 커지고 있다. 이런 포화현상 문제를 해결하기 위해 Glorot과 Bengio (2010)과 He 등 (2015) 층과 층 사이에 데이터가 다양하게 흘러야 효율적인 신경망학습이 가능하고 주장했다. 데이터가 다양하게 흐르기 위해서는 각 층의 출력에 대한 분산과 입력에 대한 분산이 동일해야 한다고 제안했다. Glorot과 Bengio (2010)과 He 등(2015)는 각 층별 활성화 값의 분산이 같다고...
TAG 초기값, 포화, Xavier, 절단된 분포, 딥러닝, initialization, saturation, Xavier initialization, truncated distribution, deep learning
기온변화가 전력수요에 미치는 비선형적 영향: 부분선형모형을 이용한 추정과 예측
박지원 ( Jiwon Park ) , 서병선 ( Byeongseon Seo )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 703~720페이지(총18페이지)
최근 빈번하게 발생하는 이상기온과 기후변화로 인하여 전력수요의 변동성이 커지고 있으며 기온 영향의 증가와 함께 기온변화에 대한 전력수요의 반응은 비선형성과 비대칭성으로 나타나고 있다. 정부 에너지 정책의 변화와 4차 산업혁명의 전개에 따라 기온 효과를 보다 정확하게 추정하고 예측하는 것은 안정적 전력수급 관리를 위하여 중요한 과제이다. 본 연구는 기온변화에 대한 전력수요의 비선형적 반응에 대하여 부분선형모형을 이용하여 분석하고자 한다. 기온변화와 전력수요의 비선형·비대칭적 관계를 측정하기 위하여 Robinson의 double residual 준모수적 추정과 스플라인 추정을 적용하였다. 기상변수와 전력 소비에 대한 시간 단위 고주기 자료를 사용하여 부분선형모형으로 추정한 기온변화와 전력 소비의 관계는 기존 모수적 모형과는 다른 비선형성과 비대칭성을 갖고 있음을 ...
TAG 기온변화, 부분선형모형, 비대칭성, 비선형성, 전력수요 예측, electricity, nonlinear impact, partial linear model, temperature
비모수 방법을 사용한 영상 잡음 제거 알고리즘
우호영 ( Ho-young Woo ) , 김영화 ( Yeong-hwa Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 721~740페이지(총20페이지)
영상처리 분야에서 중요한 분야인 잡음 제거는 통계적인 접근이 필요하지만 잡음에 대한 특정한 분포를 가정하기 어려우며 지역적 특징을 반영하는 공간 필터는 소표본에 해당하므로 모수적인 방법으로 접근할 수 없다. 1차 영상 미분과 2차 영상 미분은 영상에 포함된 잡음 수준에 따라 확연한 차이를 보이며 캐니 에지 검출기를 사용하면 보다 명확히 알 수 있다. 잡음 수준을 통계적으로 확인하고자 Fligner-Killeen 검정을 진행하고 붓스트랩 방법을 사용하였으며 추정된 잡음의 수준을 베타분포의 누적분포함수를 이용하여 0과 1사이의 값을 갖도록 하였다. 본 연구에서는 영상에 포함된 잡음 수준을 고려하는 잡음 제거 알고리즘을 제시하고자 한다.
TAG 붓스트랩, 에지 검출기, 영상처리, 영상 미분, 잡음 제거, 캐니 에지 검출기, Fligner-Killeen 검정, bootstrap, edge detector, image processing, image differencing, noise reduction, Canny edge detector, Fligner-Killeen test
연속재평가방법에 가속화 단계를 적용한 MTD 추정법
권도희 ( Dohee Kwon ) , 김동재 ( Dongjae Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 741~752페이지(총12페이지)
제1상 임상시험의 주목적은 최대허용용량(maximum tolerated dose; MTD)을 결정하는 것이다. MTD 결정을 통해 다음 임상시험에 사용될 용량이 제한되므로 투약용량 발견 시험이라고도 불리며 매우 중요한 단계이다. MTD를 결정하는 방법에는 대표적으로 DM 방법, SM 방법, CRM 방법이 있다. 본 논문에서는 기존 수정된 CRM 방법에 초기가속화 단계를 적용하여 낮은 용량에 다수의 피험자가 할당되는 문제점을 보완하는 새로운 MTD 추정 방법을 제안하였고 기존 방법들과의 비교를 위해 모의실험을 실시하였다.
TAG 연속재평가방법, MTD 추정법, 제1상 임상시험, 최대허용용량, Phase 1 Clinical Trial, maximum tolerated dose, modified continual reassessment method
 1  2  3  4  5  6  7  8  9  10