분야    
발행기관
간행물  
발행연도  
발행기관 : 한국통계학회 AND 간행물명 : 응용통계연구1937 개 논문이 검색 되었습니다.
효율적인 통계 계산을 위한 파이썬 numba 라이브러리의 소개
조윤상 ( Younsang Cho ) , 유동현 ( Donghyeon Yu ) , 손원 ( Won Son ) , 박선철 ( Seoncheol Park )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 665~682페이지(총18페이지)
본 논문은 순수하게 파이썬 언어로 작성된 연산에 대하여 just-in-time (JIT) 컴파일을 적용하여 전체 계산 속도를 향상시킬 수 있는 numba 라이브러리에 대한 사용법과 응용에 대하여 소개한다. 실제 통계 계산 문제에 대한 numba 라이브러리의 적용에 대한 예제로 반복문 사용이 요구되는 통계 계산 문제들 중 순열 검정과 정규 혼합 분포의 모수 추정의 EM 알고리즘을 고려하였으며 순수한 파이썬 구문 및 반복문을 활용한 계산 시간과 numba를 활용한 계산 시간을 비교하여 numba 라이브러리 활용의 효율성을 수치적으로 제시하였다.
TAG statistical computing, python, numba, just-in-time compilation, 통계 계산, 파이썬, JIT 컴파일
mRMR과 수정된 입자군집화 방법을 이용한 다범주 분류를 위한 최적유전자집단 구성
이선호 ( Sunho Lee )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 683~696페이지(총14페이지)
표본의 다범주 표현형을 예측하는데 사용되는 최적의 유전자집단이란 적은 수의 유전자로 표현형을 정확히 예측할 수 있는 유전자들의 모임이다. 특이발현유전자를 검색하는 통계량은 이미 여러 가지가 있고, K-평균 군집화를 곁들여 중복성이 적은 특이발현유전자들을 선택 가능하다. 이들을 바탕으로 적은 수로 정확하게 다범주 분류가 가능한 유전자집단을 구성할 수 있도록 수정한 입자최적화 방법을 제안한다. 널리 알려진 ALL 248례와 SRBCT 83례를 이용하여 제안된 방법으로 최적유전자집단을 찾을 수 있음을 보였다.
TAG K-means clustering, multi-class classification, mRMR, optimal gene set, particle swarm optimization, 다범주 분류, 입자군집 최적화, K-평균 군집화
코로나-19에 따른 서울시 생활인구 변화와 동별 반응 차이 분석
진주혜 ( Juhae Jin ) , 성병찬 ( Byeongchan Seong )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 697~712페이지(총16페이지)
최근 20년간 세계적으로 새로운 전염병이 반복해서 등장해왔으며 코로나-19에 들어서는 일상에까지 큰 변화와 피해를 주고 있다. 이에 더해 앞으로도 새로운 전염병의 등장을 간과할 수 없게 되면서 경제 타격에 대응하기 위한 정책 발굴이 지속적으로 요구되고 있다. 이러한 상황에서 생활인구는 시민들의 생활 패턴 변화를 드러내는 중요한 지표이다. 본 논문에서는 코로나-19에 의한 일상의 변화를 유동인구 관점에서 감지 및 분류하여 시간적 및 사회환경적 특징을 분석한다. 시간 단위로 측정된 서울시 424개 행정동별 생활인구 데이터를 분류하기 위해 k-shape clustering을 사용하였고, 이후에는 각 군집에 개입분석, One-way ANOVA 등을 적용하여 코로나-19 진행 여파에 따른 군집별 특성 및 생활인구 변화 양상을 자세히 살펴보았다. 결론적으로 국내...
TAG Seoul living population, COVID-19, k-shape clustering, one-way ANOVA, time series, intervention analysis, 서울 생활인구, 코로나-19, k-Shape Clustering, One-way ANOVA, 시계열, 개입분석
분계점 비대칭과 멱변환 특징을 가진 비정상-변동성 모형
최선우 ( Sun Woo Choi ) , 황선영 ( Sun Young Hwang ) , 이성덕 ( Sung Duck Lee )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 713~722페이지(총10페이지)
본 논문에서는 금융시계열의 특징인 비대칭 변동성을 연구하고 있다. 멱변환을 동시에 고려한 멱변환-비대칭 GARCH 모형을 소개하고 있다. 변동성이 비정상인 모형을 다루고 있으며 오차항으로 표준정규분포와 더불어 표준화 t-분포도 고려하여 변동성 정상/비정상 조건을 제시하고 있다. 미국 주가 시계열인 다우지수 적용사례를 예시하였다.
TAG volatility-nonstationary, threshold-asymmetry, power transformation, 비정상 변동성, 비대칭 변동성, 멱변환
Adaptive lasso를 이용하여 추세-정상시계열과 차분-정상시계열을 판별하는 방법에 대한 연구
나옥경 ( Okyoung Na )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 723~738페이지(총16페이지)
본 논문에서는 추세-정상시계열과 차분-정상시계열을 판별하는 방법에 대해 연구한다. 두 시계열 모형은 시계열적 특징, 충격의 지속성 여부, 시계열을 정상화시키는 방법 등이 모두 다르므로, 어떤 모형을 선택하냐에 따라 분석 방법이나 해석에 차이가 발생한다. 따라서 시계열 자료를 분석할 때 추세-정상성과 차분-정상성을 판별하는 것은 매우 중요한 일이다. 두 시계열을 구분하는 중요한 기준은 단위근의 존재 여부이므로, 단위근 검정 결과를 활용할 수 있다. 최근 연구 결과들을 살펴보면, 다양한 시계열 모형을 적합시킬 때 뿐만 아니라 비정상 자기회귀모형의 차분 차수를 결정할 때도 adaptive lasso와 같은 벌점화 추정방법을 도입, 사용하고 있다. 본 논문에서도 adaptive lasso를 이용하여 추세-정상시계열과 차분-정상시계열을 판별하는 방법을 제안, 연구...
TAG trend stationary process, difference stationary process, unit root test, adaptive lasso, 추세-정상시계열, 차분-정상시계열, 단위근 검정, adaptive lasso 추정
서울 공공자전거 신규 대여소를 위한 수요량 예측 분석
김예술 ( Yesool Kim ) , 박시온 ( Sion Park ) , 박건웅 ( Gunwoong Park )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 739~751페이지(총13페이지)
서울시는 시민의 건강 증진과 이산화탄소 저감을 통한 저탄소 녹색성장 실현을 목표로 2015년부터 2020년 현재까지 공공자전거 대여소를 확장하고 있다. 매년 공공자전거에 대한 시민들의 접근성과 이용률이 증가하고 있으며, 이에 서울시는 수요와 접근성을 모두 고려한 공공자전거 대여소 신규 입지를 확장하고자 노력하고 있다. 공공자전거 대여소 위치는 주변 지형지물에 영향을 받으며, 수요량은 지역적 특성에 영향을 받으므로 이들을 고려한 신규 대여소 입지를 선정해야 할 필요성이 있다. 따라서 본 연구는 서울시 공공자전거의 새로운 입지 선정을 위하여 2019년 서울시 공공자전거 데이터와 지리정보체계, 대중교통, 인구 등의 데이터를 전처리하여 신규 대여소 거치가 가능한 장소를 선별하고, 랜덤 포레스트를 이용하여 신규 대여소의 이용량을 예측하였다. 이를 바탕으로 평균...
TAG new rental location, public bike, public transportation, random forest, usage estimation, 신규 대여소, 공공자전거, 대중교통, 랜덤 포레스트, 이용량 예측
통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석
김재오 ( Jaeoh Kim ) , 방성완 ( Sungwan Bang )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 753~762페이지(총10페이지)
본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 ...
TAG quantile regression, quantile regression tree, unified non-crossing multiple quantile regression tree, AI interview, 분위수 회귀모형, 분위수 회귀나무모형, 비교차 분위수 회귀나무모형, 인공지능 면접체계
다층모형을 활용한 양파 구중 추정 연구
김준기 ( Junki Kim ) , 최성천 ( Seung-cheon Choi ) , 김재휘 ( Jaehwi Kim ) , 서홍석 ( Hong-seok Seo )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 763~776페이지(총14페이지)
양파는 기상여건에 따른 작황의 변동성이 커 생산량 및 가격 변화가 크다. 정부는 양파를 수급 민감 품목으로 지정하여 다양한 수급 안정대책을 마련하고 시행하는데 이를 위해서는 선제적이고 신뢰도 높은 양파 생산량 예측 정보가 필수적이다. 본 연구에서는 양파의 5월 초 지상부 생육정보와 5월 초부터 수확기까지의 기상정보를 이용하여 최종 생구 무게에 미치는 영향을 추정함으로써 생산량 예측의 정확도 개선에 기여하고자 한다. 위계적 특성을 갖고 있는 자료를 통해 개체별 생육요인인 1-수준 자료와 필지별 기상요인인 2-수준 자료, 그리고 두 수준 간 상호작용을 고려한 다층모형을 도입하여 분석하였다. 분석 결과, 5월 초에 엽수, 엽초경, 초장의 생육이 좋을수록 최종 생구 무게는 증가하는 것으로 추정되었다. 5월 초부터 수확기까지의 기상요인에서는 강수량, 고온일수, 탄...
TAG multi-level model, onion bulb weight, interaction effect, above-ground growth factor, meteorological factor, 다층모형, 양파 생구무게, 상호작용, 지상부 생육요인, 기상요인
COVID-19 바이러스 잠복 시간 분포 추정과 치사율 추정을 위한 생존 분석의 적용
기한정 ( Han Jeong Ki ) , 김지은 ( Jieun Kim ) , 김소희 ( Sohee Kim ) , 박주원 ( Juwon Park ) , 이주행 ( Joohaeng Lee ) , 김양진 ( Yang-jin Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 777~789페이지(총13페이지)
COVID-19는 지난 2019년 12월부터 중국에서 발생하여 전세계적으로 확산된 대유행병이 되었다. 본 연구에서는 한국 질병 관리 본부에서 공개한 오픈 자료를 이용하였으며 시각화 기법을 통해 확진자의 남녀별 지역별 추세를 조사하였다. 또한 평균 바이러스 잠복기간을 추정하기 위해 감염원이 알려진 두 감염 그룹의 증상 발현 시점과 양성 확진 시점을 활용하였다. 하지만 양성 확진자 중 86%가 무증상으로 정확한 증상 발현시점을 알 수 없었다. 또한 주어진 자료에서는 감염시점도 알려져 있지 않아 감염시점과 증상 발현 시점차로 정의되는 잠복기간은 정확하게 측정하기가 어렵다. 이에 생존 분석의 한 기법인 구간 중도 절단을 적용하여 잠복기간의 분포를 추정하였다. 여러가지 모수 분포를 적용한 결과 최적의 분포하에서 평균 잠복 기간은 5.4일 (95% 신뢰구간...
TAG case fatality rate, cure rate, incubation time, interval censoring, pandemic, COVID19, 대유행병, 잠복기간, 구간 중도 절단, 경쟁 위험 모형, 치사율, 치유율
스마트그리드 환경하의 가정용 AMI 자료를 위한 시계열 군집분석 연구
이진영 ( Jin-young Lee ) , 김삼용 ( Sahm Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 791~804페이지(총14페이지)
스마트그리드 환경하에서 ICT 기술의 발달로 AMI 기기를 통해 가정의 실시간 전력사용량을 수집할 수 있게 됨에 따라 이러한 자료들을 활용하여 보다 더 정확한 가정용 전력사용량 예측을 할 수 있게 되었다. 본 논문에서는 1시간 단위 가정용 전력사용량 자료를 바탕으로 ARIMA, TBATS, NNAR 모형을 사용하여 전력수요를 예측하는 모형을 연구하였는데, 기존과 달리 가구 전체 사용량을 한 번에 예측하는 것이 아닌 유사한 전력사용패턴을 나타내는 가구들을 군집하여 군집별로 예측 모형을 수립하고 각 모형별 예측치를 합산하여 예상 전력사용량을 산출하였다. 특히 전력사용량 자료는 전형적인 시계얼 자료로서 군집분석 방법으로 시계열에 적절한 방법을 선택하였으며 본 논문에서는 동적타임워핑(dynamic time warping)과 Periodogr...
TAG smart grid, AMI data, household electric usage forecasting, time series clustering, 스마트 그리드, AMI 데이터, 주택용 전력사용량 예측, 시계열 군집분석
 1  2  3  4  5  6  7  8  9  10