학술논문 > 자연과학 > 통계학
콘텐츠 속성에 따른 계층적 그룹화 추천시스템: ‘The Movie Dataset’ 분석사례연구
김윤경 ( Yoon Kyoung Kim ) , 여인권 ( In-kwon Yeo )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 833~842페이지(총10페이지)
넷플릭스, 아마존, 유튜브 등 대형 플랫폼에서는 고객의 다양한 정보를 활용하여 정밀한 추천시스템을 마련하고 여기서 추천된 상당수의 아이템이 실제 구매로 이어지고 있다. 본 논문에서는 추천 컨텐츠의 속성에 따라 사용자의 선호도에 차이가 있을 것이라고 예상하고 콘텐츠의 속성에 따라 군집분석을 실시하였다. 속성의 형태와 관계없이 사용할 수 있도록 Gower 거리를 사용했다. 본 논문에서는 영화 평점 사이트인 ‘The Movie Dataset’의 자료를 이용하여 영화의 기본정보인 장르, 감독 및 배우 변수를 바탕으로 사용자를 계층적으로 분류하고 영화를 추천하였다. 본 논문에서 제안한 추천 시스템을 평가하기 위하여 각 사용자 그룹별로 훈련자료와 검증자료로 나누어 정밀도를 살펴보았다. 그 결과 UBCF보다 월등히 높은 정밀도를 갖는 것으로 나타났다.
TAG clustering, Gower, s distance, precision, Gower 거리, 군집분석, 장밀도
안경 착용 여부에 따른 음악 통증완화효과의 탐색적 연구
최수빈 ( Suvin Choi ) , 박상규 ( Sang-gue Park )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 823~832페이지(총10페이지)
음악청취가 통증완화효과에 어떤 영향을 미치는지를 확인하기 위해 음악청취조건, 뉴스청취조건 그리고 대조조건을 활용한 3x3 교차시험과 통증유발시험을 수행하였다. 총 50명의 피험자를 세 순서집단으로 랜덤하게 나눈 후 세 가지 청취조건 하에서 각각 통증유발시험을 수행한 후 통증한계, 통증강도, 통증불쾌감 등을 측정하고 분석하였다. 최근 시력과 지적능력간의 상관관계가 존재한다는 연구가 발표되면서 안경착용 여부에 따른 음악중재효과를 분석해보는 것도 의미가 있다고 생각하여, 안경착용여부에 따른 집단을 분류한 후 음악청취의 통증완화효과를 F-검정과 Tukey의 다중비교방법으로 분석하였다. 통증유발시험 분석 결과 안경착용집단의 통증완화효과가 음악청취조건에서 뉴스청취조건이나 대조조건보다 통계적으로 유의하게 나타남을 확인할 수 있었다. 이 연구가 탐색적 연구로서의 한계...
TAG biopsychosocial model, cold-pressor task, music intervention effect, myopia, pain responses, 생물심리사회모형, 통증유발시험, 음악중재효과, 근시 유전자, 통증반응
선형모형과 표준편차에 기반한 잡음영상에 효과적인 에지 검출 방법
박영호 ( Youngho Park )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 813~821페이지(총9페이지)
최근 다양한 분야에서 사진, 동영상 등과 같이 비정형 데이터를 이용한 연구가 활발하게 진행되고 있다. 이 중에서도 영상을 활용하는 연구들은 영상에 포함된 정보를 사용하기 위하여 많은 영상처리 기법들을 사용하고 있다. 에지 검출은 영상에서 정보를 추출하기 위해 많은 영상처리 응용 프로그램에서 사용되는 기본 도구이다. 그러나 잡음이 포함된 영상은 에지와 잡음이 모두 고주파 성분을 가지고 있기 때문에 에지 검출을 수행하는 것은 매우 어렵다. 본 논문은 잡음이 감소된 에지를 추출하는 방법으로 선형모형과 표준편차를 이용하였다. 화소 블록에 포함된 화소들의 표준편차와 선형모형의 적합으로 얻어진 잔차에 대한 표준편차의 차이로 에지를 검출하였다. 에지 검출의 결과는 영상처리 분야에서 대표적으로 사용되는 소벨 에지 검출기의 결과와 비교하였다. 잡음이 포함되지 않은 영상은 ...
TAG edge detector, linear model, standard deviation, noise reduction, statistical image processing, 에지 검출, 선형모형, 표준편차, 잡음감소, 통계적 영상처리
FPCA를 통한 고빈도 시계열 변동성 분석: R함수 소개와 응용
윤재은 ( Jae Eun Yoon ) , 김종민 ( Jong-min Kim ) , 황선영 ( Sun Young Hwang )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 805~812페이지(총8페이지)
본 논문은 최근 금융시계열 분야에서 자주 등장하는 고빈도 시계열 변동성 분석을 다루고 있다. 고빈도 시계열 변동성 분석을 위해 차원 축소를 목적으로 하는 함수형 주성분분석을 적용하였으며 이를 수행하는 R의 두 함수를 비교하고 있다. 응용으로서, KOSPI 고빈도 자료에 적용해 보았다.
TAG functional PCA, high-frequency time series, R-functions, 함수형 주성분분석, 고빈도 시계열, R-함수
스마트그리드 환경하의 가정용 AMI 자료를 위한 시계열 군집분석 연구
이진영 ( Jin-young Lee ) , 김삼용 ( Sahm Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 791~804페이지(총14페이지)
스마트그리드 환경하에서 ICT 기술의 발달로 AMI 기기를 통해 가정의 실시간 전력사용량을 수집할 수 있게 됨에 따라 이러한 자료들을 활용하여 보다 더 정확한 가정용 전력사용량 예측을 할 수 있게 되었다. 본 논문에서는 1시간 단위 가정용 전력사용량 자료를 바탕으로 ARIMA, TBATS, NNAR 모형을 사용하여 전력수요를 예측하는 모형을 연구하였는데, 기존과 달리 가구 전체 사용량을 한 번에 예측하는 것이 아닌 유사한 전력사용패턴을 나타내는 가구들을 군집하여 군집별로 예측 모형을 수립하고 각 모형별 예측치를 합산하여 예상 전력사용량을 산출하였다. 특히 전력사용량 자료는 전형적인 시계얼 자료로서 군집분석 방법으로 시계열에 적절한 방법을 선택하였으며 본 논문에서는 동적타임워핑(dynamic time warping)과 Periodogr...
TAG smart grid, AMI data, household electric usage forecasting, time series clustering, 스마트 그리드, AMI 데이터, 주택용 전력사용량 예측, 시계열 군집분석
COVID-19 바이러스 잠복 시간 분포 추정과 치사율 추정을 위한 생존 분석의 적용
기한정 ( Han Jeong Ki ) , 김지은 ( Jieun Kim ) , 김소희 ( Sohee Kim ) , 박주원 ( Juwon Park ) , 이주행 ( Joohaeng Lee ) , 김양진 ( Yang-jin Kim )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 777~789페이지(총13페이지)
COVID-19는 지난 2019년 12월부터 중국에서 발생하여 전세계적으로 확산된 대유행병이 되었다. 본 연구에서는 한국 질병 관리 본부에서 공개한 오픈 자료를 이용하였으며 시각화 기법을 통해 확진자의 남녀별 지역별 추세를 조사하였다. 또한 평균 바이러스 잠복기간을 추정하기 위해 감염원이 알려진 두 감염 그룹의 증상 발현 시점과 양성 확진 시점을 활용하였다. 하지만 양성 확진자 중 86%가 무증상으로 정확한 증상 발현시점을 알 수 없었다. 또한 주어진 자료에서는 감염시점도 알려져 있지 않아 감염시점과 증상 발현 시점차로 정의되는 잠복기간은 정확하게 측정하기가 어렵다. 이에 생존 분석의 한 기법인 구간 중도 절단을 적용하여 잠복기간의 분포를 추정하였다. 여러가지 모수 분포를 적용한 결과 최적의 분포하에서 평균 잠복 기간은 5.4일 (95% 신뢰구간...
TAG case fatality rate, cure rate, incubation time, interval censoring, pandemic, COVID19, 대유행병, 잠복기간, 구간 중도 절단, 경쟁 위험 모형, 치사율, 치유율
다층모형을 활용한 양파 구중 추정 연구
김준기 ( Junki Kim ) , 최성천 ( Seung-cheon Choi ) , 김재휘 ( Jeahwi Kim ) , 서홍석 ( Hong-seok Seo )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 763~776페이지(총14페이지)
양파는 기상여건에 따른 작황의 변동성이 커 생산량 및 가격 변화가 크다. 정부는 양파를 수급 민감 품목으로 지정하여 다양한 수급 안정대책을 마련하고 시행하는데 이를 위해서는 선제적이고 신뢰도 높은 양파 생산량 예측 정보가 필수적이다. 본 연구에서는 양파의 5월 초 지상부 생육정보와 5월 초부터 수확기까지의 기상정보를 이용하여 최종 생구 무게에 미치는 영향을 추정함으로써 생산량 예측의 정확도 개선에 기여하고자 한다. 위계적 특성을 갖고 있는 자료를 통해 개체별 생육요인인 1-수준 자료와 필지별 기상요인인 2-수준 자료, 그리고 두 수준 간 상호작용을 고려한 다층모형을 도입하여 분석하였다. 분석 결과, 5월 초에 엽수, 엽초경, 초장의 생육이 좋을수록 최종 생구 무게는 증가하는 것으로 추정되었다. 5월 초부터 수확기까지의 기상요인에서는 강수량, 고온일수, 탄...
TAG multi-level model, onion bulb weight, interaction effect, above-ground growth factor, meteorological factor, 다층모형, 양파 생구무게, 상호작용, 지상부 생육요인, 기상요인
통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석
김재오 ( Jaeoh Kim ) , 방성완 ( Sungwan Bang )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 753~762페이지(총10페이지)
본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 ...
TAG quantile regression, quantile regression tree, unified non-crossing multiple quantile regression tree, AI interview, 분위수 회귀모형, 분위수 회귀나무모형, 비교차 분위수 회귀나무모형, 인공지능 면접체계
서울 공공자전거 신규 대여소를 위한 수요량 예측 분석
김예술 ( Yesool Kim ) , 박시온 ( Sion Park ) , 박건웅 ( Gunwoong Park )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 739~751페이지(총13페이지)
서울시는 시민의 건강 증진과 이산화탄소 저감을 통한 저탄소 녹색성장 실현을 목표로 2015년부터 2020년 현재까지 공공자전거 대여소를 확장하고 있다. 매년 공공자전거에 대한 시민들의 접근성과 이용률이 증가하고 있으며, 이에 서울시는 수요와 접근성을 모두 고려한 공공자전거 대여소 신규 입지를 확장하고자 노력하고 있다. 공공자전거 대여소 위치는 주변 지형지물에 영향을 받으며, 수요량은 지역적 특성에 영향을 받으므로 이들을 고려한 신규 대여소 입지를 선정해야 할 필요성이 있다. 따라서 본 연구는 서울시 공공자전거의 새로운 입지 선정을 위하여 2019년 서울시 공공자전거 데이터와 지리정보체계, 대중교통, 인구 등의 데이터를 전처리하여 신규 대여소 거치가 가능한 장소를 선별하고, 랜덤 포레스트를 이용하여 신규 대여소의 이용량을 예측하였다. 이를 바탕으로 평균...
TAG new rental location, public bike, public transportation, random forest, usage estimation, 신규 대여소, 공공자전거, 대중교통, 랜덤 포레스트, 이용량 예측
Adaptive lasso를 이용하여 추세-정상시계열과 차분-정상시계열을 판별하는 방법에 대한 연구
나옥경 ( Okyoung Na )  한국통계학회, 응용통계연구 [2020] 제33권 제6호, 723~738페이지(총16페이지)
본 논문에서는 추세-정상시계열과 차분-정상시계열을 판별하는 방법에 대해 연구한다. 두 시계열 모형은 시계열적 특징, 충격의 지속성 여부, 시계열을 정상화시키는 방법 등이 모두 다르므로, 어떤 모형을 선택하냐에 따라 분석 방법이나 해석에 차이가 발생한다. 따라서 시계열 자료를 분석할 때 추세-정상성과 차분-정상성을 판별하는 것은 매우 중요한 일이다. 두 시계열을 구분하는 중요한 기준은 단위근의 존재 여부이므로, 단위근 검정 결과를 활용할 수 있다. 최근 연구 결과들을 살펴보면, 다양한 시계열 모형을 적합시킬 때 뿐만 아니라 비정상 자기회귀모형의 차분 차수를 결정할 때도 adaptive lasso와 같은 벌점화 추정방법을 도입, 사용하고 있다. 본 논문에서도 adaptive lasso를 이용하여 추세-정상시계열과 차분-정상시계열을 판별하는 방법을 제안, 연구...
TAG trend stationary process, difference stationary process, unit root test, adaptive lasso, 추세-정상시계열, 차분-정상시계열, 단위근 검정, adaptive lasso 추정
  1  2  3  4  5  6  7  8  9  10  
사업자등록번호 220-87-87785 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.070-8809-9397
개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1765호 이메일 help@reportshop.co.kr
copyright (c) 2009 happynlife. steel All reserved.