분야    
발행기관
간행물  
발행연도  
발행기관 : 한국통계학회 AND 간행물명 : 응용통계연구1937 개 논문이 검색 되었습니다.
지렛대 붓스트랩을 이용한 이변량 구간 중도 절단 자료의 일치성 검정
김양진 ( Yang-jin Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 753~761페이지(총9페이지)
본 논문에서는 이변량 구간 중도 절단 자료의 연관성 검정을 연구하고자 한다. Kendall’s □ 통계량은 분포의 가정을 필요로 하지 않는 비모수방법으로 연관성 검정을 위해 빈번히 적용되고 있다. 본 논문에서도 이러한 □ 통계량을 이용한 검정을 하기 위해 붓스트랩 방법을 적용시킨다. 일반적인 비모수 붓스트랩 방법의 구간 중도 절단에 적용은 편의된 결과를 보여주었다. 이는 구간 중도 절단자료의 불완전성(incompleteness)과 관련된 것으로 이를 극복하기 위해 지렛대 붓스트랩 방법을 적용하였다. 추정된 분포에 근거하여 구간 중도 절단 대신 모의 완전한 표본(pseudo complete data)을 추룰하는 것이다. 본 논문에서는 재표본의 크기 m을 결정하기 위해 기존 연구자의 공식을 이용하였다. 시행된 모의 실험의 결과는 바람직한 제 1종 오류값...
TAG AIDS 연구, 이변량 구간 중도 절단, 연관성, Kendall’s □, 지렛대 붓스트랩, AIDS study, Association, Bivariate interval censored data, Leverage bootstrap
용어간 종속성을 이용한 문서 순위 매기기에 의한 확률적 정보 검색
유현조 ( Hyun-jo You ) , 이정진 ( Jung-jin Lee )  한국통계학회, 응용통계연구 [2019] 제32권 제5호, 763~782페이지(총20페이지)
텍스트 문서 집합에 대한 정보검색에서는 주어진 질의에 부합하는 각 문서의 적합도 확률을 계산하고 이 확률이 높은 것부터 낮은 순으로 문서 순위를 정하여 사용자에게 제공한다, 각 문서의 적합도 확률 계산에 많이 사용되는 모형은 단어들이 확률적으로 독립이라는 가정 하에 확률을 추정한다. 이 모형은 단어들의 결합 확률을 계산하는 것이 현실적으로 어렵다는 점에서 많이 이용되고 있지만 질의에 사용되는 단어들이 대개 서로 관련성을 가지고 있다는 사실을 고려하고 있지 않다. 본 논문에서는 단어 자질들의 의존 구조를 고려하여 문서의 적합도 확률을 계산하기 위하여 단어들의 결합 패턴의 확률을 다항분포 모형으로 가정하고, 최대 엔트로피 방법으로 확률을 추정하여 문서 순위를 매기는 정보검색 모형을 제안한다. 여러 가지 다항분포 상황에서 시뮬레이션 실험을 한 결과 변수들의 독립...
TAG 정보 검색, 문서 순위 매기기, 최대 엔트로피 원리, 반복 비율 적합, information retrieval, document ranking, maximum entropy principle, iterative proportional fitting algorithm
더블딥 출산율 요인 규명과 향후 추이
오진호 ( Jinho Oh )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 463~483페이지(총21페이지)
2000년 이후 우리나라 합계출산율은 일본, 독일, 프랑스처럼 출산율이 상승이나 감소기조에 들어서면 쉽게 변하지 않는 비가역적인 상수형태를 보이는 것과는 다른 양상을 보인다. 또한 2005년 1.08명 최저점에서 서서히 증가해 2015년 1.23명을 보이다가 2016년 1.17명, 2017년 1.05명, 2018년 0.98명으로 급락하고 있다. 이는 마치 경기침체의 더블딥(double dip)과 유사한 형태를 보인다. 본 연구는 이러한 TFR 증감 요인을 규명하기 위해 먼저 TFR에 영향력이 높은 출생아수 추이와 예측, TFR 분해법으로 분해되는 유배우율과 유배우출산율의 추이를 살펴본다. 그리고 이들 변화가 TFR 증감 변화에 어떤 영향력을 나타내는지 살펴보았다. 분석결과 출생아수는 2018년 약 32-33만 명, 2...
TAG total fertility rate, double dip, number of births, TFR decomposition method, proportion married, marital fertility rate, 합계출산율, 더블 딥, 출생아수, 합계출산율 분해법, 유배우율, 유배우출산율
이론통계학 교육에서 수학 소프트웨어의 활용
이긍희 ( Geung-hee Lee )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 485~502페이지(총18페이지)
이론통계학은 통계학의 원리를 수학을 이용하여 배우는 교과목이다. 학생들이 수학을 충분히 알지 못하는 경우 이론통계학 교육을 통해 통계학의 원리를 이해하는 데에는 제약이 있다. 이론통계학 교육을 통해 통계학의 원리에 대한 이해를 높이기 위해 수학적 문제풀이 외에 R 프로그램을 이용한 통계 시뮬레이션이 보조적으로 도입되어 왔지만 수학을 이용한 문제풀이를 대신하지는 못하고 있다. 이 논문에서는 wxMaxima, Wolfram Alpha 등 기호 수학 연산이 가능한 수학 소프트웨어 CAS를 소개하고, 이를 이용하여 이론통계학 교육에 걸림돌이 되는 수학의 어려움에서 벗어나 통계학의 원리 자체를 학습할 수 있는 방안을 모색하였다.
TAG mathematical statistics, statistical inference, CAS, Maxima, Wolfram Alpha, R, 수리통계학, 통계적 추론, wxMaxima
국회 법안 검토 기간의 생존함수 추정: 제 17, 18, 19대 국회의 사례를 바탕으로
윤영규 ( Yeonggyu Yun ) , 조윤수 ( Yunsoo Cho ) , 정혜영 ( Hye-young Jung )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 503~515페이지(총13페이지)
본 연구는 제 17, 18, 19대 국회에 제출된 법안의 검토 기간의 생존함수를 추정하고, 정치상황적 요인들이 법안 검토 기간에 미치는 영향을 분석했다. 본 연구는 입법 데이터에 존재하는 절단과 사건 종료의 종속성 문제를 완화하고자 새로운 관점에서 입법 과정 종료를 정의했다. 또한 비례위험 가정이 분석 대상 데이터에 대해 성립하지 않는다는 것을 보이고, 이에 따라 로그정규분포 가정 하의 가속종료시간모형을 통해 정치상황 상의 요인들이 법안 검토 기간에 미치는 영향을 분석했다. 분석 결과 정책 분야별로 법안 검토 기간이 상이하게 나타났고, 여소야대 시기에 발의된 법안이 그렇지 않은 시기에 발의된 법안보다 신속하게 검토된 것으로 나타났다.
TAG accelerated failure time model, interval censored data, legislative process, 가속종료시간모형, 구간 절단 자료, 입법과정
일관성 함수적 자료모형을 활용한 국제인구이동의 확률적 예측
김순영 ( Soon-young Kim ) , 오진호 ( Jinho Oh )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 517~541페이지(총25페이지)
OECD (2015)과 UN (2017)에 따르면 한국은 입국의 나라로 분류되고 있다. 입국의 나라는 순이동(net migration)이 양으로 유지된다는 것을 뜻하며, 동시에 국제이동이 인구증가에 영향을 미칠 가능성이 높음을 의미한다. 통계청 (2011)은 이전 추계와는 달리 인구이동요인을 고려한 Wilson (2010)모형을 기반으로 성별 및 입_출국을 구분하여 모수가 15개 이상인 모형을 이용하였다. 그리고 5년 뒤 2016년 추계에서는 최근 5년간의 내국인 순이동률 평균치와 외국인 정부정책을 반영한 값을 가정하였다. 하지만 이 두 결과 모두 국제이동이 보수적으로 추정되어 입국의 나라로 추정하는 OECD, UN의 분류와는 다른 결과를 제공한다. 따라서 본 연구는 입국, 출국 그리고 순이동의 국제이동추이가 선...
TAG net migration, international migration, stochastic projection, non-parametric model, immigration rate, emigration rate, 순이동, 국제이동, 확률론적 추계, 비모수모형, 입국률, 출국룰
비선형 모델을 이용한 결측 대체 방법 비교
김혜인 ( Hyein Kim ) , 송주원 ( Juwon Song )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 543~559페이지(총17페이지)
자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 ...
TAG missing data, imputation, nonlinear model, 결측자료, 대체, 비선형모형
SMUCE와 FDR segmentation 방법에 의한 다중변화점 추정법 비교
김재희 ( Jaehee Kim )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 561~572페이지(총12페이지)
본 연구는 다층적 다중변화점 추정법으로 FDRSeg 기법과 SMUCE 기법의 이론적 특성을 파악하고 모의실험을 통해 경험적 특성을 비교하고자한다. FDRSeg (False discovery rate segmentation)기법은 FDR 기반 조절을 하여 변화점을 추정하고 SMUCE (simultaneous multiscale change-point estimator) 기법은 국소우도함수 기반 다중 검정으로 변화점을 추정한다. 변화점의 개수가 작을경우에는 두 기법에 의한 추정능력이 비슷하다. 변화점 개수가 많을수록 FDRSeg 의 추정이 변화점 개수와 추정측도 면에서 더 좋은 편이다. 실제 데이터 분석으로 검층 주상도 데이터에 대해 각 기법으로 다중변화점 추정을 하고 비교한다...
TAG false discovery rate (FDR), FDRSeg, local likelihood ratio test, multiscale, multiple change-points, SMUCE, 위발견율, 국소우도함수, 다층적, 다중변화점
컨볼루션 뉴럴 네트워크를 이용한 한글 서체 특징 연구
황인경 ( In-kyeong Hwang ) , 원중호 ( Joong-ho Won )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 573~591페이지(총19페이지)
로마자 서체에 대한 수치적 분류체계는 잘 발달되어 있지만, 한글 서체 분류를 위한 기준은 수치적으로 잘 정의되어 있지 않다. 본 연구의 목표는 한글 서체 분류를 위한 수치적 기준을 세우기 위해, 서체 스타일을 구분하는 중요한 특징들을 찾는 것이다. 컨볼루션 뉴럴 네트워크(convolutional neural network)를 사용하여 명조와 고딕 스타일을 구분하는 모형을 세우고, 학습된 필터를 분석해 두 스타일의 특징을 결정하는 피처(feature)를 찾고자 한다.
TAG convolutional neural networks, local feature, fontstyle, hangul, visualization, 컨볼루션 뉴럴 네트워크, 국소적 특징, 한글, 서체 스타일, 시각화
절단함수를 이용한 AUC와 VUS
홍종선 ( Chong Sun Hong ) , 홍성혁 ( Seong Hyuk Hong )  한국통계학회, 응용통계연구 [2019] 제32권 제4호, 593~605페이지(총13페이지)
ROC 곡선 아래 면적과 ROC 곡면 아래 부피를 이용하여 분류모형의 판별력을 측정하는 통계량인 AUC와 VUS에 관한 많은 연구가 있다. ROC 곡선을 구성하는 FPR과 TPR 모두에 제한을 두는 양방향 부분 AUC는 부분 AUC보다 더 효과적이고 정확하게 제안되었다. ROC 곡면에서도 부분 VUS 뿐만 아니라 세 방향 부분 VUS 통계량이 개발되었다. 본 연구에서는 ROC 곡선의 FPR과 TPR 모두에 제한된 두 개의 절단함수를 이용하여 확률 개념과 적분 표현으로 대안적인 AUC를 제안한다. 또한 이 AUC는 양방향 부분 AUC와 관계가 있음을 알 수 있다. ROC 곡면에서의 세 방향 부분 VUS도 절단함수를 이용하는 VUS와 관련되어 있음을 발견하였다. 그리고 이러한 대안적인 AUC와 VUS는 맨-휘트니 통계량으로 ...
TAG classification, discrimination, FPR, TPR, truncation, 분류, 절단, 판별
 11  12  13  14  15  16  17  18  19  20