K-평균 클러스터링은 매우 널리 사용되고 있으나 유사도가 구면체 또는 타원체로 정의되어 각 클러스터가 볼록 집합 형태인 자료에는 좋은 결과를 주지만 그렇지 않은 경우에는 매우 형편 없는 결과를 나타낸다. 스펙트럴 클러스터링은 K-평균 클러스터링의 단점을 잘 보완해 줄 뿐아니라 여러 형태의 자료나 고차원 자료 등에 대해서도 좋은 결과를 나타내서 최근 인공 신경망 모형에 많이 이용되고 있다. 하지만, 개선되어야 할 단점도 여전히 많다. 본 논문에서는 스펙트럴 클러스터링에 대해 알기 쉽게 소개하고, 클러스터 갯수의 추정, 척도모수의 추정, 고차원 자료의 차원축소 등 스펙트럴 클러스터링에 대한 최근의 연구 동향을 소개한다.
하나의 개체에서 여러가지 측정치가 동시에 관찰되는 경우는 다양한 연구 분야에서 흔히 나타난다. 발달 독성학 연구에서는 특정 독성 물질의 각기 다른 수준에 노출된 임신한 어미 쥐에 대해 기형인 태아의 존재와 태아의 무게가 동시에 측정된다. 이런 두 변수를 결합하여 모형화하는 것은 각기 독립적인 두 모형으로 분석하는 것보다 더 효율적인 결과를 낸다고 알려져 있다. 대부분의 결합 모형은 정규분포를 랜덤효과로 가정하여 분석한다. 그러나 발달 독성학연구에서처럼 반응변수들의 분포가 독성 물질이 변함에 따라 불규칙하게 변하는 경우 정규분포의 가정으로는 그 특징을 잡아낼 수 없게 된다. 본 논문에서는 이진수 자료와 연속형 자료에 대해 비대칭 로짓 모형을 사용한 베이지안 결합모형을 제시한다. 본 모형은 비대칭 로짓 모형을 사용함으로써 반응변수의 분포의 형태가 독성 물질...
‘투약용량 발견 시험(Dose Finding Study)’라고도 불리는 제 1상 임상시험은 동물 실험 혹은 시험관 실험을 통하여 개발된 신약물질을 사람에게 실시하는 첫 단계이다. 제1상 임상시험의 가장 주요한 목적은 환자에게 허용할 수 있고 최대의 효능을 가진 복용량을 결정하는 것이다. 본 논문에서는 이를 고려하여 최대허용용량(MTD)를 결정할 수 있는 적절한 추정방법을 제안하였다. 이 방법은 Biased coin design과 멈춤규칙을 이용하여 MTD를 추정한다. 제안하는 방법은 모의실험을 통해 기존의 방법들과 비교하였다.
본 논문은 시계열 일반화 선형 모형의 하나인 계수형 시계열 모형에서 중요한 역할을 하는 과거 관측값과 조건부 평균값의 차수를 자동으로 결정하는 알고리즘을 연구한다. 본 알고리즘은 ARIMA 모형의 차수를 기반으로 시계열 일반화 선형 모형의 차수 후보군을 만들고, 차수 후보군의 조합을 이용하여 정보량 기준으로 최종 모형으로 선택한다. 제안된 알고리즘을 평가하기 위하여, 내재적 모형 및 내재적 시계열의 종류에 따른 시뮬레이션 및 실증 분석을 수행하고 예측력을 ARIMA 모형과 비교한다. 예측 성능 평가 결과, 계수형 시계열 분석에서 ARIMA 모형에 비해 시계열 일반화 선형 모형의 예측 성능이 우수함을 확인할 수 있다. 또한 실증분석으로서, 살인사건 발생 건수의 예측결과 ARIMA 모형보다 중기 및 장기 예측에서 우수한 성능을 나타내는 것을 확인할 수 있다...
¯X-S2 관리도는 공정 평균과 산포의 변화를 동시에 탐지하는 전통적인 관리도들 중 하나이다. 일반적으로 사용하는 ¯X -S2 관리도의 설계 방법은 병행하는 관리도의 오경보율은 주어진 값을 만족하면서 각 관리도는 동일한 개별적인 오경보율을 갖도록 설정하는 것이다. 이 논문에서는 각 관리도의 개별 오경보율을 다르게 설정하고 이것이 ¯X-S2 관리도의 성능에 어떠한 영향을 주는지 살펴보았다. 이를 위해 ¯X 관리도의 오경보율을 S2 관리도의 오경보율에 배한 경우를 고려하였고, 값에 따른 ¯X-S2 관리도 성능을 비교하였다. 관리도의 성능을 평가하는 측도로는 특정한 변화에 대한 성능을 판단하는 경우 이상상태에서의 평균런길이를 사용하였고, 전...
미국 메이저리그 야구 경기는 야구공을 추적하는 3대의 고속 카메라를 통해 모든 투구에 대한 궤적 데이터 PITCHf/x를 수집하고 공개한다. 선행 연구에서는 PITCHf/x 데이터를 통해 각 투구의 기대 피루타수를 계산하고 이를 토대로 투구의 질을 평가했다. 다만 기대 피루타수는 경기 득점으로 매번 이어지지 않기 때문에 각 투구가 승리에 기여하는 영향을 직접적으로 평가하지 못한다. 이 논문에서는 득점 기댓값과 득점 가치의 개념을 조합해 투구에 대한 기대 득점 가치를 계산하고 이를 통해 투구의 질을 랜덤 포레스트 모형으로 평가한 뒤, 기대 피루타수를 이용한 투구의 질 평가와 비교 분석한다.