고차원의 데이터를 처리하기 위해서는 데이터의 성질을 유지하면서 특징을 잘 반영할 수 있는 특징 추출 방법이 필요하다. 주성분분석 방법은 고차원 데이터에 포함된 정보를 저차원의 데이터로 변환하여 원래 데이터의 변수 수보다 적은 수의 변수로 고차원 데이터를 표현 할 수 있는 방법으로서 데이터의 특징 추출을 위한 대표적인 방법이다. 본 연구에서는 데이터가 고차원인 경우 데이터 특징 추출을 위한 주성분 분석에 있어서 주성분변수 선정 시 적응적 상관도를 기반으로 한 주성분 분석 방법을 제안한다. 제안하는 방법은 입력 데이터간의 상관 관계를 기반으로 상관도를 적응적으로 반영하여 데이터의 주성분을 분석함으로써 다른 여러 변수에 중복적으로 상관도가 높은 변수와 주성분을 유도하는데 연관성이 적은 변수를 주성분 변수 후보 대상에서 제외시키고자 한다. 고유벡터 계수 값에 의...
김인경 ( Inkyung Kim ) , 김대희 ( Daehee Kim ) , 노송 ( Song Noh ) , 이재구 ( Jaekoo Lee )한국정보처리학회, 정보처리학회논문지. 소프트웨어 및 데이터 공학[2021] 제10권 제3호, 85~90페이지(총6페이지)
본 논문에서는 고령자를 위한 개별 웨어러블(Wearable) 기기를 이용한 낙상 감지에 대해 논한다. 신뢰할 수 있는 낙상 감지를 위한 저비용 웨어러블 기기를 설계하기 위해서 대표적인 두 가지 모델을 종합적으로 분석하여 제시한다. 기계 학습 모델인 의사결정 나무(Decision Tree), 랜덤포래스트(Random Forest), SVM(Support Vector Machine)과 심층 학습 모델인 일차원(One-Dimensional) 합성곱 신경망(Convolutional Neural Network)을 사용하여 낙상 감지 학습 능력을 정량화하였다. 또한 입력 데이터에 적용하기 위한 데이터 분할, 전처리, 특징 추출 방법 등을 고려하여 검토된 모델의 유효성을 평가한다. 실험 결과는 전반적인 성능 향상을 보여주며 심층학...
박대경 ( Park Daekyeong ) , 류경준 ( Ryu Kyungjoon ) , 신동일 ( Shin Dongil ) , 신동규 ( Shin Dongkyoo ) , 박정찬 ( Park Jeongchan ) , 김진국 ( Kim Jingoog )한국정보처리학회, 정보처리학회논문지. 소프트웨어 및 데이터 공학[2021] 제10권 제3호, 91~98페이지(총8페이지)
오늘날 정보통신 기술이 급격하게 발달하면서 IT 인프라에서 보안의 중요성이 높아졌고 동시에 지능형 지속 공격(Advanced Persistent Threat)처럼 고도화되고 다양한 형태의 사이버 공격이 증가하고 있다. 점점 더 고도화되는 사이버 공격을 조기에 방어하거나 예측하는 것은 매우 중요한 사안으로, NIDS(Network-based Intrusion Detection System) 관련 데이터 분석만으로는 빠르게 변형하는 사이버 공격을 방어하지 못하는 경우가 많이 보고되고 있다. 따라서 현재는 HIDS(Host-based Intrusion Detection System) 데이터 분석을 통해서 위와 같은 사이버 공격을 방어하는데 침입 탐지 시스템에서 생성된 데이터를 이용하고 있다. 본 논문에서는 기존에 사용되었던 ...
차량 내부에는 조명 변화, 부분적인 가림 및 운전자의 상태 변화와 같은 제한되지 않은 조건들이 존재한다. 본 논문에서는 비 제약적인 차량환경에서의 운전자 얼굴 인증 시스템을 제안한다. 제안한 방법은 차량 내부 및 외부의 조명 변화에 따라 발생하는 얼굴 이미지의 변화를 최소화하기 위해서 근적외선(NIR) 카메라를 사용한다. 특히 정면에서의 강한 빛에 노출된 얼굴 이미지를 처리하기 위해서, 학습 이미지의 평균과 분산을 사용하여 정상적인 얼굴 이미지로부터 빛에 과다하게 노출된 이미지로 변환하여 사용한다. 따라서 정상적인 조명에서의 얼굴 분류기와 강한 정면광에서의 얼굴 분류기를 각각 동시에 만들어진다. 제안하는 얼굴 분류기는 얼굴 랜드마크를 추출하고 각 랜드마크의 신뢰도 점수를 합산하여 얼굴을 최종적으로 식별한다. 특히 각 랜드마크를 인식하여 부분적인 얼굴 ...
이초연 ( Lee Cho Youn ) , 박지수 ( Ji Su Park ) , 손진곤 ( Jin Gon Shon )한국정보처리학회, 정보처리학회논문지. 소프트웨어 및 데이터 공학[2021] 제10권 제3호, 109~114페이지(총6페이지)
GAN(Generative Adversarial Network, 생성적 적대 신경망)은 이미지 생성모델로서 생성기 네트워크와 판별기 네트워크로 구성되며 실제 같은 이미지를 생성한다. GAN에 의해 생성된 이미지는 실제 이미지와 유사해야 하므로 생성된 이미지와 실제 이미지의 손실 오차를 최소화하는 손실함수(loss function)를 사용한다. 그러나 GAN의 손실함수는 이미지를 생성하는 학습을 불안정하게 만들어 이미지의 품질을 떨어뜨린다는 문제점이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 GAN 관련 연구를 분석하고 에지 검출(edge detection)을 이용한 eGAN(edge GAN)을 제안한다. 실험 결과 eGAN 모델이 기존의 GAN 모델보다 성능이 개선되었다.
군집주행은 여러 대의 자율 주행 차량이 통신을 사용하여 서로 정보를 교환하며 하나의 군집을 이루어 주행하는 것이다. 이러한 군집주행 기술은 더 좁은 차량 간 간격을 유지하며 주행함으로써 도로의 통행량 증대, 에너지 소비 및 오염물질 배출 감소 등의 다양한 장점을 가진다. 그러나 군집주행의 좁은 차량 간 간격은 긴급한 사고 발생 시 대처를 더 어렵게 만들며, 이에 따라 필수적으로 확보되어야 할 군집주행의 안전성을 보장하는데 어려움을 주고 있다. 특히 주행 중 나타날 수 있는 가변성은 군집주행의 안전에 악영향을 미칠 수 있다. 이러한 가변성은 발생 예측이 어렵고, 재현이 어려운 특성으로 인해 가변성으로부터 발생하는 위험 요소를 방지하는 안전대책 마련에 어려움이 있다. 본 논문에서는 군집주행 중에 생겨날 수 있는 가변성에 따른 위험을 회피하기 위한 시뮬레이션...
자율주행차 시대가 도래하면서 ECU (Electronic Control Unit)는 점차 고도화되고 있고, 이에 따라 차량에서 정확한 데이터를 추출하고 분석하려는 연구가 다양하게 시도되어 왔다. 그러나 ECU는 차량 제조사별로 상이한 프로토콜을 가지고 있어 상용 단말기로는 정확한 데이터 추출과 분석이 어렵다. 본 연구에서는 정확한 차량 데이터를 추출하기 위하여 전용 펌웨어를 개발하여 차량의 2019년 1월부터 2월의 실제 주행데이터 53,580건의 데이터를 추출하였으며, 20회가 넘는 실제 도로 주행을 통해서 데이터의 정확도를 검증하였다. 이러한 데이터를 바탕으로 실시간 연료 소비량 예측 모델의 정확도를 높이기 위하여 스태킹 앙상블 기법을 이용하였다. 본 연구에서는 베이스 모델로 Ridge, Lasso, XGBoost, LightGB...
민병준 ( Byeongjun Min ) , 유지훈 ( Jihun Ryu ) , 신동규 ( Dongkyoo Shin ) , 신동일 ( Dongil Shin )한국정보처리학회, 정보처리학회논문지. 소프트웨어 및 데이터 공학[2021] 제10권 제2호, 65~72페이지(총8페이지)
최근 네트워크 환경에 대한 공격이 급속도로 고도화 및 지능화 되고 있기에, 기존의 시그니처 기반 침입탐지 시스템은 한계점이 명확해지고 있다. 이러한 문제를 해결하기 위해서 기계학습 기반의 침입 탐지 시스템에 대한 연구가 활발히 진행되고 있다. 하지만 기계학습을 침입 탐지에 이용하기 위해서는 두 가지 문제에 직면한다. 첫 번째는 실시간 탐지를 위한 학습과 연관된 중요 특징들을 선별하는 문제이며, 두 번째는 학습에 사용되는 데이터의 불균형 문제로, 기계학습 알고리즘들은 데이터에 의존적이기에 이러한 문제는 치명적이다. 본 논문에서는 위 제시된 문제들을 해결하기 위해서 Hybrid Feature Selection과 Data Balancing을 통한 심층 신경망 기반의 네트워크 침입 탐지 모델인 HFS-DNN을 제안한다. NSL-KDD 데이터 셋을 통해 학습을 ...
고홍희 ( Debbie Honghee Ko ) , 이현수 ( Hyunsoo Lee ) , 석정재 ( Jungjae Suk ) , ( Ammar Ul Hassan ) , 최재영 ( Jaeyoung Choi )한국정보처리학회, 정보처리학회논문지. 소프트웨어 및 데이터 공학[2021] 제10권 제2호, 73~78페이지(총6페이지)
최근 딥러닝에 대한 관심이 증가하면서 이를 이용한 다양한 분야에서 연구가 진행되고 있다. 그러나 딥러닝 기반의 생성 모델을 이용하는 폰트의 자동 생성 연구들은 로마자 및 한자와 같은 몇 언어들에 국한되어 연구되고 있다. 한글 폰트 디자인은 매우 큰 시간과 비용이 들어가는 작업으로, 딥러닝을 이용하면 손쉽게 생성할 수 있다. 한글 폰트를 생성하는 연구는 딥러닝 기반의 생성 모델들과 발맞추기 위해 프로세스 자동화 관점에서 한글 폰트 데이터셋을 준비하는 것이 중요하다. 이를 위하여 본 논문에서는 딥러닝 기반의 한글 폰트 연구를 위한 한글 폰트 데이터셋을 제안하고. 그데이터셋을 구성하는 방법을 기술한다. 본 논문에서 제안하는 한글 폰트 데이터셋을 기반으로 딥러닝 한글 폰트 생성 어플리케이션에 적용하는 과정을 통해 제안하는 데이터셋 구성의 유용성을 보인다.
조단비 ( Dan Bi Cho ) , 이현영 ( Hyun Young Lee ) , 정원섭 ( Won Sup Jung ) , 강승식 ( Seung Shik Kang )한국정보처리학회, 정보처리학회논문지. 소프트웨어 및 데이터 공학[2021] 제10권 제1호, 1~8페이지(총8페이지)
뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 ...