분야    
발행기관
간행물  
발행연도  
발행기관 : (사)한국빅데이터학회131 개 논문이 검색 되었습니다.
RandomForest와 XGBoost를 활용한 한국어 텍스트 분류: 서울특별시 응답소 민원 데이터를 중심으로
하지은 ( Ji-eun Ha ) , 신현철 ( Hyun-chul Shin ) , 이준기 ( Zoon-ky Lee )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제2호, 95~104페이지(총10페이지)
2014년 서울시는 시민의 목소리에 신속한 응대를 목표로 ‘서울특별시 응답소’ 서비스를 시작하였다. 접수된 민원은 내용을 바탕으로 카테고리 확인 및 담당부서로 분류 되는데, 이 부분을 자동화시킬 수 있다면 시간 및 인력 비용이 감소될 것이다. 본 연구는 2010년 6월 1일부터 2017년 5월 31일까지 7년치 민원 사례 17,700건의 데이터를 수집하여, 최근 화두가 되고 있는 XGBoost 모델을 기존 RandomForest 모델과 비교하여 한국어 텍스트 분류의 적합성을 확인하였다. 그 결과 RandomForest에 대비 XGBoost의 정확도가 전반적으로 높게 나타났다. 동일한 표본을 활용하여 업 샘플링과 다운 샘플링 시행 후에는 RandomForest의 정확도가 불안정하게 나타난 반면, XGBoost는 전반적으로 안정적인 정확도를...
TAG 머신러닝, 텍스트마이닝, 민원 분류, RandomForest, XGBoost, Machine Learning, Text Mining, Civil Complaint Classification
프로세스 마이닝을 이용한 웹 사이트의 이용 패턴 분석 및 그룹 간 비교 분석
김슬기 ( Seul-gi Kim ) , 정재윤 ( Jae-yoon Jung )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제2호, 105~114페이지(총10페이지)
오늘날 많은 서비스 지원이 웹 사이트를 통해 제공되고 있다. 웹 사이트의 이용 및 효율성을 최적화하기 위하여 방문자들의 이용 패턴 분석이 매우 중요하다. 본 연구에서는 BPI Challenge 2016에서 제공하는 웹 사이트 접속 로그를 분석하여 이용 패턴 분석 및 이용자 그룹별 비교 분석 연구를 수행하였다. 이 데이터는 네덜란드 고용보험사(UWV)의 IT 시스템의 웹 사이트 접속 로그를 제공하며, 고객의 인적 정보, 해당 기관의 웹 사이트를 사용할 때의 고객 행동을 설명하는 클릭 데이터 등의 대한 정보를 포함하고 있다. 본 연구에서는 프로세스 마이닝 기법을 이용하여 사용 고객의 사용 패턴과 고객 그룹 간 특징을 분석하여, 궁극적으로 웹 서비스를 이용하는 고객들을 대상으로 서비스 품질을 향상시키고자 한다.
TAG 프로세스 마이닝, 웹 사이트 이용 패턴 분석, 이용자 그룹 간 비교 분석, Process Mining, Web Usage Analysis, Comparative Analysis Among User Groups
COPD 코호트 자료에서의 Machine Learning 방법론 비교
정현명 ( Hyeon-myeong Jeong ) , 박헌진 ( Heon-jin Park ) , 이진국 ( Chin-kook Rhee ) , 이종민 ( Jong-min Lee )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제2호, 115~128페이지(총14페이지)
최근 머신러닝 방법은 높은 예측력과 함께 널리 이용되지만 머신러닝을 제대로 활용하기 위해서 데이터가 가진 한계를 통계적 기법으로 해결한다면 기존보다 더 높은 예측력을 이끌어 낼 수 있다. 본 연구에서는 Longitudinal and Imbalanced Data에서 SMOTE 방법을 활용하여 불균형 문제를 해결한 결과 예측력이 증가하는 것을 확인할 수 있었다. 추가적으로 만성폐쇄성폐질환 급성악화 관련 연구가 활발히 이루어지고 있지만 급성악화와 관련 있는 요인을 찾는 연구만 이루어지고 있어 여러 요인들에 대한 복합적인 관철과 예측모형을 통한 급성악화 예측 연구는 이루어지지 않는다. 본 연구에서는 여러 요인을 같이 살펴봤을 때 어떤 요인들이 만성폐쇄성폐질환 급성악화와 관련이 있는지 확인하고 개인 맞춤형 특정 질환 예측 모형을 구축하였...
TAG 머신러닝, 만성폐쇄성폐질환, 질환예측, Machine Learning, Chronic Obstructive Pulmonary Disease(COPD), Specific Disease Prediction
도로 기상 빅데이터 유형별 활용 전략: 국내외 사례 분석
함유근 ( Yukun Hahm ) , 전용주 ( Yongjoo Jun ) , 김강화 ( Kanghwa Kim ) , 김승현 ( Seunghyun Kim )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제2호, 129~140페이지(총12페이지)
낮은 시정, 강우, 강풍, 고온 등 기상 상태는 운전 능력, 차량 성능(예: 마찰, 안정성, 조작력), 노면 마찰력, 도로 인프라, 추돌 위험, 교통 흐름 및 도로 관리자 생산성 등에 영향을 미친다. 최근에는 CCTV, 도로센서, 차량 센서 등 다양한 도로 기상 빅데이터 소스들이 개발되면서 이러한 기상 관련 문제들 해결에 적용되고 있다. 본 연구는 이러한 도로 기상 빅데이터 소스들의 유형과 특징을 정의하고 국내외 실증 사례들을 통해 도로 기상 빅데이터 유형별로 관련 문제들 해결에 활용하는 전략에 대해 제시하고자 한다.
TAG 도로 기상 빅데이터, CCTV 데이터, 도로 센서 데이터, 차량 센서 데이터, 환경 센서 스테이션, 사물 인터넷, Road Weather Big Data, CCTV Data, Road Sensor Data, Car Sensor Data, ESS, IoT
글로벌 핫 이슈, 빅데이터
오재인 ( Jay In Oh )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제1호, 1~3페이지(총3페이지)
낮은 시정, 강우, 강풍, 고온 등 기상 상태는 운전 능력, 차량 성능(예: 마찰, 안정성, 조작력), 노면 마찰력, 도로 인프라, 추돌 위험, 교통 흐름 및 도로 관리자 생산성 등에 영향을 미친다. 최근에는 CCTV, 도로센서, 차량 센서 등 다양한 도로 기상 빅데이터 소스들이 개발되면서 이러한 기상 관련 문제들 해결에 적용되고 있다. 본 연구는 이러한 도로 기상 빅데이터 소스들의 유형과 특징을 정의하고 국내외 실증 사례들을 통해 도로 기상 빅데이터 유형별로 관련 문제들 해결에 활용하는 전략에 대해 제시하고자 한다.
지속적 프로세스 개선을 위한 6시그마와 BPM 통합 모형
윤지현 ( Ji Hyun Yoon ) , 정재윤 ( Jae-yoon Jung )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제1호, 5~15페이지(총11페이지)
6시그마는 지난 20여 년간 제조 및 서비스 등의 산업에서 프로세스 개선을 위하여 꾸준히 적용되어왔다. 그럼에도 불구하고 6시그마는 Define 단계에서 의미있는 프로젝트를 계속 발굴하기 힘들고 Control 단계에서 지속적인 측정 및 통제가 쉽지 않다는 문제가 지적되었다. 이를 해결하기 위하여 개선 프로세스의 지속적인 통제와 관리를 원활히 할 수 있는 체계가 요구되며, 비즈니스 프로세스 관리(BPM) 시스템이 효과적 대안이 될 수 있다. 본 연구에서는 프로세스 운영 및 분석에서 누적된 데이터를 중심으로 지속적 프로세스 개선을 실현하기 위한 목적으로 6시그마와 BPM의 통합 모형을 제시하고, 프로젝트 수행을 위하여 상호 데이터 기반으로 프로세스를 분석, 개선, 모니터링하는 과정을 설명한다. 이를 통하여 6시그마와 BPM의 장점을 결합하여, 지속...
TAG 6시그마, 비즈니스 프로세스 관리, BPM, 지속적 프로세스 개선, Six Sigma, Business Process Management, Continuous Process Improvement
오염 요인별 지역선정을 통한 대기-기상자료의 미세먼지 인과관계 검증
한정민 ( Jeong-min Han ) , 김재구 ( Jae-goo Kim ) , 조기현 ( Ki-hyun Cho )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제1호, 17~26페이지(총10페이지)
산업발달과 지구 온난화로 중국 북동부 지역의 사막화가 가속화 되면서 한반도는 지리적·계절적으로 미세먼지의 영향을 많이 받고 있다. 미세먼지로 인한 피해는 일반인보다 호흡기 질환자나 노인, 영·유아에게 치명적어서 미세먼지 발생 원인과 인과관계 검증을 위한 연구가 필요하다. 본 연구에 이용된 대기환경 자료와 산업지역 자료는 청정지역과 오염지역으로 나누고 오염지역은 산업별로 구분하여 분석하였다. 기상자료를 이용하여 기상·기후의 변화에 따른 미세먼지 변화를 분석하였고 미세먼지 발생요인을 국내의 영향과 국외의 영향으로 구분하여 대기-기상자료의 상관성을 검증하였다. 그리하여 미세먼지(PM10)와 초미세 먼지(PM2.5)의 구성 물질별로 계절적, 지리적인 발생형태 분석을 통해 산업, 지형, 인구, 주거 정보를 결합한 미세먼지에 대...
TAG 기상, 기후, 대기 환경, 미세먼지, 인과관계, Weather, Climate, Air Condition, Fine Dust, Causal Relationship
기업의 위기대응전략에 대한 소셜 미디어 이용자의 반응 연구
김보라 ( Bora Kim ) , 김우희 ( Woohee Kim ) , 정윤혁 ( Yoonhyuk Jung )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제1호, 27~39페이지(총13페이지)
기업은 자사의 브랜드 이미지 제고, 제품의 홍보와 고객관리를 위해 소셜 네트워크 서비스를 적극적으로 활용하고 있다. 나아가 기업의 위기상황에 대한 실시간 대응 채널로서 소셜 네트워크 서비스의 사용은 확장되고 있다. 특히, 기업의 예상치 못한 위기상황이 소셜 네트워크 서비스를 통해 전파되는 경향이 있다는 점에서 기업의 소셜 네트워크 서비스를 통한 위기대응은 효과적이다. 이러한 대응은 소비자의 기업의 이미지 형성에 큰 영향을 끼친다. 본 연구는 기업의 소셜 네트워크 서비스 대응 사례를 태도(수용적 vs. 방어적)와 속도(빠른 대응 vs. 느린 대응)로 구분하여 소셜 네트워크 서비스 상의 위기 관련 트위터 버즈의 지속기간을 분석하였다. 12개의 기업 위기 대응 사례에 대한 트워터 데이터를 분석자료로 하여 분석하였다. 분석결과는 기업의 위기대응 전략 수립 및 위기...
TAG 위기대응 전략, 상황적 위기 커뮤니케이션 이론, 위기대응 태도, 위기대응 속도, 소셜 네트워크 서비스, Crisis Response Strategy, Situational Crisis Communication Theory (SCCT), Crisis Response Attitude, Crisis Response Speed, Social Network Service (SNS)
무비렌즈 데이터를 이용한 하이브리드 추천 시스템에 대한 실증 연구
김동욱 ( Dong-wook Kim ) , 김성근 ( Sung-geun Kim ) , 강주영 ( Juyoung Kang )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제1호, 41~48페이지(총8페이지)
최근 추천 시스템의 인기와 함께 추천 시스템의 알고리즘의 성능에 대한 평가가 중요해 졌다. 본 연구는 영화 데이터에서 다양한 알고리즘 중 어떤 알고리즘의 효과적인지 판단하기 위하여 모델링과 RMSE를 통한 모델 검증을 하였다. 본 연구의 데이터는 무비렌즈의 평가 데이터 10만건을 활용하여 피어슨 상관계수를 활용한 사용자 기반 협업 필터링, 코사인 상관계수를 활용한 아이템 기반 협업 필터링 그리고 특이 값 분해를 활용한 아이템 기반 협업 필터링 모델을 만들었다. 세가지 추천 모델로 평점을 예측한 결과 사용자 기반 협업 필터링보다 아이템 기반 협업 필터링의 정확도가 월등히 높은 것을 확인했고, 행렬 분해를 사용했을 때 더 정확한 추천을 할 수 있었다.
TAG 무비렌즈, 하이브리드 추천, 추천 시스템, Movie Lens Data, Recommendation System, Hybrid Recommendation System
FP-Growth 기법을 활용한 건자재 재고 재배치 기법 개발
이효준 ( Hyo-jun Lee ) , 김재원 ( Jae-won Kim ) , 신광섭 ( Kwang Sup Shin )  (사)한국빅데이터학회, 한국빅데이터학회지 [2017] 제2권 제1호, 49~58페이지(총10페이지)
재고의 배치 위치는 오더 피킹 시 효율성을 결정하는 가장 중요한 요소라고 할 수 있다. 적재위치에 따라 오더 피킹 장비의 동선을 최소화할 수 있고, 그에 따라 비용 절감 및 작업 효율성 향상의 효과를 기대할 수 있기 때문이다. 그러나 일부 물류센터 혹은 야적장에서는 제품의 적재 위치를 결정하는 데 있어 체계적이고 분석적 기법 보다는 작업자의 직관과 경험에 의존하고 있는 것이 현실이다. 본 연구에서는 실제 건자재제조업체의 실제 야적장의 구조와 실제 연간 주문 내역을 바탕으로 제품 사이의 연관성을 파악하고, 그 결과를 기준으로 제품의 적재 위치를 결정하는 새로운 기준을 제시한다. 이를 통해 집하를 위한 동선을 최소화하고, 상차 지연에 따른 납기 지연의 문제를 해결할 수 있음을 실제 주문 데이터를 통해 증명한다.
TAG 제품 재배치, 연관성 분석, 동선 최적화, Inventory Relocation, Association Analysis, Route Optimization
 11  12  13  14