비정형데이터가 급속히 증가하고 있다. 이러한 비정형데이터는 생성과정이나 활용적인 측면에서도 전자메일, 전자결재, 문서관리, 클라우드 보관, 빅데이터, 모바일응용 관리 등 여러면에서 관리하고 있다. 이 장에서는 비정형데이터분석4) 빅데이터 시대의 비정형데이터 분석의 의의와 가치에 대해서
데이터 분석 결과물에서 개인 식별자 값이 제거 또는 알아볼 수 없도록 변환되거나 개인정보가 표본값, 평균값, 최대최소값 등으로 범주화되는 등으로 인해 개인에 대한 식별성이 제거되어도 빅데이터의 활용 목적이 상당부분 달성될 수 있다는 점에 착안하여, 이 경우 ‘개인정보’에 대해 부과되는
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점)
개인정보, 가명정보, 익명정보의 차이를 설명하기에 앞서, 비식별화의 개념부터 정리할 필요가 있다. 비식별화란, 빅데이터 분석 결과물에서 개인 식별자 값이 제거 또
이전보다 더 다양하고 더 큰 규모의 데이터를 보다 낮은 비용으로 분석하여 보다 높은 효용을 제공하는 시스템
개인에 의한 비정형데이터가 큰 비중을 차지
일원화된 시스템으로는 처리할 수 없음
소셜 네트워크 확산으로 더 확대되는 추세 데이터 처리 및 유통에 걸리는 시간이 혁신적으로 단축
데이터 분석은 기업의 경쟁력을 강화하고, 비즈니스 모델을 개선하며, 새로운 비즈니스 기회를 창출하는 데 중요한 역할을 한다. 이러한 데이터 분석을 위해서는 다양한 데이터의 유형(Variety)과 계속 발생하는 데이터(Velocity)를 활용해야 한다. 이에 따라서 정형 데이터와 비정형데이터의 개념적 차이