비정형데이터가 급속히 증가하고 있다. 이러한 비정형데이터는 생성과정이나 활용적인 측면에서도 전자메일, 전자결재, 문서관리, 클라우드 보관, 빅데이터, 모바일응용 관리 등 여러면에서 관리하고 있다. 이 장에서는 비정형데이터분석4) 빅데이터 시대의 비정형데이터 분석의 의의와 가치에 대해서
데이터 분석 결과물에서 개인 식별자 값이 제거 또는 알아볼 수 없도록 변환되거나 개인정보가 표본값, 평균값, 최대최소값 등으로 범주화되는 등으로 인해 개인에 대한 식별성이 제거되어도 빅데이터의 활용 목적이 상당부분 달성될 수 있다는 점에 착안하여, 이 경우 ‘개인정보’에 대해 부과되는
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점)
개인정보, 가명정보, 익명정보의 차이를 설명하기에 앞서, 비식별화의 개념부터 정리할 필요가 있다. 비식별화란, 빅데이터 분석 결과물에서 개인 식별자 값이 제거 또
이전보다 더 다양하고 더 큰 규모의 데이터를 보다 낮은 비용으로 분석하여 보다 높은 효용을 제공하는 시스템
개인에 의한 비정형데이터가 큰 비중을 차지
일원화된 시스템으로는 처리할 수 없음
소셜 네트워크 확산으로 더 확대되는 추세 데이터 처리 및 유통에 걸리는 시간이 혁신적으로 단축
데이터 분석은 기업의 경쟁력을 강화하고, 비즈니스 모델을 개선하며, 새로운 비즈니스 기회를 창출하는 데 중요한 역할을 한다. 이러한 데이터 분석을 위해서는 다양한 데이터의 유형(Variety)과 계속 발생하는 데이터(Velocity)를 활용해야 한다. 이에 따라서 정형 데이터와 비정형데이터의 개념적 차이
데이터의 생성 속도가 빠르고, 다양한 종류로 구성된 큰 규모의 데이터를 의미한다. 아래 표는 전통적 데이터와 빅 데이터를 구분하여 정의하였다. 일반적으로 빅 데이터는 기존 데이터에 비해 너무 커서 기존의 방법이나 도구로 수집, 저장, 분석, 시각화 등이 어려운 정형 또는 비정형데이터를 빅 데
1. 빅 데이터란 무엇인가?
빅 데이터 (Big data)란 기존 데이터베이스 관리도구의 데이터 수집·저장·관리·분석의 역량을 넘어서는 대량의 정형 또는 비정형데이터 세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 다양한 종류의 대규모 데이터의 생성·수집·분석·
일반적으로, 빅데이터의 기초단위인 데이터는 의미 있는 수치나 문자, 기호를 뜻한다. 기존의 빅데이터에 관한 사전적 정의는 단순히 데이터의 양이 많은 것을 의미 하였다. 하지만 최근 빅데이터의 정의의 범주가 확장 되어, 기존의 대용량의 정형화된 데이터를 뜻하는 정의뿐만 아니라 비정형화된 일
데이터를 빠르게 처리하고 분석할 수 있는 속성이다. 융복합 환경에서 디지털 데이터는 매우 빠른 속도로 생산되므로 이를 실시간으로 저장, 유통, 수집, 분석처리가 가능한 성능을 의미한다. 다양성(Variety)은 다양한 종류의 데이터를 의미하며 정형화의 종류에 따라 정형, 반정형, 비정형데이터로 분
데이터의 저장단위도 제타바이트(ZB)의 시대로 진입하고 있다. 이처럼 대용량 데이터의 증가가 빅 데이터의 구성요소로 작용하고 있는 것이다.
둘째, 다양성(Variety)은 기존의 정형화된 데이터 외에 비정형화 데이터로부터의 분석과 관련이 있다. 전통적인 데이터분석은 자체 시스템에 저장되어있는