비정형데이터가 급속히 증가하고 있다. 이러한 비정형데이터는 생성과정이나 활용적인 측면에서도 전자메일, 전자결재, 문서관리, 클라우드 보관, 빅데이터, 모바일응용 관리 등 여러면에서 관리하고 있다. 이 장에서는 비정형데이터분석4) 빅데이터시대의 비정형데이터분석의 의의와 가치에 대해서
빅데이터는 초대용량의 데이터 양(volume), 다양한 형태(variety), 빠른 생성 속도(velocity)라는 뜻에서 3V라고도 불리며 여기에 네 번째 특징으로 가치(value)를 더해 4V라고 정의하기도 한다. 빅데이터에서 가치(value)가 중요 특징으로 등장한 것은 엄청난 규모뿐만 아니라 빅데이터의 대부분이 비정형적인 텍
빅데이터의 저장단위도 제타바이트(ZB)의 시대로 진입하고 있다. 이처럼 대용량 데이터의 증가가 빅데이터의 구성요소로 작용하고 있는 것이다.
둘째, 다양성(Variety)은 기존의 정형화된 데이터 외에 비정형화 데이터로부터의 분석과 관련이 있다. 전통적인 데이터분석은 자체 시스템에 저장되어있
데이터를 의미한다. 아래 표는 전통적 데이터와 빅데이터를 구분하여 정의하였다. 일반적으로 빅데이터는 기존 데이터에 비해 너무 커서 기존의 방법이나 도구로 수집, 저장, 분석, 시각화 등이 어려운 정형 또는 비정형데이터를 빅데이터라 하며, 대용량 데이터를 활용 및 분석하여 가치 있는 정보
데이터과학자의 역할을 논하시오. (3점) 3. 기업이나 기관의 데이터분석에서 분석 대상 문제를 적절하게 포착하고 정의하기 위해 필요한 접근 방식에 대해 설명하시오. (7점) 4. 데이터 품질의 정의를 기술하시오. (3점) 좋은 품질의 데이터가 기업경영에 미치는 영향을 분석한 사례를 조사하고 이에 대해