비정형데이터가 급속히 증가하고 있다. 이러한 비정형데이터는 생성과정이나 활용적인 측면에서도 전자메일, 전자결재, 문서관리, 클라우드 보관, 빅데이터, 모바일응용 관리 등 여러면에서 관리하고 있다. 이 장에서는 비정형데이터분석4) 빅데이터시대의 비정형데이터분석의 의의와 가치에 대해서
분석이 가능하다. 게다가 사진이나 동영상 콘텐츠를 PC를 통해 이용하는 것은 이미 일반화되었고 방송 프로그램도 TV수상기를 통하지 않고 PC나 스마트폰으로 보는 세상이다. 트위터에서만 하루 평균 1억 5500만 건이 생겨나고 유튜브의 하루 평균 동영상 재생건수는 40억 회에 이른다. 글로벌 데이터 규모
알아볼 수 없는 상태의 정보이다. 단,‘추가 정보’가 개인 식별에 이용될 수 없도록 분리 보관되는 등 기술적?관리적 조치가 요구된다. 가명화된 정보도 여전히 개인정보로 취급되지만, 공익을 위한 기록보존, 과학적?역사적 연구(사인의 영리목적 연구 포함) 또는 통계 목적의 활용이 허용된다.
분석의 가능성을 높인다는 데 그 의의가 있다. 또한 데이터의 규모가 커질수록 의미 있는 머신러닝·딥러닝 모형을 작성할 수 있다. 따라서 빅데이터의 규모는 빅데이터의 가치를 얻기 위한 가장 기본적 속성이다.
다양성(Variety) 측면에서 보면, 빅데이터에서는 정형 데이터보다는 비정형데이터의 비
통계 목적의 활용이 허용된다.
익명화란, 현행 기술상 개인식별 수단으로는 원래의 개인정보를 알아볼 수 없는 상태로 만드는 것을 말한다. 익명화된 정보는 특정 개인과 연관 지을 수 없거나 그러한 식별 가능성이 완전히 제거된 정보로서 GDPR의 규제 대상이 아니다. 익명화를 위해서는 식별자가