분석이 어려울 정도로 데이터의 생성 속도가 빠르고, 다양한 종류로 구성된 큰 규모의 데이터를 의미한다. 아래 표는 전통적 데이터와 빅데이터를 구분하여 정의하였다. 일반적으로 빅데이터는 기존 데이터에 비해 너무 커서 기존의 방법이나 도구로 수집, 저장, 분석, 시각화 등이 어려운 정형 또는
데이터량 보다도 많다. 멀티미디어 콘텐츠와 콘텐츠 사용에 관한 정보의 증가, SNS의 급격한 확산과 비정형데이터의 폭증은 빅데이터의 출현을 야기하였고 '빅데이터 경영'이라는 신조어가 생길 정도로 기업마다 빅데이터의 활용이 화두가 되고 있다. 데이터마이닝은 오래전부터 사용되어 왔지만
데이터과학, 빅데이터의 개념과 실제로 오픈소스를 활용한 트렌드 분석, 실제 기업,정부의 빅데이터 활용 사례에 대해 다루었다.
Ⅱ. 데이터과학, 빅데이터
1. 데이터 과학
데이터 과학(data science)이란, 데이터마이닝(Data Mining)과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터
빅데이터분석 결과물에서 개인 식별자 값이 제거 또는 알아볼 수 없도록 변환되거나 개인정보가 표본값, 평균값, 최대최소값 등으로 범주화되는 등으로 인해 개인에 대한 식별성이 제거되어도 빅데이터의 활용 목적이 상당부분 달성될 수 있다는 점에 착안하여, 이 경우 ‘개인정보’에 대해 부과되
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점)
개인정보, 가명정보, 익명정보의 차이를 설명하기에 앞서, 비식별화의 개념부터 정리할 필요가 있다. 비식별화란, 빅데이터분석 결과물에서 개인 식별자 값이 제거 또