1. R datarium 패키지에 내장된 jobsatisfaction 데이터셋은 남녀 58명의 성별(gender), 교육수준(education_level), 직업만족도점수(score)의 데이터를 포함하고 있다. 이 데이터를 이용하여 다음의 문항에 답하시오.
1-(1) 직업만족도점수의 상자그림을 성별로 나란히 그리시오. 그래프의 제목으로 본인의 학번을 넣으
데이터 분석 결과물에서 개인 식별자 값이 제거 또는 알아볼 수 없도록 변환되거나 개인정보가 표본값, 평균값, 최대최소값 등으로 범주화되는 등으로 인해 개인에 대한 식별성이 제거되어도 빅데이터의 활용 목적이 상당부분 달성될 수 있다는 점에 착안하여, 이 경우 ‘개인정보’에 대해 부과되는
(1) 다음을 정리하여 서술하시오. (8점)
① 데이터과학자 ② 빅데이터 확산 배경
① 데이터과학자
빅데이터란, 데이터의 규모가 크고, 다양한 형태를 가지며, 생성-유통-소비의 순환이 매우 빠르게 일어나서 기존의 방식으로는 관리·분석하기 어려운 데이터로 규모(Volume), 다양성(Variety), 속도(
(1) 다음을 정리하여 서술하시오.
① 빅데이터
빅데이터란, 데이터의 규모가 크고, 다양한 형태를 가지며, 생성-유통-소비의 순환이 매우 빠르게 일어나서 기존의 방식으로는 관리·분석하기 어려운 데이터로 규모(Volume), 다양성(Variety), 속도(Velocity)의 3V로 정의된다. 3V는 2001년 분석회사 가트너(Gartne