예측하면 경제적인 이익을 얻을 수 있기 때문에 본 프로젝트를 시작하였다.
우리는 최대한 금 시세에 영향을 미칠 것 같은 데이터를 주식, 에너지, 비철금속, 발틱운임지수 등의 총 10개의 카테고리로 분류하고 카테고리 별로 연관성이 있을만한 총 31개의 데이터를 선정하였고 약 일주일(2010.11.29부터 20
이전보다 더 다양하고 더 큰 규모의 데이터를 보다 낮은 비용으로 분석하여 보다 높은 효용을 제공하는 시스템
개인에 의한 비정형데이터가 큰 비중을 차지
일원화된 시스템으로는 처리할 수 없음
소셜 네트워크 확산으로 더 확대되는 추세 데이터 처리 및 유통에 걸리는 시간이 혁신적으로 단축
예측을 위한 예측 방법 선정.
우리는 정량적 방법을 사용하여 수요예측을 할 것이다. 사용할 방법은 정량적 기법 중에서 시계열 분석기법에 해당하는 단순이동평균법, 지수평활법, 추세분석법, 시계열분해법이다. 7년간의 월별 케이크 판매량 데이터를 시간에 근거하는 시계열 분석기법을 통해 분석
변수와 이 변수의 차이가 클 때 강한 비선형성이 있다고 판단할 수 있다.
X축: 실제 중고차 가격
Y축: 회귀모형에 의해 예측된 중고차 가격
그래프가 매우 선형에 근접하게 나타났다.
따라서 예측 값과 실제 값이 매우 높은 선형관계를 나타내고 있다고 할 수 있고 괜찮은 모형이라고 할 수 있다.
빅 데이터의 긍정적 요소
미래를 보는 ‘눈’
방대한 양의 데이터 분석
미래에 대한 귀납적 추론
각종현상, 행동예측
새로운 일자리
데이터 마이너
기대되는 성장
실제 사례들
아마존
구글의 맞춤형 광고
오마바 캠프의 선거전략
미국의 탈세방지 시스템
Data + Mining
대규모로 저장된 데