데이터마이닝은 크게 컴퓨터 과학의 관점, MIS 관점, 통계적 관점으로 나누어 정의할 수 있다. 컴퓨터 과학적인 관점에서는 패턴 인식 기술뿐만 아니라 통계적·수학적 분석 방법을 이용하여 저장된 거대한 자료로부터 우리에게 유익하고 흥미있는 새로운 관계·성향·패턴 등의 다양한 부가가치 정보를
데이터마이닝은 중요한 패턴이나 경향을 추출하기 위한 목적으로 데이터를 체계적으로 개발하는 것으로 정의된다. 많은 기업에서는 정보기술의 향상과 데이터 저장 비용의 하락으로 대용량의 데이터를 저장 할 수 있다. 방대하고 복잡해진 데이터를 효과적으로 활용하는 방안이 최대 관심이다. 경영
텍스트 파일로 저장한다. 웹 서버 로그파일의 저장과정은 [그림1]과 같다.<1>
1.웹 로그 파일 수집 방법
웹 로그 파일을 수집하는 방법 [그림2]에서 보듯이 웹 서버를 이용하는 방법과 클라이언트 로그를 이용하는 방법, 그리고 패킷 트레이스 분석 방법이 있다.<2>
(1)웹 서버 로그를 이용
1. 빅데이터이란?
“빅데이터(Big Data)”란 데이터의 양이 기존에 감안된 것 보다 너무 방대하여 결코 일반적인 방법으로는 수집할 수 있거나 분석이 가능하지 않은 데이터의 집합체를 의미한다. 소셜 네트워크상의 데이터나 인터넷 텍스트 및 문서, 통화 상세기록, 대규모의 전자상거래 목록, SNS통신데