마이닝으로 정의하고 있다. 통계적 관점에서는 올바른 의사결정을 지원하기 위한 자료분석(Data analysis) 및 모형 선택(Model selection)으로 정의한다. 여러 서적이나 논문에 의하면 데이터마이닝과 지식 발견(KDD, Knowledge Discovery in Database)이라는 용어를 혼용해서 사용하는 경우가 많다. 개념이 소개되던 초창
데이터마이닝은 중요한 패턴이나 경향을 추출하기 위한 목적으로 데이터를 체계적으로 개발하는 것으로 정의된다. 많은 기업에서는 정보기술의 향상과 데이터 저장 비용의 하락으로 대용량의 데이터를 저장 할 수 있다. 방대하고 복잡해진 데이터를 효과적으로 활용하는 방안이 최대 관심이다. 경영
텍스트 파일로 저장한다. 웹 서버 로그파일의 저장과정은 [그림1]과 같다.<1>
1.웹 로그 파일 수집 방법
웹 로그 파일을 수집하는 방법 [그림2]에서 보듯이 웹 서버를 이용하는 방법과 클라이언트 로그를 이용하는 방법, 그리고 패킷 트레이스 분석 방법이 있다.<2>
(1)웹 서버 로그를 이용
1. 빅데이터이란?
“빅데이터(Big Data)”란 데이터의 양이 기존에 감안된 것 보다 너무 방대하여 결코 일반적인 방법으로는 수집할 수 있거나 분석이 가능하지 않은 데이터의 집합체를 의미한다. 소셜 네트워크상의 데이터나 인터넷 텍스트 및 문서, 통화 상세기록, 대규모의 전자상거래 목록, SNS통신데
마이닝(Web Mining)이란 웹 환경에서 적용되어지는 데이터 마이닝 기술로 웹으로부터 얻어지는 방대한 양의 정보로부터 유용한 정보를 찾아내어 분석하는 것을 말한다.
즉, 웹 환경의 로그 파일로부터 수집된 방대한 양의 데이터를 처리하기 위해 데이터 마이닝 기법을 연결하여 사용자들의 특성을 나타