데이터를 수집하고, 수집된 webdata를 적절한 형태로 변환한후 data에 일반적인 mining 기술을 적용 시킨다.
2부 webusage mining의 기술
2.1. webdata( logdata 중심)
#log: 사용자가 웹 사이트를 이용한 기록을 담는 로그 데이터를 기반으로 다양한 정볼르 추출하는 것, 웹에서의 모든 사용자들의 행동
사이트를 이용하므로 사용자의 가입정보를 많이 확보하는 것이 중요하다. 이외에 LogData를 활용하는 방안이 있다. 웹에서의 모든 행동들은 웹 서버에 Log 형태로 남게 된다.
웹 구조 정보(Hyperlink형태의 구조) 역시 WebData라 할 수 있는데, 이것은 웹 구조 마이닝에서만 사용하는 Data가 아니라 WebUsage Min
정보들을 클라이언트 측에 기록되게 할 수 있다. 그러나 이를 지원하기 위해서는 브라우저의 수정 등 부과적인 작업이 필요하다.
예) 쿠키
쿠키(cookies)란 인터넷 웹 사이트에 의하여 형성되는 이용자의 컴퓨터의 저장되는 정보 또는 웹 이용자들을 식별하기 위하여 웹 서버에 의하여 이용되는 데이터
정보를 패턴 발견 작업에 필요한 형태로 변형
3) 정확한 결과를 얻기 위해서는 전처리 과정이 매우 중요
4) 방법 - data cleaning
- user identification
- actual path identification
- transaction identification
- session identification
5) Local cashes and proxy servers make them difficult
6) Usage Preprocessing
Web Mining)이라 일컫는다. 이러한 웹 마이닝은 최근 학계에서의 활발한 연구활동 뿐만 아니라 실제 비즈니스에 많은 응용이 이루어지고 있다.
이에 본 논문에서는 웹상에서의 고객 행위 흔적이라고 할 수 있는 웹 로그 데이터를 분석하고 해석하여 인터넷 비즈니스 상에 전략 수립과 마케팅 활동이 어떻