사용자가 가입을 하지 않고 사이트를 이용하므로 사용자의 가입정보를 많이 확보하는 것이 중요하다. 이외에 LogData를 활용하는 방안이 있다. 웹에서의 모든 행동들은 웹 서버에 Log 형태로 남게 된다.
웹 구조 정보(Hyperlink형태의 구조) 역시 WebData라 할 수 있는데, 이것은 웹 구조 마이닝에서만 사용
web usage mining의 기술
2.1. webdata( logdata 중심)
#log: 사용자가 웹사이트를 이용한 기록을 담는 로그데이터를 기반으로 다양한 정볼르 추출하는 것, 웹에서의 모든 사용자들의 행동은 웹 서버에 log 형태로 남게 된다.
ㅡ일반적인 의미 :웹사이트의 페이지, 사용자별 페이지, 접속장소 및 방식, 시간
사이트 개선, 마케팅에 필요
3.1.전처리(Preprocessing)
1) 수집된 데이터를 사용자 또는 관리자에게 유용한 정보를 제공하기 위한
형태로변환
2) 적절한 데이터의 용도, 내용,구조정보를 패턴 발견 작업에 필요한 형태로 변형
3) 정확한 결과를 얻기 위해서는 전처리 과정이 매우 중요
4) 방법 - data c
위해서는 브라우저의 수정 등 부과적인 작업이 필요하다.
예) 쿠키
쿠키(cookies)란 인터넷 웹사이트에 의하여 형성되는 이용자의 컴퓨터의 저장되는 정보 또는 웹 이용자들을 식별하기 위하여 웹 서버에 의하여 이용되는 데이터 조각을 의미한다.
쿠키는 먼저 이용자의 동의나 인식 없이 이용
Web Mining
초기에는 사이트의 현황이나, 에러의 발견을 위해서 트래픽 분석을 하는 정도에 그쳤으며, 트래픽 분석을 통해서는 총 방문자 수나, 시간대별 접속 회수, 에러페이지 발견 등의 통계적 수치만을 알아낼 수 있었다.
웹마이닝을 통하여 어떤 사용자가 어떤 경로로, 사이트에 방문하게 되었으며