웹마이닝를 개발 하게 되었다.
2. 패러다임의 변화
2‐1. 새로운 비즈니스의 도래
표1. 미국에서 5,000만 가구에 보급되는데 소요된 기간
기존에 라디오, PC, TV는 한 시대를 도래하는 패러다임으로 되는 데 걸린 시간이 10년 이상의 기간이 걸린 데 비하여 인터넷은 겨우 4년이
web usage mining의 구성
1.전처리단계(preprocessing)
2.패턴 탐색단계( pattern discovery)
3.패턴 분석단계(pattern analysis)
데이터를 수집하고, 수집된 webdata를 적절한 형태로 변환한후 data에 일반적인 mining 기술을 적용 시킨다.
2부 web usage mining의 기술
2.1. webdata( log data 중심)
#log: 사용자가 웹
Data Mining과의 차이가 발생한다고 볼 수 있다. 이는 마이닝을 함에 있어서 전처리 과정이 매우 중요한데, 이 과정에서 Web에서만 발생할 수 있는 Data처리 과정을 거치기 때문이다.
[그림1. 웹데이터마이닝]
- WebData 수집
웹에서의 Data 수집은 기본적으로 사용자의 가입
위해서는 브라우저의 수정 등 부과적인 작업이 필요하다.
예) 쿠키
쿠키(cookies)란 인터넷웹 사이트에 의하여 형성되는 이용자의 컴퓨터의 저장되는 정보 또는 웹 이용자들을 식별하기 위하여 웹 서버에 의하여 이용되는 데이터 조각을 의미한다.
쿠키는 먼저 이용자의 동의나 인식 없이 이용
웹으로부터 정보를 얻을 수 있는 자동화된 툴이 필요하게 되었고, 얻은 정보를 이용하여 웹사용자들의 패턴을 식별할 수 있는 방법 또한 필요하게 되었다.
2. Web Mining의 정의
웹마이닝(Web Mining)이란 웹 환경에서 적용되어지는 데이터마이닝 기술로 웹으로부터 얻어지는 방대한 양의 정보로부터 유