인터넷 마케팅을 위한 Yongsan.com Web-log 분석
Abstract
yongsan.com의 web-log를 www.mrunix.net에서 제공하는 webalizer-2.01-06와 직접 작성한 matlab 프로그램을 통해 분석하였다. 분석결과 Category에서 ‘컴퓨터 부품’, 그 뒤를 이어 ‘주변기기’가, Product에서는 ‘현원 모비블루 DAH-1500‘가 가장 큰 인기를 끌고 있음
Log Data를 활용하는 방안이 있다. 웹에서의 모든 행동들은 웹 서버에 Log 형태로 남게 된다.
웹 구조 정보(Hyperlink형태의 구조) 역시 Web Data라 할 수 있는데, 이것은 웹 구조 마이닝에서만 사용하는 Data가 아니라 Web Usage Mining함에 있어서 전반적으로 활용되는 정보이다. 위에서 기술한 Data외에 쿠키, 마우
web usage mining의 구성
1.전처리단계(preprocessing)
2.패턴 탐색단계( pattern discovery)
3.패턴 분석단계(pattern analysis)
데이터를 수집하고, 수집된 web data를 적절한 형태로 변환한후 data에 일반적인 mining 기술을 적용 시킨다.
2부 web usage mining의 기술
2.1. web data( log data 중심)
#log: 사용자가 웹
일반적으로 가장 많은 정보를 수집하는 채널(channel)인 웹(web)의 경우, 고객행동을 알려주는 웹 로그(weblog)의 양은 처리하기 어려울 정도로 엄청나다. 웹 로그 데이터는 데이터베이스와는 달리 구조화되어 있지 않다. 하루에도 몇 백GB(giga byte)씩 쌓이는 로그(log)를 분류하고 관리 한다는 것이 현실적으로
데이터 마이닝의 필요성
이제는 많은 회사들이 자신의 비즈니스에 관련된 여러 가지 데이터를 모아 데이터베이스 시스템에 넣어두고 있고 이 데이터의 양은 해마다 끊임없이 증가하고 있다. 또한 인터넷과 전자상거래가 급속하게 보급되면서 소비자와 구매에 관련된 많은 양의 데이터가 자동으로