비교하고자 합니다.
Ⅱ. 본론
1. 데이터 수집 및 전처리
분석을 위해 데이터를 수집 및 전처리했습니다. 이번 분석대상은 30개 도시로 도시별 인구와 취업인구는 '도시 특정인구 및 취업인구통계(2019년)'를 기반으로 합니다. 데이터는 엑셀 파일 형식으로 제공되며 데이터 형식은 다음과 같습니다.
전처리 과정이 매우 중요한데, 이 과정에서 Web에서만 발생할 수 있는 Data처리 과정을 거치기 때문이다.
[그림1. 웹 데이터 마이닝]
- Web Data 수집
웹에서의 Data 수집은 기본적으로 사용자의 가입정보를 얻을 수 있다. 이것은 사용자가 가입을 할 경우에 얻을 수 있는 자
데이터마이닝은 크게 컴퓨터 과학의 관점, MIS 관점, 통계적 관점으로 나누어 정의할 수 있다. 컴퓨터 과학적인 관점에서는 패턴 인식 기술뿐만 아니라 통계적·수학적 분석 방법을 이용하여 저장된 거대한 자료로부터 우리에게 유익하고 흥미있는 새로운 관계·성향·패턴 등의 다양한 부가가치 정보를
내부역량
외부환경 강 점(S)
기존거래회사와의 안정적인 거래량
수백가지에 달하는 다양한 상품품목
상품품목의 분야별 분류화 약 점(W)
신규거래회사와의 적은 거래량
상품, 거래회사, 매출액, 재고 데이터의 비효율적인 관리
상품군의 뚜렷한 클래스가 없음
기 회(O)
기업 및 대학
Ⅰ. 개요
데이터 웨어하우스는 장기간에 걸쳐 축적되어온 데이터에 대한 분석 작업을 통해 기업이나 기관의 의사 결정에 필요한 고급 정보를 제공하기 위한 새로운 접근 방법으로 각광 받고 있다. 올바른의사 결정을 위해서는 방대한 양의 데이터에 대한 분석 작업을 통하여 정확한 정보가 빠른 시간