소개글
[지식경영] 안전한 버섯판매를 위한 식용버섯과 독버섯 구별 프로그램 구성에 대한 자료입니다.
목차
Ⅰ. 도입: 현재상황
Ⅱ. Data Mining 11Step Methodology
Ⅲ. 실제 Clementine을 사용한 데이터마이닝 과정
본문내용
7.모형들을 생성한다.
경영 문제와 데이터마이닝 문제에서 식용 가능 여부를 판별한다는 방향성이 존재함에 따라 방향성 데이터마이닝 알고리즘인 의사결정나무와 인공신경망을 사용하여 모형을 생성 하였다.
8.모형들을 평가한다.
교차표를 이용하여 모형들을 평가한 결과 예측 정확도가 100%로 나타났다. 결과가 너무 정확하게 나타남에 따라 다른 방향성의 데이터마이닝을 모색하게 되었고, 4단계부터 다시 거쳐서 새로운 모델들을 만들어내었다. 처음에는 모델 형성에 옵션을 줌으로써 변화를 시도했으나 기대했던 변화가 나타나지 않았다. 그래서 새롭게 잡은 방향성은 다음과 같다.
“실제 상황에서 이러한 데이터들을 구하는 데에는 비용이 많이 들 것이다. 같은 결과를 얻을 수 있다면 데이터를 적게 구하여 비용을 줄일 수 있지 않을까?”
이에 따라서 훈련 집합의 크기를 줄여보기로 하였다. 다만 독버섯의 경우 조금이라도 분류에 오차가 발생할 경우 인명피해가 발생할 우려가 있기 때문에 부정 오류(실제로 독이 있는 버섯인데 식용으로 판단하는 경우)가 0이 되도록 하는 제약 조건을 달았다. 이 때 긍정 오류(먹을 수 있는 버섯을 독버섯으로 판단하는 경우)의 경우 판매 기회를 다소 놓치게 되더라도 큰 문제가 아니기 때문에 크게 신경쓰지 않기로 하였다.