색인 구조 및 과정
링크의 메타 데이터 검색을 위한 색인 구조는 링크_색인 화일, 링크_포스팅 화일, 링크_내용 화일, 문서_색인 화일, INCOMING_링크 화일, OUTGOING_링크 화일로 이루어진다. 링크_색인 화일에는 링크의 메타 데이터를 대표하는 색인어들을 저장하고 링크_포스팅 화일에는 해당 색인어로서
색인어의 본질과 특성을 기본으로 한 것은 아니라고 할 수 있다. 따라서 자동색인을 이용한 색인어추출법을 통하여 추출된 색인어는 바람직한 색인어가 될 가능성은 거의 없으며, 색인어의 특성이나 검색성능에 미치는 영향에 대한 파악 및 색인작업에 대한 질의 평가 등도 거의 이루어지지 않고 있다.
질의어와 데이터 베이스간의 연관성을 사용하게 되었다. 다음 [그림.1]은 각각의 언어에서의 전 처리 과정을 보여주고 있다.
[그림 1] 전 처리 과정
(1) 영어 색인의 전 처리 과정
1) stopping 기법
Stopping 과정은 문서에 포함된 어휘 중 문서의 개념을 표현하는 데 불필요한 어휘
Ⅰ. 개요
웹문서 디렉토리 검색엔진의 분류체계는 기본적으로 주제어의 상호관계(상․하, 연관관계)를 나타내고, 주제접근점을 통제하는 통제언어 색인시스템을 따른다고 볼 수 있다. 이것은 전조합 색인시스템의 시소러스 작성원칙과도 유사한 것으로서, 각각의 디렉토리 검색엔진에서 사용하
색인 데이터베이스와 성능의 탐색기능을 제공하고 있지만 아직 체계적으로 정보를 조직화하지 못하고, 질의어에 대해 패턴 비교를 통해 검색을 하나 관련성 없는 정보까지 검색함으로써 정보의 질을 낮추는 등 많은 문제점을 보이고 있다.
우리는 이 레포트에서 검색엔진이란 무엇이며, 동작원리, 검