색인방법은 주제 문헌 집단 내에서 주제어로서의 중요도에 따라 가중치를 부여하는데 이 가중치는 전체 문헌 집단 내에서 거시적으로 색인어의 중요도를 고려한다는 면에서 全域値(global value)로 볼 수 있다.
전역치와 함께 고려해야 할 것은 특정 단어의 특정 단어의 문헌에서의 중요도를 표현하는
시스템이나 정보검색기법의 성능평가에 있어서 신뢰도에 근거한 객관적인 평가가 일반화되어 있는 상태는 아니라고 할 수 있다. 그 이유는 평가결과에 대한 신뢰에 결정적인 영향을 주는 테스트 컬렉션의 사용이 아직 보편화되어 있지 않다는 점을 들 수 있다.
우리 나라의 테스트 컬렉션은 정보과학
검색에 활용하기 위한 분석 가공 방법으로 초록 작성(abstracting), 색인 작성(indexing), 분류(classifying), 추록 작성(extracting) 등이 가장 적합한 것으로 알려져 있다. 정보 처리 기기 및 처리 기술을 이용하여 대부분 인력에 의존하던 이러한 작업들을 자동화하는 노력을 해 온 결과 많은 결실을 보이고 있다.
색인데이터베이스와 성능의 탐색기능을 제공하고 있지만 아직 체계적으로 정보를 조직화하지 못하고, 질의어에 대해 패턴 비교를 통해 검색을 하나 관련성 없는 정보까지 검색함으로써 정보의 질을 낮추는 등 많은 문제점을 보이고 있다.
우리는 이 레포트에서 검색엔진이란 무엇이며, 동작원리, 검
유비쿼터스 환경과 웹 서비스의 결합으로 인해 지금까지의 웹 대신 시맨틱 웹 서비스에 대한 기대가 커지고 있다. 그러나 시맨틱 웹으로의 진화를 위해 온톨로지의 확립 등 여러 과제가 먼저 해결되어야 할 것이다. 본 리포트에서는 시맨틱 웹에 대한 이해와 함께 온톨로지의 이론에 대한 소개, 시맨틱