제4장 색인 레포트

 1  제4장 색인 레포트-1
 2  제4장 색인 레포트-2
 3  제4장 색인 레포트-3
 4  제4장 색인 레포트-4
 5  제4장 색인 레포트-5
 6  제4장 색인 레포트-6
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
제4장 색인 레포트에 대한 자료입니다.
목차
4.1 색인언어

4.1.1 자연언어

4.1.2 통제언어

4.1.3 시스템 언어

4.2 색인기법

4.2.1 통계적 기법

4.2.2 언어학적 기법

(1)FASIT

(2)KAIS 시스템

제 5 장 데이터베이스 구조

5.1 DIALOG

5.1.1 파일구조

5.1.2 정보검색

5.2 ETLARS

5.2.1 파일구조

5.2.2 정보검색

♧데이터베이스


본문내용
4.1.3 시스템 언어
국내의 경우는 연구개발정보센터의 KRISTAL 및 농촌진흥청의 데이터베이스 등의 일부 시스템만 이 두 방식을 채택하고 있으며 대부분 시스템은 자연언어를 색인어로 채택하고 있다. 자연언어를 채택한 시스템 중 한국전자통신연구소의 ETLARS는 자연언어 색인의 단점을 보완하기 위해서 동등어 처리를 해 주고 있다. 동등어 처리란 색인 작성시 색인어로 선정된 키워드에 대해 동등어 사전을 추가함으로써 탐색시 자동으로 탐색어 확장이 되도록 하는 것이다.

4.2 색인기법
초기의 대부분 자동색인 응용은 단어의 통계적 특성에 기초하여 단일어를 색인어로 추출하였는데 문맥에서 벗어난 단일어 단위의 색인어는 너무 지나치게 일반적이거나 또는 불명확하여 문헌 내용의 좋은 식별자로서 기여하지 못하였다. 이러한 문제점들을 해결하는 방법으로 색인에 언어학적 개념을 응용한 색인 기법이 제안되었다. 언어학적 방법에는 형태소해석 방법, 구문해석 방법, 의미해석 방법이 있다.
실제 데이터베이스 색인작업은 국내의 경우 형태소해석 방법에 의해 일차적으로 단어를 자동 추출한 다음 색인자가 후 통제해 주는 반자동색인 방식을 많이 채택하고 있으며 외국의 경우는 구문적 해석방법을 많이 이용하고 있다.

4.2.1 통계적 기법
통계적 색인방법은 주제 문헌 집단 내에서 주제어로서의 중요도에 따라 가중치를 부여하는데 이 가중치는 전체 문헌 집단 내에서 거시적으로 색인어의 중요도를 고려한다는 면에서 全域値(global value)로 볼 수 있다.
전역치와 함께 고려해야 할 것은 특정 단어의 특정 단어의 문헌에서의 중요도를 표현하는