추천자료
[문헌정보]정보검색론 정리
사서직 공무원 정보봉사론 기출문제 모음
[인터넷정보검색][정보분석]인터넷정보검색과 정보분석, 인터넷정보검색과 정보검색포럼, 인터넷정보검색과 검색엔진, 인터넷정보검색과 DB(데이터베이스), 인터넷정보검색과 초록, 인터넷정보검색과 정보검색사
[데이터베이스] 검색엔진-검색모델을 설명, 그중 벡터공간모델을 중심으로
[인터넷 정보검색][인터넷][정보검색]인터넷 정보검색의 개념, 인터넷 정보검색의 구분, 인터넷 정보검색의 분야, 인터넷 정보검색의 환경변화, 인터넷 정보검색의 시스템, 인터넷 정보검색의 가이드라인 분석
[컴퓨터] 유비쿼터스 환경에서 시맨틱웹과 온톨로지의 이론및 활용사례 / 요구되는 과제
[인터넷 정보검색][검색엔진][인터넷][정보검색][검색][정보검색엔진]인터넷 정보검색의 정의, 인터넷 정보검색의 분류, 인터넷 정보검색의 적합성, 인터넷 정보검색의 변천, 인터넷 정보검색과 검색엔진 분석
[데이터베이스] stemming에 대해서
정보처리기사 핵심 요약집
공학 인터넷 정보 검색 엔진들의 종류와 특징
소개글
제4장 색인 레포트에 대한 자료입니다.
목차
4.1 색인언어
4.1.1 자연언어
4.1.2 통제언어
4.1.3 시스템 언어
4.2 색인기법
4.2.1 통계적 기법
4.2.2 언어학적 기법
(1)FASIT
(2)KAIS 시스템
제 5 장 데이터베이스 구조
5.1 DIALOG
5.1.1 파일구조
5.1.2 정보검색
5.2 ETLARS
5.2.1 파일구조
5.2.2 정보검색
♧데이터베이스
본문내용
4.1.3 시스템 언어
국내의 경우는 연구개발정보센터의 KRISTAL 및 농촌진흥청의 데이터베이스 등의 일부 시스템만 이 두 방식을 채택하고 있으며 대부분 시스템은 자연언어를 색인어로 채택하고 있다. 자연언어를 채택한 시스템 중 한국전자통신연구소의 ETLARS는 자연언어 색인의 단점을 보완하기 위해서 동등어 처리를 해 주고 있다. 동등어 처리란 색인 작성시 색인어로 선정된 키워드에 대해 동등어 사전을 추가함으로써 탐색시 자동으로 탐색어 확장이 되도록 하는 것이다.
4.2 색인기법
초기의 대부분 자동색인 응용은 단어의 통계적 특성에 기초하여 단일어를 색인어로 추출하였는데 문맥에서 벗어난 단일어 단위의 색인어는 너무 지나치게 일반적이거나 또는 불명확하여 문헌 내용의 좋은 식별자로서 기여하지 못하였다. 이러한 문제점들을 해결하는 방법으로 색인에 언어학적 개념을 응용한 색인 기법이 제안되었다. 언어학적 방법에는 형태소해석 방법, 구문해석 방법, 의미해석 방법이 있다.
실제 데이터베이스 색인작업은 국내의 경우 형태소해석 방법에 의해 일차적으로 단어를 자동 추출한 다음 색인자가 후 통제해 주는 반자동색인 방식을 많이 채택하고 있으며 외국의 경우는 구문적 해석방법을 많이 이용하고 있다.
4.2.1 통계적 기법
통계적 색인방법은 주제 문헌 집단 내에서 주제어로서의 중요도에 따라 가중치를 부여하는데 이 가중치는 전체 문헌 집단 내에서 거시적으로 색인어의 중요도를 고려한다는 면에서 全域値(global value)로 볼 수 있다.
전역치와 함께 고려해야 할 것은 특정 단어의 특정 단어의 문헌에서의 중요도를 표현하는