Ⅰ. 개요
1950년대에 정보과학이 논리학, 철학에 이어서 적합의 개념을 수용한 이래, 적합은 정보 과학의 기본적인 중심 개념이 되어 왔다. 특히 정보검색 연구에서 검색의 효율성을 측정 하는데 주요한 기준으로 사용되었다. 그러나 적합이 지니는 의미의 다양성으로 인하여 적합의 개념을 정의하기
Ⅰ. 개요
국내 정보검색시스템은 이제 시작 단계로 볼 수 있는데 이는 국내 정보 시스템이 정보에 대한 데이터베이스 구축에 우선 초점이 맞추어져 있기 때문으로 판단된다. 다만 언론사, 관공서 및 대기업 등과 같이 선도적으로 데이터베이스를 구축해오던 기관을 중심으로 현재 활발히 정보검색 요
Stopword 리스트를 사용하는 방법과 Lexicon을 사용한 방법의 두 가지가 있다.
가. Stopword 리스트를 통한 어휘 제거
일반적인 정보 추출 시스템에서는 불필요 어휘의 제거를 위해 Stopword 리스트를 사용 한다. Stopword 리스트에는 다음과 같은 품사의 어휘들이 나열되어 있으며 이러한 어휘
Stopword 리스트를 통한 어휘 제거
일반적인 정보 추출 시스템에서는 불필요 어휘의 제거를 위해 Stopword 리스트를 사용한다. Stopword 리스트에는 다음과 같은 품사의 어휘들이 나열되어 있으며 이러한 어휘들은 문서로부터 제거된다.
• 관사 - a, an, the ...등등
&n
서론
현대 전산학의 눈부신 발달로 전산언어학이 무척 발달했는데, 이는 자연언어처리와 언어의 공학적 활용에 관심을 갖는다. 앞으로는 컴퓨터 자판이 필요 없고, 구두로 말하는 내용이 그대로 텍스트로 편집되어 나온다. 자연 언어(또는 자연어, Natural Language)란 프로그래밍 언어와 같이 사람이 인