[데이터베이스] 검색엔진상에서의전처리과정

 1  [데이터베이스] 검색엔진상에서의전처리과정-1
 2  [데이터베이스] 검색엔진상에서의전처리과정-2
 3  [데이터베이스] 검색엔진상에서의전처리과정-3
 4  [데이터베이스] 검색엔진상에서의전처리과정-4
 5  [데이터베이스] 검색엔진상에서의전처리과정-5
 6  [데이터베이스] 검색엔진상에서의전처리과정-6
 7  [데이터베이스] 검색엔진상에서의전처리과정-7
 8  [데이터베이스] 검색엔진상에서의전처리과정-8
 9  [데이터베이스] 검색엔진상에서의전처리과정-9
 10  [데이터베이스] 검색엔진상에서의전처리과정-10
 11  [데이터베이스] 검색엔진상에서의전처리과정-11
 12  [데이터베이스] 검색엔진상에서의전처리과정-12
 13  [데이터베이스] 검색엔진상에서의전처리과정-13
 14  [데이터베이스] 검색엔진상에서의전처리과정-14
 15  [데이터베이스] 검색엔진상에서의전처리과정-15
 16  [데이터베이스] 검색엔진상에서의전처리과정-16
 17  [데이터베이스] 검색엔진상에서의전처리과정-17
 18  [데이터베이스] 검색엔진상에서의전처리과정-18
 19  [데이터베이스] 검색엔진상에서의전처리과정-19
 20  [데이터베이스] 검색엔진상에서의전처리과정-20
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
[데이터베이스] 검색엔진상에서의전처리과정에 대한 자료입니다.
목차
개요
검색엔진의 전 처리 과정
Stopping 기법
Stemming algorithm을 사용한 IR의 장점
Stemming  알고리즘의  문제점
Stemmer의 종류
Affix removal stemmer
N-gram stemmer
한글 색인어 추출 방법
어절 단위 색인법
비색인 분절
최장 일치법
어절 단위 색인법의 문제점
형태소 단위 색인법
n-Gram 기반 색인법
성능 평가
한국어 테스트 모델
본문내용
개요

정보 검색 시스템(Information Retrieval System)이란, 사용자가 필요로 하는 정보를  수집하여 내용을 분석한 뒤 찾기 쉬운 형태로 조직하여서, 정보에 대한 요구가 발생했을   때 해당 정보를 찾아 제공하는 시스템을 말한다. 인터넷 상의 문서의 수는 하루가 다르    게 폭발적으로 증가하는 추세에 있으며 이로 인해 검색해야 할 문서의 수가 방대하고,  사용자의 질의에 대해서 빠른 응답시간을 요구한다.

 Stopping 기법

Stopword 리스트를 통한 어휘 제거
    일반적인 정보 추출 시스템에서는 불필요 어휘의 제거를 위해 Stopword 리스트를 사용한다.  Stopword 리스트에는 다음과 같은 품사의 어휘들이 나열되어 있으며 이러한 어휘들은 문서로부터 제거된다.
   • 관사 - a, an, the ...등등
   • 전치사 - above, around, before.. 등등
   • 접속사 - where, as, but, and.. 등등
   • 대명사 - he, him, them, she.. 등등
   • 비 동사 - be, are, was ..등등
   • 자주 사용되는 동사 - have, get, tell, say.. 등등