검색엔진의 종류와 검색방법

 1  검색엔진의 종류와 검색방법-1
 2  검색엔진의 종류와 검색방법-2
 3  검색엔진의 종류와 검색방법-3
 4  검색엔진의 종류와 검색방법-4
 5  검색엔진의 종류와 검색방법-5
 6  검색엔진의 종류와 검색방법-6
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
검색엔진의 종류와 검색방법에 대한 자료입니다.
본문내용
◎ 인터넷 정보 검색 ◎
검색로봇은 spider, wanderer 등으로도 불리며 주기적으로 웹 공간에 존재하는 문서를 수집하여 인덱싱할 수 있도록 도화준다. 인덱스는 검색 로봇이 모아준 문서를 데이터베이스에 저장하는 작업을 하는데 빠르고 효율적인 검색을 위해 주로 키워드와 문서를 연결해주는 역 인덱스(inverted index)방법을 많이 사용한다. 질의 서버는 사용자의 질의어(query)흫 입력으로 받아서 인덱스를 참조하여 검색결과를 출력해준다. 대부분의 검색 엔진은 로봇이 찾아온 문서의 타이틀뿐 아니라 문서 전체의 내용을 인덱싱하는 전문 인덱싱(fupp-text indexing)방법을 택한다. 인덱스는 특정단어에 대해 관련있는 문서들의 링크로 구성되는데 하나 이상의 문서가 같은 단어와 연관이 있을 경우 어느 문서가 더 관련이 있는지를 구별할 필요가 있게 된다. 이것은 사용자에게 결과를 출력해 줄 때 가장 우선 순위가 높은 것부터 순서대로 보여 줄 때 중요한 판단 요소가 될 수 있다.
검색엔진을 구성할 때 다음과 같이 몇 가지 고려해야 할 쟁점(issue)이 있다. 첫째는 검색 로봇의 항해 전략(trversal strategies)을 정하는 문제이다. 웹에 존재하는 문서는 대부분 하이퍼링크를 이용하여 다른 정보사이트와 연결되어 있는데 인덱싱을 위해서는 하나의 문서에서 출발하여 그 문서내에 잇는 여러 링크를 어떠한 순서로 검색할 지 결정하여야 한다. 대표적으로 깊이 우선(depth first)과 넓이 우선(breadth first)방법이 있지만 깊이 우선 방법은 하나의 정보 호스트에 너무 오래 머물러 있는 등의 문제점이 많기 때문에 대부분 넓이 우선 방법을 택한다. 이외에도 최적 우선(best first)방법을 사용하기도 하는데 이는 휴리스틱(heuristic)을 이용하여 다음 인덱스할 링크를 결정하는 것이다. 많이 쓰이는 휴리스틱 중의 하나는 링크 URL의 길이를 비교하여 작은 길이의 URL을 가진 링크를 우선으로 검색하는 방법이다. 그 이유는 URL의 길이가 작을 수록 한 호스트의 길이가 최상위 레벨의 위치를 나타낼 가능성이 많으므로 좀 더 광범위한 인덱싱이 될 수 있기 때문이다.
오늘 본 자료
더보기
  • 오늘 본 자료가 없습니다.
해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용,무단 전재·배포는 금지되어 있습니다. 저작권침해, 명예훼손 등 분쟁요소 발견 시 고객센터에 신고해 주시기 바랍니다.