문서자동요약에 있어서 통계적인 기법과 전자메일의 구조적인 특성을 고려하여 시스템을 형태소 분석기능, 문장랭킹기능, 문장추출기능으로 분류하여 좀더 기본적인 내용을 유지 가능하게 하면서 복잡도를 줄이려고 노력하였으며, 현존하는 웹에서 쉽게 구현이 가능하고 멀티유저 환경에 적합하다.
새로운 언어적, 구조적, 영역적 특성 등을 지닌 새로운 문서집합을 추가하는 것은 필요불가결 할 것으로 생각된다. 아울러 단순한 문서검색을 뛰어넘어 문단검색, 구조화검색, 정보추출, 정보요약 등의 새로운 기능을 실험할 수 있는 테스트 컬렉션의 개발 구축에 대한 사항 또한 필요하리라 생각된다.
문서처리비용의 감소, 유통비용의 절감 등의 효익을 기대하는 비용절감전략에 대한 기대가 큰 것으로 나타났다. 또한 산학연 협력을 통한 기술수용정도가 높고, 외부와의 기술제휴가 많으며, 기술개발 투자비가 과다할수록 연구개발에 따른 비용부담이 커질수록 비용절감전략에 대한 기대가 큰 것으
Ⅰ. 서론
먼저, 검색엔진은 각 웹페이지의 정보를 웹으로부터 수집한다. 일반적인 검색엔진은 이 문서수집 과정에서 웹문서들로부터 추출된 텍스트 데이터와 멀티미디어 데이터들을 서로 다른 저장소(Repository)에 분리하여 저장한다. 이때 멀티미디어 데이터들은 그 특성상 데이터 자체에 검색 가능
특성을 파악하는 통계기술을 말하며, 요약수치와 도표로 구성되어 있다. 표본 또는 모집단의 특성을 서술하는 요약수치에는 빈도분포, 집중경향치(최빈치, 중앙값, 평균), 산포도(변산도; 범위, 사분편차, 분산, 표준편차), 백분율 등이 있고, 도표는 히스토그램, 막대도표, 절선도표, 파이차트가 있다.