문법적으로 사용되는 비 개념어, 지나치게 빈도수가 높거나 낮은 어휘들, 여러 문서에 고르게 등장하는 어휘 등이다. 이러한 Stopping 과정의 수행 방법에는 Stopword 리스트를 사용하는 방법과 Lexicon을 사용한 방법의 두 가지가 있다.
가. Stopword 리스트를 통한 어휘 제거
일반적인 정보 추출 시
38. 자기소개서(삼성전자/기획/전략/신입)
1) 지원동기 및 포부
가장 건전한 재무구조로 외국 투자자들이 가장 선호하는 기업, 대학생들이 가장 일하고 싶은 기업, 삼성은 설명이 필요 없는 우리나라 최고의 기업입니다. 조기출퇴근제, 현장근무제, 양 위주의 관행 척결, 불합리하고 불필요한 규정 철
4.1.3 시스템 언어
국내의 경우는 연구개발정보센터의 KRISTAL 및 농촌진흥청의 데이터베이스 등의 일부 시스템만 이 두 방식을 채택하고 있으며 대부분 시스템은 자연언어를 색인어로 채택하고 있다. 자연언어를 채택한 시스템 중 한국전자통신연구소의 ETLARS는 자연언어 색인의 단점을 보완하기 위해
1. 자기 소개서란 무엇인가 자기소개서는 자신의 인생을 서술한 ‘자서전’이 아니라 읽는 사람으로 하여금 경력을 한 눈에 보여서 공감대를 형성할 수 있는 ‘자기보고서’이다. 자기가 자신에 대해서 소개하는 글로써 왜 자신을 선택해야 하는지를 설득하는 글이어야 한다. 관습적인 고정관념에서
1. 서론
1.1. 연구배경
인터넷의 발달과 컴퓨터 하드웨어의 발달로 인해 수많은 이미지들이 웹상에, 엄밀히 데이터베이스 상에 넘쳐나게 되고 이제는 텍스트위주의 서비스보다 이미지위주의 서비스가 주류가 되었다. 거기에 덧붙여 최근 5년 사이에 급성장한 디지털 카메라의 시장 때문에 이미지