Ⅰ. 서론
1. 문제제기
빛의 속도만큼이나 인터넷이 확산되고 있다고 해도 과언이 아니다. 세계 인구 중 3억 명 이상이 인터넷을 이용하고 있고, 2007년 6월 정보통신부 발표에 따르면 국내 인터넷 사용인구가 3천만 명 이상에 달하며, 한 주 평균 인터넷 사용시간이 13.5시간에 달한다. 인터넷이 사용되
Ⅰ. 개요
국민투표에 의한 직선제로 바뀐 대통령의 임기가 단임 5년으로 되어있기 때문에 대통령의 직무수행이 재선에 미친 영향에 관한 연구가 없다. 그러나 현직과 득표율에 관련된 연구는 국회의원선거에 집중되어 나타나고 있으며 그 영향력에 대하여서는 상반된 주장을 보이고 있다. 현직 국회
추출법 (Random Sampling)은 말 그대로 모집단으로부터 조사의 대상이 되는 표본을 무작위로 선정을 하는 것이다. 단순 무작위 추출법의 기본적인 논리는 모집단을 구성하는 모든 조사대상이 표본으로 선택될 확률이 동일하다는 것이다. 그래서 무작위로 표본을 추출하기 위해서는 모집단 리스트가 반드시
있으며 표본에 의한 편견(bias)을 방지할 수도 있기 때문이다. 이 경우 표본단위 수는 표적모집단 구성원들의 수보다 적다.
표본추출프레임(sampling frame) : 표본추출을 실행하기 위해서 표본단위들로 구성된 표본프레임이 마련되어야 하며, 표본추출프레임이란 모든 표본단위들의 리스트(list)를 말한다.
리스트를 통한 어휘 제거
일반적인 정보 추출 시스템에서는 불필요 어휘의 제거를 위해 Stopword 리스트를 사용한다. Stopword 리스트에는 다음과 같은 품사의 어휘들이 나열되어 있으며 이러한 어휘들은 문서로부터 제거된다.
• 관사 - a, an, the ...등등