위와 같이 수집된 희곡 대본을 지문 및 기타 요소들을 모두 제거하고 대사만 말뭉치로 선정하여 연구를 진행하였다.
희곡 텍스트에 대사 이외의 요소들은 수작업으로 삭제하여 원시말뭉치를 구축했다. 원시말뭉치를 지능형 형태소 분석기를 사용하여 형태소 분석을 하고, 빈도분석기를 활용하여 빈
3) 70, 80년대 음악보다 90, 00, 10년대 음악이 단순한 여흥어의 반복이 많을 것이다.
70, 80년대의 음악에서는 우리말을 이용해서 단순 명료하게 자신의 감정을 표현했지만, 90년대 이후의 음악에서는 자신의 감정을 표현하는 것 이외에 노래를 듣는 사람들의 흥을 돋우기 위한 의미없는 음절의 반복이 많다
Ⅰ. 서 론
동물의 언어는 물론 우리와는 다르다. 우리가 사용하는 말을 동물이 구사하리라고 기대해서는 안 된다. 언어활동은 서로 약속한 기호를 이해하는 것이라고 생각해야 할 것이다.
앵무새에게 말을 한다고 해서 그 말을 이해하는 것은 아니다. 그런 면에서 언어활동은 수리문제를 푸는 것과 유
Ⅰ. 원시 코퍼스와 주석 코퍼스
원시 코퍼스(raw corpus)
출판된 형태 그대로의 텍스트를 전자형태로 모아 놓은 것
주석 코퍼스(annotated corpus)
텍스트를 어떤 목적을 위하여 가공하고 표지를 붙여 놓은 것
주석의 목적
어떤 목적을 위하여 텍스트를 해석하고 그 해석한 결과를 표시해
말뭉치자료를 수집하였고, 그 외의 교과서는 직접 구입하여 1인 1권씩 분담해 직접 입력하는 방식으로 자료를 수집하였다. 이렇게 만들어진 원시말뭉치를 지능형형태소분석기를 이용하여 형태소 분석을 한 후, 잘못된 형태소를 찾아내기 위하여 일일이 살펴보았다.
그리하여 최종적으로 구축된 색인