Ⅰ. 원시 코퍼스와 주석 코퍼스
원시 코퍼스(raw corpus)
출판된 형태 그대로의 텍스트를 전자형태로 모아 놓은 것
주석 코퍼스(annotated corpus)
텍스트를 어떤 목적을 위하여 가공하고 표지를 붙여 놓은 것
주석의 목적
어떤 목적을 위하여 텍스트를 해석하고 그 해석한 결과를 표시해
사용하는 것이 중요하다.
이를 위해 대용량 언어 데이터인 코퍼스라는 구축되었다. 우선, 코퍼스가 무엇인지 알아보고, 이를 이용하여 한국어에서 여러 가지 의미로 쓰이고 있는 ‘들다’의 의미 사용 빈도에 대해서 연구해보도록 하겠다. 이를 통해 다의어의 학습 방안에 대해 생각해보겠다.
필요가 있음을 말해준다. 전통문법의 구조는 그 체계성의 측면에서 장점을 찾아볼 수도 있겠지만 현 상황에 적절하게 사용하기 위해 corpus문법을 이용한 단점의 보완이 필요할 것이다 먼저 우리는 전통문법과 corpus문법이 무엇을 말하는지 생각해보아야 하겠다.
2.전통문법과 코퍼스(corpus)문법이란?
4대 비극과 5대 희극으로 분류했고, 그 후로 여러 사람들이 이를 인용하기 시작함.
비극 (주 corpus)
King Lear 25,230
Othello 25,742
Macbeth 20,236
Hamlet 30,740
희극 (참조 코퍼스)
As You Like It 25,288
The Taming of the Shrew 20,502
The Merchant of Venice 21,075
Twelfth Night 19,418
A Midsummer Night's Dream 17,571
3) 70, 80년대 음악보다 90, 00, 10년대 음악이 단순한 여흥어의 반복이 많을 것이다.
70, 80년대의 음악에서는 우리말을 이용해서 단순 명료하게 자신의 감정을 표현했지만, 90년대 이후의 음악에서는 자신의 감정을 표현하는 것 이외에 노래를 듣는 사람들의 흥을 돋우기 위한 의미없는 음절의 반복이 많다