목적에 따른 주석의 다양한 형태
역사 연구의 관점
연대 혹은 시대, 인물이름, 제도나 기관의 이름 등을
명시적으로 표시
문학사의 관점
작가나 작품 이름, 문예 사조 등을 명시적으로 표시
일반적인 언어 연구의 관점
단어와 형태소, 문장 등 언어 분석의 단위를 명시적으로 표시
1. 서론
한 학기 동안 습득한 코퍼스 언어학적 지식을 바탕으로, 서정주 시인의 시작(詩作)경향을 알아보고자 한다. 우리는 시 텍스트를 형태소 분석하고, 시집별 단어의 빈도수를 분석하는 과정에서 미당의 작품군(作品群)을 5가지로 분류할 수 있었다. 각 단계를 간략히 정리하면 이와 같다.
▷ 초
분석은 단어 빈도 통계, 새로운 단어의 식별, 컴퓨터 보조 사전 편찬, 단어 배합 연구, 문장 혹은 작자의 스타일 연구 등 여러 분야에 광범위하게 사용되고 있기 때문이다
예를 들면, 사전 편찬시 등재한 해당 단어 아래의 용법 및 용례는 편집자가 임의로 삽입하는 것이 아니고, 대규모의 코퍼스에서
분석하여 연구 업적의 검증을 이루어내고 이 검증을 통해 연구 성과의 이론적 체계를 더욱 공고히 하고 더 나아가서 말뭉치 자료와 학문과의 관계를 생각해 볼 수 있는 연구를 해 보자는 결론을 이끌어냈다.
우리 현대 문학사를 살펴볼 때 서로 대조되는 시적 형태가 공존했던 적을 살펴볼 수 있다. 30
4대 비극과 5대 희극으로 분류했고, 그 후로 여러 사람들이 이를 인용하기 시작함.
비극 (주 corpus)
King Lear 25,230
Othello 25,742
Macbeth 20,236
Hamlet 30,740
희극 (참조 코퍼스)
As You Like It 25,288
The Taming of the Shrew 20,502
The Merchant of Venice 21,075
Twelfth Night 19,418
A Midsummer Night's Dream 17,571