소개글
코퍼스의 가공과 주석에 대한 자료입니다.
목차
Ⅰ. 원시 코퍼스와 주석 코퍼스
Ⅱ. 주석의 방법
Ⅲ. 품사 태깅
Ⅳ. 형태소 분석 코퍼스
Ⅴ. 트리뱅크
Ⅵ. 다른 종류의 주석
본문내용
Ⅰ. 원시 코퍼스와 주석 코퍼스
원시 코퍼스(raw corpus)
출판된 형태 그대로의 텍스트를 전자형태로 모아 놓은 것
주석 코퍼스(annotated corpus)
텍스트를 어떤 목적을 위하여 가공하고 표지를 붙여 놓은 것
주석의 목적
어떤 목적을 위하여 텍스트를 해석하고 그 해석한 결과를 표시해
놓음으로써 코퍼스의 이용 가치를 높이는 것
연구 목적에 따른 주석의 다양한 형태
역사 연구의 관점
연대 혹은 시대, 인물이름, 제도나 기관의 이름 등을
명시적으로 표시
문학사의 관점
작가나 작품 이름, 문예 사조 등을 명시적으로 표시
일반적인 언어 연구의 관점
단어와 형태소, 문장 등 언어 분석의 단위를 명시적으로 표시