구어 문법’ 두 분야로 이루어진다. 외국인이 한국어를 잘 구사하기 위해서는 한국어만이 가지고 있는 규칙들을 잘 깨우치고 연습하여 그것을 적재적소에 쓸 줄 알아야 한다. 구어 문법으로서 한국어 구어 규칙은 외국인 학습자가 더 자연스럽고 자신감 있게, 정확하고 풍부하게 한국어를 사용하기 위
분석기 돌린 결과 자료의 총 어절수가 만 칠천(1,7000) 어절로 나타났으며, 이중에서 수정필요 오류 어절 수가 백사십팔(148)개로 분석되었으며, 형태소 분석기가 잘못 분석한 오류수가 오류 어절 수에 더해졌다. 다음은 오류 분석시 나타나는 말뭉치의 예를 보인 것이다.
(3)깜짝새를 통한 통계 분석
Ⅰ. 문장의 성격
문장은 하나의 독립된 언어 형식으로서, 그 자체로서 하나의 통일성 있는 짜임새를 가지고 있다.
우리 한글은 대단히 과학적이다.
위의 문장은 우선 주어부인 ‘우리 한글은’과 서술부인 ‘대단히 과학적이다’로 분석된다. 주어부는 다시 ‘우리’와 ‘한글은’으로 분석되는데,
위와 같이 수집된 희곡 대본을 지문 및 기타 요소들을 모두 제거하고 대사만 말뭉치로 선정하여 연구를 진행하였다.
희곡 텍스트에 대사 이외의 요소들은 수작업으로 삭제하여 원시말뭉치를 구축했다. 원시말뭉치를 지능형 형태소 분석기를 사용하여 형태소 분석을 하고, 빈도분석기를 활용하여 빈
구어말뭉치’가 있다.
‘말뭉치’란 주로 언어 현실을 드러내는 자료를 전자 자료로 만들어 데이터베이스화 한 것을 일컫는데, 언어 중에서 구어를 대상으로 추출한 자료를 ‘구어말뭉치’라고 한다. 비록 구어말뭉치는 그에 대한 연구의 역사가 짧고 학계에서도 풍부한 자료 구축이나 그 활용에