각 드라마의 시즌 1~2의 자막을 Text로 변환, AntConc를 이용하여 Corpus를 구축
구축된 Corpus를 활용하여 Concordance, Keyword List, Word List, Cluster 기능 등을 활용하여 유의미한 값을 찾아내어 연구
The Sopranos
Word Types : 10911
Word Tokens : 149908
Friends
Word Types : 7230
Word Tokens : 110028
조직 전체
La Cosa Nost
I. 서 론
인간이 만물의 영장으로 지구상에 최고의 자리에 오를 수 있는 것은 언어의 사용과 도구의 사용 그리고 생각한 동물이기 때문에 가능할 것이다. 물론 인간뿐만 아니라 동물들도 생각을 할 줄 알고, 또 이를 표현함으로써 의사소통을 한다고 할 수 있다.
인간에게 특유한 마음의 기능의 부분
차원을 넘어서 한국 학생들의 관사 습득에 대한 총체적 반성이 필수적이다. 이에 따라 앞으로 이어질 본문에서의 Corpus 분석, 교수 방법 및 도구 모색을 통하여 학생들이 자주 범하는 오류를 알아보는 과정을 통해 어떤 오류가 자주 발생하는지, 또 무엇을 중점으로 교육해야하는지 알아보도록 한다.
corpus를 수집, 분석하여 각각의 활용이 상황에 따라 어떻게 달라지는 지를 밝히고 이를 의미의 성분분석 이론에 의하여 분석, 각각의 의미의 차이를 화용론적 관점에서 접근하여 비교, 대조해 보고자 시도하였다. 이를 위하여 사전, 소설, 시, 기사, 시나리오 등 각 분야의 텍스트(text)에서 ‘조차, 마저,
corpus) 데이터를 활용하는 기계학습 기반 및 통계적 자연어 처리 기법이 주류를 이뤘다. 하지만 최근에는 딥 러닝과 딥 러닝 기반의 자연어처리가 방대한 텍스트로부터 의미 있는 정보를 추출하고 활용하기 위한 언어처리 연구 개발이 전 세계적으로 활발히 진행되고 있다. 본 과제에서는 자연언어처리