연구의 기반이 될 뿐 아니라 사전 편찬과 언어 교육의 응용 분야에서 없어서는 안 될 중요한 자원으로 인식되고 있다. 아울러 자연언어처리, 정보검색, 기계번역 등 컴퓨터의 언어 처리에서 말뭉치에 기반한 통계적 정보가 점점 더 중요시되고 있다. 두 언어의 문장들을 병치시켜 만든 병렬코퍼스는 기
가지는 각종의 통계 데이터를 수집 분석할 수가 있다.
둘째는 컴퓨터에 자연어를 이해시켜 주는 자연어 이해 시스템 (natural language understanding system)의 연구다. 자연어 이해 시스템은 컴퓨터와 인간 사이에 존재하는 사용 언어가 서로 다름으로써 생기는 불편함의 해소를 목적으로 하는 시도이다.
연구, 문장 혹은 작자의 스타일 연구 등 여러 분야에 광범위하게 사용되고 있기 때문이다
예를 들면, 사전 편찬시 등재한 해당 단어 아래의 용법 및 용례는 편집자가 임의로 삽입하는 것이 아니고, 대규모의 코퍼스에서 추출한 것이다. 그런데 이러한 코퍼스의 텍스트는 모두가 語料를 분리하여, 품사
번역한다든지 하는 등의 작업)을 수행(처리: processing)하고, 또 그 결과를 인간에게 자연언어의 형태로 전달(생성:generation)할 수 있도록 연구하는 모든 분야를 일컫는다. 현대 언어학자들은 컴퓨터를 이용한 언어 처리, 컴퓨터의 언어 이해와 발화뿐만 아니라 컴퓨터 작동을 위한 언어 프로그램까지 깊숙
번역(번역기)의 정의
기계번역이란 컴퓨터를 통해서 구문을 파악하고 단어를 대입하여 번역하는 것을 말한다. 이 말은 정교한 번역보다는 문장의 구조를 분석하여 분석된 내용을 중심으로 단어 사전의 데이터베이스를 이용해서 문장을 변환하는 것이라고 정의할 수 있다. 오래 전부터 이러한 기계번