인공지능 : 영한 기계번역 시스템의 영한 변환사전 확장 도구
분야
공학 > 전자공학
저자
김성동 ( Sung Dong Kim )
발행기관
한국정보처리학회
간행물정보
정보처리학회논문지. 소프트웨어 및 데이터 공학 2013년, 제2권 제1호, 35~42페이지(총8페이지)
파일형식
52808099.pdf [무료 PDF 뷰어 다운로드]
  • ※ 본 자료는 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
  • 구매가격
    4,500원
    적립금
    135원 (구매자료 3% 적립)
    이메일 발송  스크랩 하기
    자료 다운로드  네이버 로그인
    국문초록
    영한 기계번역 시스템을 개발하기 위해서는 언어에 대한 다양한 정보를 필요로 하며, 특히 영어 단어에 대한 의미 정보를 포함한 영한 변환사전의 풍부한 정보량은 번역품질에 중요한 요소이다. 지속적으로 생성되는 새로운 단어들은 사전에 등록되어 있지 않아 번역문에 영어 단어가 그대로 출력되어 번역품질을 저하시킨다. 또한 복합명사는 어휘분석, 구문분석을 복잡하게 하고 사전에 의미가 등록되지 않은 경우가 많아 올바르게 번역하기 어렵다. 따라서 영한 기계번역의 번역품질 향상을 위해서는 사전에 등록되어 있지 않은 단어들과 자주 사용하는 복합명사들을 수집하고 의미 정보를 추가하여 영한 변환사전을 지속으로 확장하는 것이 필요하다. 본 논문에서는 인터넷 신문기사로부터 말뭉치를 추출하고, 사전 미등록 단어와 자주 나타나는 복합명사를 찾은 후, 이들에 대해 의미를 부착하여 영한 변환사전에 추가하는 일련의 과정으로 구성되는 영한 변환사전의 확장 방안을 제한하고 이를 자원하는 도구를 개발하였다. 사전 정보의 확대는 많은 사람의 노력을 필요로 하는 일이지만, 영한 기계번역 시스템의 개선을 위해서는 필수적이다, 본 노문에서 개발한 도구는 사람의 노력을 최소화 하면서, 영한 변환사전의 정보량 지속적인 확대를 위해 유용하게 활용되어 영한 기계번역 시스템의 번역품질 개선에 기여할 것으로 기대된다.
    영문초록
    Developing English-Korean machine translation system requires the construction of information about the languages, and the amount of information in English-Koran transfer dictionary is especially critical to the translation quality. Newly created words are out-of-vocabulary words and they appear as they are in the translated sentence, which decreases the translation quality. Also, compound nouns make lexical and syntactic analysis complex and it is difficult to accurately translate compound nouns due to the lack of information in the transfer dictionary. In order to improve the translation quality of English-Korean machine translation, we must continuously expand the information of the English-Korean transfer dictionary by collecting the out-of-vocabulary words and the compound nouns frequently used. This paper proposes a method for expanding of the transfer dictionary, which consists of constructing corpus from internet newspapers, extracting the words which are not in the existing dictionary and the frequently used compound nouns, attaching meaning to the extracted words, and integrating with the transfer dictionary. We also develop the tool supporting the expansion of the transfer dictionary. The expansion of the dictionary information is critical to improving the machine translation system but requires much human efforts. The developed tool can be useful for continuously expanding the transfer dictionary, and so it is expected to contribute to enhancing the translation quality.
    사업자등록번호 220-87-87785 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.070-8809-9397
    개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1765호 이메일 help@reportshop.co.kr
    copyright (c) 2009 happynlife. steel All reserved.