HOME > 공학 > 로봇 > 한국정보과학회 > 정보과학회논문지
기분석사전과 기계학습 방법을 결합한 음절 단위 한국어 품사 태깅 -
분야 공학 > 로봇
저자 이충희 임준호 임수종 김현기
발행기관 한국정보과학회
간행물정보 정보과학회논문지 2016년, 정보과학회논문지 제43권 제3호, 362page~369page(총8page)
파일형식 2904142 [다운로드 무료 PDF 뷰어]
판매가격 6,000원
적립금 180원 (구매자료 3% 적립)
이 자료를
논문의 미리보기 2페이지를 PDF파일로 제공합니다.
 
연관 논문
음절 단위의 한국어 품사 태깅에서 원형 복원 -
형태소 분석기 사용을 배제한 음절 단위의 한국어 품사 태깅 -
Sequence-to-sequence 기반 한국어 형태소 분석 및 품사 태깅 -
한국어 형태소 분석을 위한 3단계 확률 모델 -
의료 문헌에서의 절차적 지식 추출을 위한 단위 절차 추출 연구 -
 
 
목차
부제 : Syllable-based Korean POS Tagging Based on Combining a Pre-analyzed Dictionary with Machine Learning
요약
Abstract
1. 서론
2. 기계학습 기반 음절 단위 품사 태깅
3. 기분석사전과 결합된 음절 단위 태깅
4. 실험 및 결과
5. 결론
References
 
 
국문초록
본 논문은 음절 단위 한국어 품사 태깅 방법의 성능 개선을 위해 기분석사전과 기계학습 방법을 결합하는 방법을 제안한다. 음절 단위 품사 태깅 방법은 형태소분석을 수행하지 않고 품사 태깅만을 수행하는 방법이며, 순차적 레이블링(Sequence Labeling) 문제로 형태소 태깅 문제를 접근한다. 본 논문에서는 순차적 레이블링 기반 음절 단위 품사 태깅 방법의 전처리 단계로 품사 태깅말뭉치와 국어사전으로부터 구축된 복합명사 기분석사전과 약 1천만 어절의 세종 품사 태깅말뭉치로부터 자동 추출된 어절 사전을 적용함으로써 품사 태깅 성능을 개선시킨다. 성능 평가를 위해서 약 74만 어절의 세종 품사 태깅말 뭉치로부터 67만 어절을 학습 데이터로 사용하고 나머지 7만 4천 어절을 평가셋으로 사용하였다. 기계학습 방법만을 사용한 경우에 96.4%의 어절 정확도를 보였으며, 기분석사전을 결합한 경우에는 99.03%의 어절 정확도를 보여서 2.6%의 성능 개선을 달성하였다. 퀴즈 분야의 평가셋으로 실험한 경우에도 기계학습 엔진은 96.14% 성능을 보인 반면, 하이브리드 엔진은 97.24% 성능을 보여서 제안 방법이 다른 분야에도 효과적임을 확인하였다.
 
 
영문초록
This study is directed toward the design of a hybrid algorithm for syllable-based Korean POS tagging. Previous syllable-based works on Korean POS tagging have relied on a sequence labeling method and mostly used only a machine learning method. We present a new algorithm integrating a machine learning method and a pre-analyzed dictionary. We used a Sejong tagged corpus for training and evaluation. While the machine learning engine achieved eojeol precision of 0.964, the proposed hybrid engine achieved eojeol precision of 0.990. In a Quiz domain test, the machine learning engine and the proposed hybrid engine obtained 0.961 and 0.972, respectively. This result indicates our method to be effective for Korean POS tagging.
 
 
형태소 분석, 품사 태깅, 기계학습, 기분석사전, morphological analysis, POS tagging, machine learning, pre-analyzed dictionary
 
 
도움말
본 논문은 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
 
 
추천자료
[교양] 맞춤법 보기
무의식속 의식적 의사소통
7차현대문법총정리
[국어] 국어 의미론
공무원 국어 기출문제(국가직7급,국가직9급,국회8급,경찰공무원,군무원)
[국어] 국어학개설 용어정리(이익섭)
중국어번역(한중번역)의 단어분리, 현황, 중국어번역(한중번역)과 중국영화번역, 중국어번역(한중번역)의 문제점, 중국어번역(한중번역)의 사례, 중국어번역(한중번역) 외래어표기법, 중국어번역(한중번역) 한계
[교양] 한자어의 이해
문법 개념, 문법 특징, 문법 범주, 문법과 전통문법, 문법과 규범문법, 문법과 구조문법, 문법과 역사비교문법, 독일 두덴문법, 문법 교수법
한글(우리글,국어,우리말)성격,구조, 음성문자체계, 한글(우리글,국어)연구사례
오늘 본 자료
오늘 본 자료가 없습니다.
장바구니 담은 자료
장바구니가 비어 있습니다.
이 간행물 인기자료
배터리 전압 강하를 고려한 드론 모터...
클라우드 기반 파일 시스템의 오브젝...
양자 기계학습 기술의 현황 및 전망 -...
실내/실외 컨텍스트 전이를 고려한 저...
화산재해 피해 예측 시스템의 성능 향...
이 간행물 신규자료
ARM 기반 IoT 장치에서 효율적인 딥 ...
효율적인 동역학 모델 개발을 위한 모...
포지션 인코딩 기반 S³-Net를 이용한...
Self-Attention을 활용한 Siamese CNN...
소량의 대화 말뭉치에서 학습 가능한 ...
저작권 정보
본 학술논문은 ㈜누리미디어와 각 학회간에 저작권 계약이 체결된 것으로 HAPPY학술이 제공하고 있습니다. 본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
 
서비스이용약관 | 개인정보취급방침 | E-mail 수집 거부 | 제휴 및 광고문의 | FAQ
이메일 무단 수집 거부
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2003년 4월 2일]