HOME > 공학 > 전자공학 > 한국정보처리학회 > 정보처리학회논문지B
인공지능 : 정제된 의미정보와 시소러스를 이용한 동형이의어 분별 시스템
분야 공학 > 전자공학
저자 김준수 ( Jun Su Kim ) , 옥철영 ( Cheol Young Ock )
발행기관 한국정보처리학회
간행물정보 정보처리학회논문지B 2005년, 제12권 제7호, 829~840쪽(총12쪽)
파일형식 52805065.pdf [다운로드 무료 PDF 뷰어]
판매가격 4,200원
적립금 126원 (구매자료 3% 적립)
이 자료를
논문의 미리보기 2페이지를 PDF파일로 제공합니다.
 
연관 논문
상호정보량을 이용한 동형이의어 분별용 의미정보의 정제 -
사전의 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템 -
U-WIN 기반의 의미적 정보검색 기술 -
일한직접기계번역에서의 동형이의어 해결기법에 관한 연구 -
가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델 -
 
 
국문초록
단어 의미 중의성 해소는 자연언어처리 분야에 매우 중요한 부분이다. 본 논문에서는 사전 뜻풀이 특성을 이용해 기존의 의미정보를 정제하고 유용한 정보인 확률정보, 거리정보 및 격정보 등을 추가한WSD 모델을 제안하였으며, 사전을 기반으로 구축된 “울산대학교 어휘 지능망(UOU-Word Intelligent Network : U-WIN)”상의 단어 계층적 구조(시소러스)를 이용하여 의미정보의 자료 부족 문제를 해소하는 모델을 제시하였다. “21세기 세종 계획”에서 제공하는 150만 어절 규모의 의미 태그 말뭉치를 대상으로 한 실험에서 최다 빈도 의미 결정(Maximum Frequence Class, MFC, 정확률 베이스라인)에 비해 18.87%(명사 21.73%, 동사 17.11%) 정확률 향상을 보였으며, 기존의 확률 가중치와 어절거리 가중치를 이용한 모델에 비해서는 10.49%(명사 8.84%, 동사 11.51%)의 정확률 향상되었다. 또한 시소러스를 사용하지 않고 확률정보, 거리정보, 격정보 만을 이용한 모델에 비해 6.12%(명사 5.29%, 동사 6.64%) 높은 정확률을 보였다.
 
 
영문초록
Word Sense Disambiguation(WSD) is one of the most difficult problem in Korean information processing. We propose a WSD model with the capability to filter semantic information using the specific characteristics in dictionary definitions, and with added information, useful to sense determination, such as statistical, distance and case information. we propose a model, which can resolve the issues resulting from the scarcity of semantic information data, based on the word hierarchy system (thesaurus) developed by Ulsan Universty''s UOU Word Intelligent Network, a dictionary-based lexicological database. Among the WSD models elaborated by this study, the one using statistical information, distance and case information along with the thesaurus (hereinafter referred to as "SDJ-X model") performed the best. In an experiment conducted on the sense-tagged corpus consisting of 1,500,000 eojeols, provided by the Sejong Project, the SDJ-X model recorded improvements over the maximum frequency word sense determination (maximum frequency determination, MFC, accuracy baseline) of 18.87% (21.73% for nouns, 17.11% for verbs). The results were superior in accuracy to the model using statistical and inter-eojeol distance weights by 10.49% (8.84% for nouns, 11.51% for verbs). Finally, the accuracy level of the SDJ-X model was higher than that recorded by the model using only statistical information, distance and case information, without the thesaurus by a margin of 6.12% (5.29%for nouns, 6.64% for verbs).
 
 
단어 의미 중의성, 동형이의어, 의미정보, 시소러스, Word Sense Disambiguation, Homonym, Semantic Information, Thesaurus
 
 
도움말
본 논문은 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
 
 
추천자료
[인터넷정보검색] 인터넷정보검색의 정의, 인터넷정보검색 시스템의 변천, 인터넷정보검색의 환경변화, 인터넷정보검색의 기법, 인터넷정보검색의 과정, 인터넷정보검색의 활용 현황 분석
[인터넷 정보검색][정보검색][인터넷 정보검색 적합성][인터넷 정보검색 연산자]인터넷 정보검색의 의미, 인터넷 정보검색의 내용, 인터넷 정보검색의 분류, 인터넷 정보검색의 적합성, 인터넷 정보검색 연산자 분석
사서직 공무원 정보봉사론 기출문제 모음
공무원 국어 기출문제(국가직7급,국가직9급,국회8급,경찰공무원,군무원)
환경기술(ET)의 혁신 연구
인터넷 정보검색시스템과 검색엔진, 인터넷 정보검색시스템과 정보검색, 인터넷 정보검색시스템과 적합평가, 인터넷 정보검색시스템과 인덱싱, 인터넷 정보검색시스템과 WWW(월드와이드웹), TREC(세계검색컨퍼런스)
[데이터베이스] 시소러스(THESAURUS)
[데이터마이닝] 데이터마이닝의 처리과정, 데이터마이닝의 기술 활용, 데이터마이닝 활용 사례, 데이터마이닝의 한계점, 데이터마이닝의 주의사항에 관한 심층 분석
[문헌정보]정보검색론 정리
인터넷정보검색과 WWW(월드와이드웹), 인터넷정보검색과 검색엔진, 인터넷정보검색과 TREC(세계검색컨퍼런스), 인터넷정보검색과 인덱싱, 인터넷정보검색과 정보봉사, 인터넷정보검색과 색인언어 분석
오늘 본 자료
오늘 본 자료가 없습니다.
장바구니 담은 자료
장바구니가 비어 있습니다.
이 간행물 인기자료
2차원 전기영동 영상의 단백질 반점 ...
영상처리 : 부분 최소제곱법을 이용한...
음성처리 : 화자독립 음성인식을 위한...
멀티미디어 : 퍼지 필터링 구조를 이...
대역폭 감소를 적용한 MPEG-4 미디어 ...
이 간행물 신규자료
적응적 다중 시드 영역 확장법을 이용...
복수객체의 윤곽추출을 위한 스네이크...
시각장애인을 위한 사물 감지 기술 연...
제품유형에 따른 웹쇼핑 소비자의 조...
GPU 병렬성을 이용한 문서 유사도 계...
저작권 정보
본 학술논문은 한국학술정보㈜ 각 학회간에 저작권 계약이 체결된 것으로 HAPPY학술이 제공하고 있습니다. 본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
 
서비스이용약관 | 개인정보취급방침 | E-mail 수집 거부 | 제휴 및 광고문의 | FAQ
이메일 무단 수집 거부
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2003년 4월 2일]