HOME > 공학 > 전자공학 > 한국정보처리학회 > 정보처리학회논문지B
인공지능 : 학습방법개선과 후처리 분석을 이용한 자동문서분류의 성능향상 방법
분야 공학 > 전자공학
저자 최윤정 ( Yun Jeong Choi ) , 박승수 ( Seung Soo Park )
발행기관 한국정보처리학회
간행물정보 정보처리학회논문지B 2005년, 제12권 제7호, 811~822쪽(총12쪽)
파일형식 52805063.pdf [다운로드 무료 PDF 뷰어]
판매가격 4,200원
적립금 126원 (구매자료 3% 적립)
이 자료를
논문의 미리보기 2페이지를 PDF파일로 제공합니다.
 
연관 논문
전자우편 문서의 자동분류를 위한 다중 분류기 결합 -
어휘별 분류기를 이용한 한국어 품사 부착의 성능 향상 -
자질 선택 기법을 이용한 한국어 화행 결정 -
가중치가 부여된 베이지안 분류자를 이용한 스팸 메일 필터링 시스템 -
빌딩의 지속가능 에너지환경 분석 및 평가를 위한 기초 연구 - 주거용 건물의 에너지환경 실적정보를 중심으로
 
 
국문초록
자동문서분류는 문서의 내용에 기반하여 미리 정의된 항목에 자동으로 할당하는 작업으로서 효율적인 정보관리 및 검색등에 필수적인 작업이다. 기존의 문서분류성능 향상을 위한 연구들은 대부분 분류모델 자체를 개선시키는 데 주력해왔으며 통계적인 방법으로 그범위가 제한되어왔다. 본 연구에서는 자동문서분류의 성능향상을 위해 데이터마이닝 기법과 결함허용방법을 이용하는 개선된 학습알고리즘과 후처리 방법에 의한 RTPost 시스템을 제안한다. RTPost 시스템은 학습문서 선택작업 이전에 분류항목 설정의 문제를 다루며, 분류함수의 성능보다는 지정방식의 문제점을 감안하여 학습과 분류 후처리 프로세스를 개선하려는 것이다. 이를 통해 분류결과에 중요한 영향을 미쳐왔던 학습문서의 수와 선택방법, 분류모델의 성능등에 의존하지 않는 안정적인 분류가 가능하였고, 이를 분류오류율이 높은 경계선 인접영역에 위치한 문서들에 적용한 결과 높은 정확율을 얻을 수 있었다. 뿐만 아니라, RTPost 프로세스를 진행하는 동안 능동학습방법의 장점을 수용하여 학습효과는 높이며 비용을 감소시킬 수 있는 자가학습방법(self learning)방법의 효과를 기대할 수 있다.
 
 
영문초록
Automated text categorization is to classify free text documents into predefined categories automatically and whose main goals is to reduce considerable manual process required to the task. The researches to improving the text categorization performance(efficiency) in recent years, focused on enhancing existing classification models and algorithms itself, but, whose range had been limited by feature based statistical methodology. In this paper, we propose RTPost system of different style from any traditional method, which takes fault tolerant system approach and data mining strategy. The 2 important parts of RTPost system are reinforcement training and post-processing part. First, the main point of training method deals with the problem of defining category to be classified before selecting training sample documents. And post-processing method deals with the problem of assigning category, not performance of classification algorithms. In experiments, we applied our system to documents getting low classification accuracy which were laid on a decision boundary nearby. Through the experiments, we shows that our system has high accuracy and stability in actual conditions. It wholly did not depend on some variables which are important influence to classification power such as number of training documents, selection problem and performance of classification algorithms. In addition, we can expect self learning effect which decrease the training cost and increase the training power with employing active learning advantage.
 
 
자동 문서분류기법, 능동적학습방법, 자가학습방법, 계층적 분류, 텍스트마이닝, 데이터마이닝, 결함허용기법, Automated Text Categorization(classification), Active Learning, Self Learning, Hierarchical Classification, Text Mining, Data Mining, Fault Detection
 
 
도움말
본 논문은 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
 
 
추천자료
[학습장애아] 학습장애아의 정의, 분류, 특성, 원인, 영향과 학습장애아를 위한 교육프로그램 및 학습장애아의 교육방법, 학습장애아의 치료방법 분석
[다중지능이론] 다중지능(다중지능이론)의 정의와 종류, 다중지능(다중지능이론)의 특성, 다중지능(다중지능이론)적용 교수학습의 사례, 다중지능(다중지능이론)적용 교수학습의 과정과 교육학습의 방법, 다중지능(다중지능이론)에 대한 평가 분석
[교육연구]교육연구의 정의,분류, 교육연구의 필요성,제한성, 교육연구의 절차,지식획득방법, 교육연구의 개선 방안 분석
팀티칭(협력교수)의 정의와 원리, 팀티칭(협력교수)의 분류, 팀티칭(협력교수)의 필요성, 팀티칭(협력교수)의 학습전개과정, 팀티칭(협력교수)의 장단점, 팀티칭(협력교수)의 평가, 팀티칭(협력교수) 지도방법 분석
[미디어교육]미디어교육의 정의,변천,목적, 미디어교육의 현황,활동영역,영역별분석기준, 미디어교육의 교수학습방법,문제점,개선방안
[금연][금연프로그램]금연의 분류,과정,유익, 금연프로그램의 단계,방법, 금연프로그램의 고려사항, 금연프로그램의 개선 방안 분석
[학습장애, 학습장애아] 학습장애의 분류, 특성과 학습장애아의 치료방법, 교육방법 및 학습장애아의 진단, 평가 분석
[다중지능, 다중지능이론] 다중지능(다중지능이론)의 개념, 영역과 다중지능(다중지능이론)의 평가방법, 이용 및 다중지능(다중지능이론)의 교육과정에의 적용 분석
[학습장애, 학습장애아] 학습장애의 체제, 분류, 특징과 학습장애아의 출현율, 원인 및 학습장애아의 지도방법, 학습장애아의 학습방법 분석
[환경교육]환경교육의 특징,목적, 환경교육의 중요성,내용, 환경교육의 교수학습방법,문제점, 환경교육의 외국 사례,개선 과제 분석
오늘 본 자료
오늘 본 자료가 없습니다.
장바구니 담은 자료
장바구니가 비어 있습니다.
이 간행물 인기자료
2차원 전기영동 영상의 단백질 반점 ...
영상처리 : 부분 최소제곱법을 이용한...
음성처리 : 화자독립 음성인식을 위한...
멀티미디어 : 퍼지 필터링 구조를 이...
대역폭 감소를 적용한 MPEG-4 미디어 ...
이 간행물 신규자료
적응적 다중 시드 영역 확장법을 이용...
복수객체의 윤곽추출을 위한 스네이크...
시각장애인을 위한 사물 감지 기술 연...
제품유형에 따른 웹쇼핑 소비자의 조...
GPU 병렬성을 이용한 문서 유사도 계...
저작권 정보
본 학술논문은 한국학술정보㈜ 각 학회간에 저작권 계약이 체결된 것으로 HAPPY학술이 제공하고 있습니다. 본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
 
서비스이용약관 | 개인정보취급방침 | E-mail 수집 거부 | 제휴 및 광고문의 | FAQ
이메일 무단 수집 거부
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2003년 4월 2일]