HOME > 공학 > 로봇 > 한국정보과학회 > 정보과학회논문지
소량의 대화 말뭉치에서 학습 가능한 효과적인 생성 기반 챗봇 모델 -
분야 공학 > 로봇
저자 김진태 이현구 김학수
발행기관 한국정보과학회
간행물정보 정보과학회논문지 2019년, 정보과학회논문지 제46권 제3호, 246page~252page(총7page)
파일형식 3673235 [다운로드 무료 PDF 뷰어]
판매가격 6,000원
적립금 180원 (구매자료 3% 적립)
이 자료를
논문의 미리보기 2페이지를 PDF파일로 제공합니다.
 
연관 논문
한국어 튜터링 챗봇을 위한 말뭉치 구축의 필요성과 방법론
[인공지능, 신경망 및 퍼지시스템] 특정 화자 대화생성을 위한 이중 정책망 강화학습 -
사용자 모델을 이용한 대화 전략의 효과적인 학습 -
한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 -
BERT 모델과 지식 그래프를 활용한 지능형 챗봇 -
 
 
목차
부제 : Effective Generative Chatbot Model Trainable with a Small Dialogue Corpus
요약
Abstract
1. 서론
2. 관련 연구
3. 효율적인 학습 방법과 복합 표현 단위 인코딩-디코딩 기반 챗봇 모델
4. 실험
5. 결론
References
 
 
국문초록
잘 알려진 검색 기반 챗봇 모델과 다르게 생성 기반 챗봇 모델은 사전에 정의된 응답에 의존하지 않고 학습된 신경망 모델을 사용하여 새로운 응답을 생성한다. 하지만 생성 기반 챗봇 모델은 발화-응답 쌍의 형태를 가진 대용량의 대화 말뭉치가 필요하다. 학습 말뭉치가 충분하지 않은 경우 구문론적 오류가 발생한다. 본 논문은 이 문제를 해결하기 위해 인코딩-디코딩 단위를 형태소와 음절이 복합적으로 사용된 시퀀스-투-시퀀스 신경망 기반의 챗봇을 제안한다. 또한 대용량의 비 대화 말뭉치를 이용하여 사전 학습하고 소량의 대화 말뭉치를 이용하여 재학습하는 2단계 학습 방법을 제안한다. 소량의 대화 말뭉치(47,089개의 발화-응답 쌍 학습 데이터와 3,000개의 발화-응답 쌍 평가 데이터)를 사용한 실험에서 제안한 인코딩-디코딩 단위는 미등록어 문제를 감소시키는데 도움을 주었고, 2단계 학습 방법은 BLEU와 ROUGE와 같은 성능 향상에 도움을 주었다.
 
 
영문초록
Contrary to popular retrieval-based chatbot models, generative chatbot models do not depend on predefined responses, but rather generate new responses based on well-trained neural networks. However, they require a large number of training corpus in the form of query-response pairs. If the training corpus are insufficient, they make grammatical errors emanating from out-of-vocabulary or sparse data problems, mostly in longer sentences. To overcome this challenge, we proposed a chatbot model based on sequence-to-sequence neural network using a mixture of words and syllables as encoding-decoding units. Moreover, we proposed a two-step training procedure involving pre-training using a large non-dialogue corpus and retraining using a smaller dialogue corpus. In the experiment involving small dialogue corpus (47,089 query-response pairs for training and 3,000 query-response pairs for evaluation), the proposed encoding-decoding units resulted to a reduction in out-of-vocabulary problem while the two-step training method led to improved performance measures like BLEU and ROUGE.
 
 
인코딩-디코딩 단위, 생성 기반 챗봇, 2단계 학습 방법, 소량의 대화 말뭉치, small dialogue corpus, generative chatbot, encoding-decoding unit, two-step training
 
 
도움말
본 논문은 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
 
 
추천자료
배달의 민족 마케팅전략
[디지털시대 경영전략]디지털시대 경영전략의 필요성, 디지털시대 경영전략의 요소, 디지털시대 경영전략의 E비즈니스(E-biz, 이비즈니스), 디지털시대 경영전략 사이버 커뮤니티, 향후 디지털시대 경영전략 방향
[현대경영]KRP이론을 바탕으로 한 세계화 기업 경영 발전
대학에서의 강의 담화에 대한 조사 연구
[A+ 레포트] 인공지능
인공지능AI의 현황, 사례 및 전망 분석
[국어] 문법교육의 연구동향과 발전방향 -문법교육의 필요성과 초등문법교육의 비판과 개선을 중심으로
[심리학] 변형된 비속어가 정서에 미치는 영향에 대해 -인터넷상에서 비속어로 변형되어 쓰이는 일반단어를 중심으로
[인공지능] 인공지능의 역사와 응용분야
[국어교육] 구어 문법의 개념과 언어 교육적 의의(비판적 담화분석, 실세계 중심적 수행 중심적 언어 교육, 기능 중심 교육의 한계 극복)
오늘 본 자료
오늘 본 자료가 없습니다.
장바구니 담은 자료
장바구니가 비어 있습니다.
이 간행물 인기자료
배터리 전압 강하를 고려한 드론 모터...
클라우드 기반 파일 시스템의 오브젝...
양자 기계학습 기술의 현황 및 전망 -...
실내/실외 컨텍스트 전이를 고려한 저...
화산재해 피해 예측 시스템의 성능 향...
이 간행물 신규자료
이중 포물면 맵 기반 실시간 간접조명...
깊이 범위 이동 및 압축을 이용한 실...
국방 임베디드 소프트웨어를 위한 컴...
테스트 계획 및 IUT에서 추출한 정보...
Concolic Testing 기법을 활용한 프로...
저작권 정보
본 학술논문은 ㈜누리미디어와 각 학회간에 저작권 계약이 체결된 것으로 HAPPY학술이 제공하고 있습니다. 본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
 
서비스이용약관 | 개인정보취급방침 | E-mail 수집 거부 | 제휴 및 광고문의 | FAQ
이메일 무단 수집 거부
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2003년 4월 2일]