HOME > 공학 > 산업공학 > 대한산업공학회 > Industrial Engineering & Management Systems
Language-Independent Word Acquisition Method Using a State-Transition Model -
분야 공학 > 산업공학
저자 Bin Xu Naohide Yamagishi Makoto Suzuki Masayuki Goto
발행기관 대한산업공학회
간행물정보 Industrial Engineering & Management Systems 2016년, Industrial Engineering & Management Systems Vol.15 No.3, 224page~230page(총7page)
파일형식 3085720 [다운로드 무료 PDF 뷰어]
판매가격 6,000원
적립금 180원 (구매자료 3% 적립)
이 자료를
논문의 미리보기 2페이지를 PDF파일로 제공합니다.
 
연관 논문
A Study on Word Sense Disambiguation Using Bidirectional Recurrent Neural Network for Korean Language -
An Associative Concept Dictionary for Natural Language Processing: Text Summarization and Word Sense Disambiguation
Word2vec based Latent Semantic Analysis (W2V-LSA): 새로운 토픽 모델링을 통한 블록체인 기술 연구 트렌드 분석 -
Word2vec을 활용한 문서의 의미 확장 검색방법 -
Deep Neural Network 언어모델을 위한 Continuous Word Vector 기반의 입력 차원 감소 -
 
 
목차
부제 :
ABSTRACT
1. INTRODUCTION
2. WORD SEGMENTATION
3. PREVIOUS METHOD
4. PROPOSED METHOD
5. EXPERIMENT
6. CONSIDERATION
7. CONCLUSION
REFERENCES
 
 
영문초록
The use of new words, numerous spoken languages, and abbreviations on the Internet is extensive. As such, automatically acquiring words for the purpose of analyzing Internet content is very difficult. In a previous study, we proposed a method for Japanese word segmentation using character N-grams. The previously proposed method is based on a simple state-transition model that is established under the assumption that the input document is described based on four states (denoted as A, B, C, and D) specified beforehand: state A represents words (nouns, verbs, etc.); state B represents statement separators (punctuation marks, conjunctions, etc.); state C represents postpositions (namely, words that follow nouns); and state D represents prepositions (namely, words that precede nouns). According to this state-transition model, based on the states applied to each pseudo-word, we search the document from beginning to end for an accessible pattern. In other words, the process of this transition detects some words during the search. In the present paper, we perform experiments based on the proposed word acquisition algorithm using Japanese and Chinese newspaper articles. These articles were obtained from Japan’s Kyoto University and the Chinese People’s Daily. The proposed method does not depend on the language structure. If text documents are expressed in Unicode the proposed method can, using the same algorithm, obtain words in Japanese and Chinese, which do not contain spaces between words. Hence, we demonstrate that the proposed method is language independent.
 
 
Word Segmentation, Character N-gram, Language Independent, State Transition
 
 
도움말
본 논문은 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
 
 
추천자료
[경영학] 검색엔진 시장속 구글 Google 경영전략(영문)
[레포트] google 분석
Ryanair(라이언에어) 경영전략(영문)
[마케팅] 싸이월드 마케팅전략, 마케팅성공사례분석(영문)
국제경영 영문 레포트입니다
eBay 이베이 경영전략(영문)
[신소재공정] Single Crystal 단결성
[무역경영론] Amazon.com 아마존닷컴(영문)
[전산] scheme FAQ - 1
언어학습법 TPR(Total Physical Response-전신반응교수법)(영문)
오늘 본 자료
오늘 본 자료가 없습니다.
장바구니 담은 자료
장바구니가 비어 있습니다.
이 간행물 인기자료
논문(論文) : 학생의 신앙의 자유와 중...
논문(論文) : 독일의 교육체계와 직업...
학생 훈육 수단으로서 체벌에 관한 교...
논문(論文) : "체벌" 금지에 대한 입법...
학교폭력 사안의 학교생활기록부 기재...
이 간행물 신규자료
Developing a Performance-Based Budg...
Ethical guidelines for IEMS publica...
Planning and Scheduling of Manpower...
Visualization of Skilled Worker Mot...
An Efficient Modified Immigrant Pop...
저작권 정보
본 학술논문은 ㈜누리미디어와 각 학회간에 저작권 계약이 체결된 것으로 HAPPY학술이 제공하고 있습니다. 본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
 
서비스이용약관 | 개인정보취급방침 | E-mail 수집 거부 | 제휴 및 광고문의 | FAQ
이메일 무단 수집 거부
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2003년 4월 2일]