구어 일본어 형태소 정보부여를 위한형태소분석 프로그램의 활용과 문제점
분야
어문학 > 일어일문학
저자
손영석 , 이창익
발행기관
한국일본언어문화학회
간행물정보
일본언어문화 2012년, 제22권 187~205쪽(총19쪽)
파일형식
1b900513.pdf [무료 PDF 뷰어 다운로드]
  • ※ 본 자료는 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
  • 구매가격
    4,900원
    적립금
    147원 (구매자료 3% 적립)
    이메일 발송  스크랩 하기
    자료 다운로드  네이버 로그인
    영문초록
    大量の發話·發話場面デ-タにもとづいて話者の言語運用の實態が調べられる 對談番組のマルチメディア·コ-パス を、今後より多面的な分析に活用するため、コ-パスにおける40時間分の音聲文字化テキストをβ單位に分類し單位ごとに見出し語·品詞·語種を付與·搭載したが、その際、本來書きことばの解析のために開發された形態素解析プログラムを用いたことから、大量の誤解析が發生した。用いたプログラムは形態素解析システム用の日本語辭書“UniDic(1.3.12)”とオ-プンソ-ス形態素解析エンジン“MeCab(0.993)”である。そして、その解析結果の精密度を測るためにサンプリング調査を行ったところ、β單位への分類及び各種の言語情報の付與は約97.52%の精密度で自動的に解析できるということ、その精密度は對談番組の對談形式によって大きく異なるということ、誤解析は主として「終助詞·間投助詞」「擬音語·擬態語」「感情表出表現」「未登錄語(固有名詞·方言など)」「語形變化が伴った語」「非語彙的な母音·子音の擴張及び縮約が伴った語」のいずれかの言語項目において頻出するということなどが明らかになった。このように誤解析のパタ-ンを今後とも精密に記述していけば、話しことばに十全に對應できる形態素解析プログラムの開發や、誤解析の發生を경減させながら大量かつ精密に音聲を文字化する方法論の模索にもつながると考える。
    사업자등록번호 220-87-87785 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.070-8809-9397
    개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1765호 이메일 help@reportshop.co.kr
    copyright (c) 2009 happynlife. steel All reserved.