HOME > 공학 > 전자공학 > 한국정보처리학회 > 정보처리학회논문지D
데이터베이스 : 비트맵을 사용한 닫힌 빈발 시퀀스 마이닝
분야 공학 > 전자공학
저자 김형근 ( Hyung Geun Kim ) , 황환규 ( Whan Kyu Whang )
발행기관 한국정보처리학회
간행물정보 정보처리학회논문지D 2005년, 제12권 제6호, 807~816쪽(총10쪽)
파일형식 52805082.pdf [다운로드 무료 PDF 뷰어]
판매가격 4,000원
적립금 120원 (구매자료 3% 적립)
이 자료를
논문의 미리보기 2페이지를 PDF파일로 제공합니다.
 
연관 논문
트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석
데이터베이스 : 의미 정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구
다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석
상위 K 하이 유틸리티 패턴 마이닝 기법 성능분석
감사데이터 분석을 위한 마이닝 시스템 설계 및 구현 -
 
 
국문초록
순차 패턴 탐사에 대한 연구는 대용량의 데이터베이스에서 사용자에 의해 주어지는 최소 지지도를 만족하는 빈발 시퀀스를 찾는 문제를 다룬다. 하지만 현재까지 이루어진 순차 패턴 탐사 방법은 빈발 시퀀스들의 길이가 길어지거나 최소 지지도가 상대적으로 낮게 주어진 상황에서는 생성되는 시퀀스가 기하급수적으로 많아져서 성능이 급격히 저하되는 문제점을 가지고 있다. 본 논문에서는 이 문제를 해결하기 위해서 모든 빈발 시퀀스의 정보를 포함하며 그 수가 현저히 적은 닫힌 빈발 시퀀스를 찾는 방법을 제안한다. 제안하는 알고리즘은 효율적으로 가지치기를 수행하기 위해서 깊이우선 탐색 방법으로 후보 시퀀스를 생성하고 데이터베이스를 비트맵으로 표현하여 비트 연산으로 지지도를 효율적으로 계산한다. 또한, 비트맵으로 표현된 시퀀스 특성을 이용하여 가지치기할 시퀀스를 적은 연산 비용으로 찾을 수 있다. 이런 장점을 통하여 제안한 방법이 지금까지 제안된 알고리즘보다 훨씬 빨리 닫힌 빈발 시퀀스를 찾는 것을 성능 실험을 통하여 확인하였다.
 
 
영문초록
Sequential pattern mining finds all of the frequent sequences satisfying a minimum support threshold in a large database. However, when mining long frequent sequences, or when using very low support thresholds, the performance of currently reported algorithms often degrades dramatically. In this paper, we propose a novel sequential pattern algorithm using only closed frequent sequences which are small subset of very large frequent sequences. Our algorithm generates the candidate sequences by depth-first search strategy in order to effectively prune. Using bitmap representation of underlying databases, we can effectively calculate supports in terms of bit operations and prune sequences in much less time. Performance study shows that our algorithm outperforms the previous algorithms.
 
 
순차 패턴 마이닝, 닫힌 순차 패턴, Sequential Pattern Mining, Closed Sequential Pattern
 
 
도움말
본 논문은 참고용 논문으로 수정 및 텍스트 복사가 되지 않습니다.
 
 
추천자료
[database데이터베이스] 웹사용마이닝 (WEB USAGE MINING)
[데이터베이스] Web Usage Mining 웹사용마이닝
[레포트] postgresql에 관하여
[졸업][컴퓨터공학] Microsoft Visual Basic 6.0과 Visual Basic .NET의 호환성 분석
[경영정보] 제조업 & 유통업 & 물류업과 전자상거래, 소셜커머스 데이터마이닝 분석
[전산] 비베스크립트
[멀티미디어] 멀티미디어의 기원, 발전, 특성과 멀티미디어의 응용, 활용 및 멀티미디어 교육 그리고 멀티미디어의 교육적 활용에 관한 분석
영화란 무엇인가
[정보기술][IT]정보기술(IT)과 문헌정보제공서비스, 도서관, 정보기술(IT)과 정보사회, 비생산적 노동, 정보기술(IT)과 직업교육, e-비즈니스, 정보기술(IT)과 CRM(고객관계관리), DRM(디지털저작권관리) 분석
[노턴의 컴퓨터개론, 정보사회와 컴퓨터] 노턴의 컴퓨터개론 문제와 답 (1장~14장)
오늘 본 자료
오늘 본 자료가 없습니다.
장바구니 담은 자료
장바구니가 비어 있습니다.
이 간행물 인기자료
데이타베이스 : 단축-경로와 확장성 ...
소프트웨어 공학 : 훈련데이터 집합을...
데이터베이스 : 순차패턴에 기반한 XM...
데이터베이스 : 불확실한 시간 간격을...
소프트웨어 공학 : 디자인 패턴에 대...
이 간행물 신규자료
한글 형태소 및 키워드 분석에 기반한...
TK-Indexing: NoSQL 기반 SNS 데이터 ...
UML 상태 기계를 이용한 임베디드 소...
레퍼런스 흐름에 기반한 디자인 패턴...
웹 서비스 합성 구성을 위한 QoS고려 ...
저작권 정보
본 학술논문은 한국학술정보㈜ 각 학회간에 저작권 계약이 체결된 것으로 HAPPY학술이 제공하고 있습니다. 본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
 
서비스이용약관 | 개인정보취급방침 | E-mail 수집 거부 | 제휴 및 광고문의 | FAQ
이메일 무단 수집 거부
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2003년 4월 2일]