하둡 분산 파일 시스템
1) 데이터과학자
데이터과학자(data scientist)란 데이터를 수집, 정리, 조사, 분석, 가시화할 수 있는 전문가이다. 사이버 공간에서 거의 2년마다 2배에 가까운 속도로 증가하는 크고 복잡한 데이터를 수집하고 저장하는 기술, 방대하고 복잡한 데이터에서 의미있는 데이터 집합
▶ 아파치 하둡(Hadoop, High-Availability Distributed Object-Oriented Platform)
아파치 하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 하둡은 하둡 공통 패키지로 구성되어 있다. 이 패키지에는 하둡 파일 시스템(HD
데이터마이닝을 간단하게 말하다면 데이터 분석이라고 할 수 있을 것이다. 굳이 데이터마이닝이라는 개념이 알려지기 전의 데이터 분석과는 구분을 하고 의미를 찾고자 한다면, “복잡성이 높은 데이터 분석에 인공지능(artificial intelligence)이나 패턴인식(pattern recognition) 등에서 연구되어 오고 있는 기
3. 쿠팡
소셜커머스 쿠팡은 올해 처음 시도한 빅데이터 분석으로 재미를 톡톡히 봤다. 지난해만 해도 여행•문화 상품은 구매이력이 있는 사람에게 집중적으로 이메일을 보내 재구매를 유도해왔다. 올해는 구매이력에 웹페이지 내에서 여행•문화 상품에 대한 조회, 클릭, 이동 경로와 같은 웹로그 이
1. 빅데이터 솔루션 도입 프로젝트 경험이 있으신가요?(하둡,DW구축)
1.1 경험이 있으시다면 구체적으로 맡으신 역할은 무엇이고 어떤 솔루션으로 진행했나요?
1.2 진행당시의 본인이 맡았던 솔루션의 장단점은 무엇인가요?
2. 하둡이나 빅데이터 시스템을 도입하는데 가장 고려해야하는게 무엇이라고