▶ 아파치 하둡(Hadoop, High-Availability Distributed Object-Oriented Platform)
아파치 하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 하둡은 하둡 공통 패키지로 구성되어 있다. 이 패키지에는 하둡 파일 시스템(HD
데이터마이닝을 간단하게 말하다면 데이터 분석이라고 할 수 있을 것이다. 굳이 데이터마이닝이라는 개념이 알려지기 전의 데이터 분석과는 구분을 하고 의미를 찾고자 한다면, “복잡성이 높은 데이터 분석에 인공지능(artificial intelligence)이나 패턴인식(pattern recognition) 등에서 연구되어 오고 있는 기
- AGILE -
‘애자일(Agile)’이란 용어는 소프트웨어 개발 방식의 하나로 많이 쓰이는 말이다. 개발 및 작업 계획을 짧은 단위로 세우고 시제품을 만들어 나가는 사이클을 반복함으로써 고객의 요구 변화에 유연하고도 신속하게 대응하는 개발 방법론이다. 이와 반대되는 개념이 전통적 개발 방법론이라
사용하는 기술이다.
빅데이터의 분석 인프라
분석 인프라 - 하둡
하둡(Hadoop)은 오픈소스 분산 처리 기술 프로젝트로 HDFS, Hbase, MapReduce로 구성되어 있다.
대형 스토리지 (HDFS) 를 구성하고, HDFS에 저장된 거대한 데이터셋을 간편하게 처리 할 수 있는 Java 기반의 MapReduce 프레임워크를 제공한다.
서론:
빅데이터는 현대 사회에서 빠르게 중요성을 갖추고 있는 주제 중 하나로, 정보의 수집과 분석을 통해 가치를 창출하는 데 핵심 역할을 합니다. 이 레포트에서는 빅데이터의 3V 개념을 자세하게 이해하고, 빅데이터가 주목받기 시작한 결정적인 계기를 깊이 파헤치며, 빅데이터와 미래에 대한 전