사용하는 기술이다.
빅데이터의 분석 인프라
분석 인프라 - 하둡
하둡(Hadoop)은 오픈소스 분산 처리 기술 프로젝트로 HDFS, Hbase, MapReduce로 구성되어 있다.
대형 스토리지 (HDFS) 를 구성하고, HDFS에 저장된 거대한 데이터셋을 간편하게 처리 할 수 있는 Java 기반의 MapReduce 프레임워크를 제공한다.
MapReduce) 엔진이 포함되어 있다. 또한 필요한 자바 아카이브 파일(Java ARchive, JAR)들과 하둡을 시작할 스크립트, 소스 코드들과 관련 자료들로 구성되어 있다. 작은 하둡 클러스터에는 하나의 마스터와 여러 워커 노드들로 구성 되어 있다. 마스터 노드들은 잡트렉커(JobTracker), 테스크트렉커(TaskTracker), 네임
MapReduce
과거 산업 발전 동향을 보면 정부 움직임이 막대한 영향을 줬다. 이 때문에 올해 빅데이터 시장이 크게 개화할 것으로 예상한다.
빅데이터는 대용량 데이터를 분석해 가치 있는 정보를 추출하고 이 지식을 바탕으로 위기에 대응하거나 변화를 예측하는 정보기술이다.
최근 데이터 양 증가 추이
목차
1. 서론 [클라우드 컴퓨팅 활동이란?]
2. 본론
1) amazon.com
2) amazon.com 의 클라우드 컴퓨팅 유형 및 활동조사
3. 결론
4. 참고자료
1. 서론 [클라우드 컴퓨팅 활동이란?]
Amazon.com은 세계 최대 온라인 마켓플레이스 중 하나로, 다양한 제품과 서비스를 제공하고 있습니다. 이 회사는 또한 전 세계적으로
1. 개인정보, 가명정보, 익명정보의 개념을 약술하고 각 개념에 대해 구체적인 (교재 외의 독창적인) 사례를 들어 설명하시오. 또한 가명정보 활용이 개인에게 미치는 영향에 관해 개인정보 보호의 입장에서 논하시오. (9점)
1) 개인정보, 가명정보, 익명정보의 개념을 약술하고 각 개념에 대해 구체적
(1) 다음을 정리하여 서술하시오. (8점)
① 데이터과학자 ② 빅데이터 확산 배경
① 데이터과학자
빅데이터란, 데이터의 규모가 크고, 다양한 형태를 가지며, 생성-유통-소비의 순환이 매우 빠르게 일어나서 기존의 방식으로는 관리·분석하기 어려운 데이터로 규모(Volume), 다양성(Variety), 속도(
미래의과학
빅데이터 활용 사례에 대해
차 례
1.
서론
2.
본론
1) 빅테이터란?
2) 빅데이터의 중요성과 문제점
3) 빅데이터 활용사례
4) 나의 의견
3.
결론
4.
참고문헌
1. 서론
4차 산업혁명시대와 디지털대전환시대를 맞아 큰 관심을 받고 있는 분야가 바로 빅데이터이다. 빅데이터는 원론적인 의미로는 대
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점)
개인정보, 가명정보, 익명정보의 차이를 설명하기에 앞서, 비식별화의 개념부터 정리할 필요가 있다. 비식별화란, 빅데이터 분석 결과물에서 개인 식별자 값이 제거 또
빅데이터(Big Data)가 새로운 미래기술로 주목받고 있다. 급속한 정보통신기술(Information and communication technology)의 발전과 이를 활용한 전자기기의 보급으로 생성된 대용량의 디지털 정보를 빅데이터라고 한다. 미래 기업과 국가의 경쟁력을 결정할 핵심요소로 빅데이터의 중요성이 높아지면서 세계 각국
1. Trends in Analytical Techniques
The most popular word that describes today’s analytics is machine learning. In almost every analytical application that companies develop today involves in machine learning techniques. For example, decision trees predict which employee is likely to leave or which customer will stop using a cell phone service. In customer recommendation systems, KNN (K Nearest