방송통신대 2020년 02학기 중간과제물 통계데이터과학과 2024년 2학기 중간과제물
1. 역사 속에 나타난 데이터 기록의 사례를 조사하여 약술하시오. (6점)
2. 개인정보, 가명정보, 익명정보의 개념을 사례를 들어 비교하고 설명하시오. (9점)
3. 다음 <보기>와 같은 텍스트 데이터가 존재한다고 가정하자. 이 데이터가 맵리듀스 과정의 input 데이터라면 이후의 맵리듀스 과정은 어떻게 진핼될 것인지 단계별로 도시하고 설명하라. (단, Splitting 단계에서는 문장구조에 상관없이 첫 단어부터 시작하여 세 단어씩 나누어진다고 가정하자.) (9점)
4. R의 ‘rvest’ 및 ‘dplyr’ 패키지를 이용하여 관심 있는 웹페이지의 텍스트를 읽어오는 코드를 작성하고 실행해 보라. (6점)
참고자료
-
4,000원
-
1,500원
-
4,500원
-
3,500원
-
4,000원
-
4,500원
-
4,500원
-
4,500원
-
4,500원
-
4,000원