2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등

 1  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-1
 2  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-2
 3  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-3
 4  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-4
 5  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-5
 6  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-6
 7  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-7
 8  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-8
 9  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-9
 10  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-10
 11  2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등-11
※ 미리보기 이미지는 최대 20페이지까지만 지원합니다.
  • 분야
  • 등록일
  • 페이지/형식
  • 구매가격
  • 적립금
자료 다운로드  네이버 로그인
소개글
2022년 2학기 방송통신대 비정형데이터분석 중간과제물)개인정보 가명정보 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 사례를 들어 비교하고 설명 비정형데이터 분석의 중요성 맵리듀스 과정 등에 대한 자료입니다.
목차
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점)
①개인정보 ②가명정보 ③익명정보 ④교재 외 예시

2. 빅데이터 시대에 접어들어 비정형데이터 분석의 중요성이 부각되는 이유는 무엇인지 기술하고 비정형데이터 분석 상 유의점에 대해 논하시오. (6점)
1) 비정형데이터 분석의 중요성 2) 비정형데이터 분석 상 유의점

3. 다음 와 같은 텍스트 데이터가 존재한다고 가정하자. 이 데이터가 맵리듀스 과정의 input 데이터라면 이후의 맵리듀스 과정은 어떻게 진행될 것인지 단계별로 도시하고 설명하시오. (단, Splitting 단계에서는 문장구조에 상관없이 첫 단어부터 시작하여 세 단어씩 나누어진다고 가정) (9점)

4. R의 ‘rvest’ 및 ‘dplyr’ 패키지를 이용하여 관심 있는 웹페이지(교재 사례 외)의 텍스트를 읽어오는 코드를 작성하고 실행결과를 제시하시오. (6점)

5. 참고문헌
본문내용
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점)

개인정보, 가명정보, 익명정보의 차이를 설명하기에 앞서, 비식별화의 개념부터 정리할 필요가 있다. 비식별화란, 빅데이터 분석 결과물에서 개인 식별자 값이 제거 또는 알아볼 수 없도록 변환되거나 개인정보가 표본값, 평균값, 최대최소값 등으로 범주화되는 등으로 인해 개인에 대한 식별성이 제거되어도 빅데이터의 활용 목적이 상당부분 달성될 수 있다는 점에 착안하여, 이 경우 ‘개인정보’에 대해 부과되는 엄격한 규제의 적용을 전부 또는 일부 면해주는 접근방식이다.

이때 비식별화의 핵심은 어느 정도로 개인을 알아보기 어렵도록 조치해야 하느냐이다. 이에 대해 유럽의 일반 개인정보 보호법(GDPR, General Data Protection Regulation)은 가명화(pseudonymisation) 및 익명화(anonymisation)라는 개념을 제시했다. 여기서 전자(가명정보)는 개인정보 규제의 일부 면제 대상이고, 후자(익명정보)는 전부 면제 대상이 된다.

가명화란 추가 정보(additional information)의 이용 없이는 더 이상 특정 정보주체를 식별할 수 없는 방식으로 개인정보를 처리하는 것이다. 즉, 가명화된 정보는 개인정보에서 식별자를 가명(pseudonym)으로 대체함으로써 본래 식별자와 가명 사이의 대응 정보와 같은 ‘추가 정보’를 이용하지 않고는 특정 개인을 알아볼 수 없는 상태의 정보이다. 단,‘추가 정보’가 개인 식별에 이용될 수 없도록 분리 보관되는 등 기술적?관리적 조치가 요구된다. 가명화된 정보도 여전히 개인정보로 취급되지만, 공익을 위한 기록보존, 과학적?역사적 연구(사인의 영리목적 연구 포함) 또는 통계 목적의 활용이 허용된다.


익명화란, 현행 기술상 개인식별 수단으로는 원래의 개인정보를 알아볼 수 없는 상태로 만드는 것을 말한다. 익명화된 정보는 특정 개인과 연관 지을 수 없거나 그러한 식별 가능성이 완전히 제거된 정보로서 GDPR의 규제 대상이 아니다. 익명화를 위해서는 식별자가 삭제 또는 원복될 수 없는 형태로 치환되어야 하고, 식별자 이외의 나머지 정보의 경우에도 이를 통해 개인을 식별할 수 없을 정도로 개인의 고유 속성이 남아있지 않아야 한다.
참고문헌
장영재, 손원, 황희진, 비정형데이터분석, 2020.
전승재·권헌영(2018), 『개인정보, 가명정보, 익명정보에 관한4개국 법제 비교분석』. 정보법학 제22권 제3호.
국가법령정보센터 https://www.law.go.kr/
개인정보보호포털 https://www.privacy.go.kr/nns/ntc/inf/personalInfo.do
개인정보보호위원회 https://www.pipc.go.kr/np/
개인정보보호위원회·보건복지부, 보건의료 데이터활용 가이드라인 2020.8.
금융위원회·금융감독원, 금융분야 가명·익명처리 20안내서(2022.01).
비정형 데이터로부터 새로운비즈니스 인사이트를 찾아내는 방법
https://www.ibm.com/downloads/cas/NDJYNLAV
하고 싶은 말
리포트 작성에 참고하세요~

4번은 주피터 랩으로 r코드를 실행한 결과를 html파일로 첨부했습니다.
r studio 결과가 필요하시면 r코드를 복사해서 r studio에서 실행하시면 됩니다.


문단 모양(왼쪽 여백 0, 오른쪽 여백 0, 줄간격 160%)
글자 모양(굴림체, 장평 100%, 크기 11 pt, 자간 0%)

행복하세요, Now!
오늘 본 자료
더보기
  • 오늘 본 자료가 없습니다.
해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용,무단 전재·배포는 금지되어 있습니다. 저작권침해, 명예훼손 등 분쟁요소 발견 시 고객센터에 신고해 주시기 바랍니다.