SAS 데이터 생성하기 */
PROC IMPORT DBMS=XLSX
DATAFILE="/home/u61253617/data_1_1.xlsx"
OUT=data_1_1
REPLACE;
RUN;
/* SAS 데이터 인쇄하기 */
PROC SORT DATA=data_1_1;
BY SEX; /* 성별로 순서화 */
RUN;
PROC PRINT DATA=data_1_1;
ID ID; /* OBS 생략 */
BY SEX;
RUN;
②기술통계량
/* MEANS 절차를 이용한
패키지를 사용하여 벡터와 행렬 등 배열을 사용하는 것이 더 편리하다." (p42)
R에서 데이터프레임은 data.frame 함수로 생성한다.
data.frame(..., row.names = NULL, stringsAsFactors = default.stringsAsFactors())
여기서 '...'은 데이터프레임을 구성할 원소를 설정한다.
벡터의 이름을 나열하거나 matrix 형식의 자료를 입
(1) 체중의 줄기 잎 그림과 히스토그램을 그리고 설명하라.
위 표를 엑셀 파일로 만들어 SPSS에서 파일>데이터 가져오기(D)>Excel 클릭하여 엑셀파일을 읽는다(아래 왼쪽 그림 참고). 분석>기술통계량>데이터 탐색에서 종속변수로 체중을 선택한다. 도표 클릭 후 기술통계에서 상자도표는 지정하지 않음을
순이다. 우측 꼬리가 긴 분포로 젊은 직원들이 많은 것으로 보아 최근 신규채용을 많이 한 성장 중인 회사로 추측된다.
● 아래의 상자그림을 함께 보면 중앙값인 32세 등 다섯 수치 요약이 잘 나타나 있으며 여기서도 우측 꼬리가 긴 분포임이 드러난다(SAS 결과에서 다섯 수치 요약이 더욱 잘 드러남).