EMDI는 지금도 개발중

R데이터분석 : 데이터 프레임 만들기 본문

IT/R 데이터분석

R데이터분석 : 데이터 프레임 만들기

EMDI 2019. 8. 29. 10:53

은 컬럼(column) 또는 변수(variable) = 속성 / 은 각 한사람의 정보를 나타낸다. 로(Row), 케이스(Case)

 

#데이터 프레임 만들기 data.frame()

영어와 수학 변수를 만들고 해당 변수 안에 4개씩 점수를 부여합니다.

english <- c(90,80,60,70)

math <- c(50,60,100,20)

 

data.frame(english, math)를 입력하면 아까 전에 부여했던 점수들이 순서대로 나열되면서 표형식이 만들어지는 것을 확인할 수 있습니다. 그것을 df_midterm 변수 안에 넣어봅니다.

해당 과목의 평균을 구하려면 mean() 함수를 이용해서 값을 도출합니다.

mean(df_midterm$english)

 

#데이터 프레임 한번에 만들어보기

Q. 데이터 프레임을 한꺼번에 만들어보고 해당 데이터 중 가격의 평균과 판매량의 평균을 구하시오.

#외부데이터 이용하기

1. 엑셀파일 불러오기

엑셀파일을 불러오려면 우선 엑셀파일을 읽을 수 있는 패키지를 설치해야합니다.

install.packages("readxml")

library(readxml)

* 파일을 입력할 때에는 꼭 확장자명까지 입력해야합니다

#만약 엑셀파일이 프로젝트 폴더 내에 있으면 해당 엑셀 파일명만 입력 가능

df_exam <- read_excel("test.xlsx") 

 

#만약 엑셀파일이 프로젝트 폴더가 아닌 다른 경로에 있다면 해당 경로까지 입력

df_exam <- read_excel("d:/excel/test.xlsx") 

 

#엑셀 내에 데이터 불러오기

만약 위의 사진과 같이 첫 번째행이 변수명이 아니고 그냥 데이터만 있는 경우에는 꼭 col_names 파라미터를 넣어줘야한다.

df_exam <- read_excel("test.xlsx", col_names = F)

* 파라미터는 col_names이고 값은 대문자 F를 넣어야합니다

 

#엑셀 파일에 시트가 여러 개 있다면?

df_exam <- read_excel("test.xlsx", sheet =2)

 

2. CSV 파일 불러오기

read_excel을 한 것과 유사하게 CSV는 read.csv()를 이용하면 CSV파일을 가져올 수 있습니다.

첫 번째 행에 변숩명이 없는 CSV파일을 불러올 때에는 header = F를 지정해주면 됩니다.

* read_excel에서는 col_names=F 이고 read_csv에서는 header=F 까먹지 말기!!!

 

wirte.csv(저장할 데이터프레임명, file=저장할 파일명 및 확장자)

저장할 때는 write.csv(df_exam, file="text_csv.csv")

 

3. 데이터 삭제

rm()을 이용하면 데이터를 삭제할 수 있습니다.

rm(df_exam)

 

 

 

Comments