일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 자바스크립트forinforof차이
- PostgreSQL
- 파이썬
- 자바스크립트날짜형식
- 자바스크립트for문
- forof문
- speechAPI
- 청소년복지론
- speechtoText
- 장고프로젝트
- R데이터분석
- 장고웹
- 다른테이블에속해있습니다
- 이행은이미다른테이블에속해있습니다
- Python
- 사례관리
- 장고웹프로젝트
- 이행은이미다른
- 자바스크립트날짜
- 안드로이드
- cmd명령어
- 개발
- 오류종류
- 자바스크립트수학
- sqlite
- webkitrecognition
- javaScriptError
- Android
- 장고
- 자바스크립트날짜get
- Today
- Total
목록IT/R 데이터분석 (7)
EMDI는 지금도 개발중
* ggplot2는 그래프를 만들 때 가장 많이 사용하는 패키지. ggplot2문법은 레이어 구조로 되어 있음. 배경을 만들고, 그 위에 그래프 형태, 마지막으로 축 범위, 색, 표식 등 설정을 추가하는 순서로 그래프를 만듦. 1. 산점도 - 변수 간 관계 표현하기 geom_point() 산점도 : 데이터를 x축과 y축에 점으로 표현한 그래프. 나이와 소득처럼 연속 값으로 된 두 변수의 관계를 표현할 때 사용됩니다. library(ggplot2); // ggplot2 패키지를 사용하기 위해 로드하기 1) 배경설정하기 // x축은 displ(배기량) y축은 hwy(고속도로 연비)로 지정해 배경 생성 ggplot(data = mpg, aes(x=displ, y=hwy)) 2) 그래프추가하기 ggplot 함수..
저번 글에서는 데이터 정제 중 빠진데이터 제거하기, 결측치 정제에 대해 배우는 시간이었습니다. 잠시 복습하는 겸 결측치 정제를 다시 확인하고 그 다음 바로 이상한 데이터 제거하기, 이상치 정제에 대해 글을 써보도록하겠습니다. 결측치 정제에 대해 복습 * 결측치 확인 및 출력 is.na(df); //결측치 확인 table(is.na(df)); //결측치 빈도 출력 * is.na()를 filter()에 적용하면 결측치가 있는 행을 제거할 수 있다. 먼저 결측치가 있는 행만 추출한 다음 제거하기! df %>% filter(is.na(score)) df % filter(!is.na(score)) // is.na()앞에 '아니다'를 의미하는 ! 기호를 붙여 !is.na()를 입력하면 NA가 아닌 값을 출력할 수 ..
1. 데이터 결측치 찾기 * 샘플데이터 만들기 df % filter(is.na(score)) df % filter(!is.na(score)) // is.na()앞에 '아니다'를 의미하는 ! 기호를 붙여 !is.na()를 입력하면 NA가 아닌 값을 출력할 수 있다. df %>% filter(is.na(sex)) df % filter(!is.na(sex)) 3. 결측치가 하나라도 있으면 바로 제거할 수 있는 함수 na.omit() * na.omit()은 결측치가 하나라도 있으면 모두 제거하기 때문에 간편한 측면이 있지만, 분석에 필요한 행까지 제거할 수 있다는 단점이 있다. df_nomiss % summarise(mean_math = mean(math, na.rm = T), sum_math = sum(mat..
1. 데이터 가공하기 * 해당 함수들도 전 글에서 사용했던 dplyr 함수입니다. filter() : 행 추출 1) %>% 파이프 연산자 : ctrl + shift + m 단축키 ex) exam %>% filter(class == 1) #exam에서 class가 1인 경우만 추출해서 출력 filter를 이용해서 아래와 같이 출력할 수 있습니다. 그 외 쓸 수 있는 filter 조건 exam %>% filter(math > 50 & class == 1); #& and문 exam %>% filter(math > 50 | class != 1); #| or문 2) %in% 매치 연산자 ex) exam %>% filter(class %in% c(1, 3)); #1반, 3반에 해당하면 추출 * 위와 같이 여러 수를..
1. 데이터를 파악할 때 쓰는 함수들 head() : 데이터 앞부분 출력 ex) head(df_exam) - 앞에서부터 6행까지 출력 ex) head(df_exam, 10) - 앞에서부터 10행까지 출력 tail() : 데이터 뒷부분 출력 ex) tail(df_exam) - 뒤에서부터 6행까지 출력 ex) tail(df_exam, 10) - 뒤에서부터 10행까지 출력 View() : 뷰어 창에서 데이터 확인 * 단 view()로 입력하면 Could not find function "view"라고 나온다 꼭 V 대문자 dim() : 데이터 차원 출력 데이터가 몇 행, 몇 열로 구성되어있는지 확인할 수 있는 함수 결과값 : 11 5 str() : 데이터 속성 출력 데이터에 들어 있는 변수들의 속성을 보여준다..