일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- vue환경세팅
- Android
- 자바스크립트수학
- javaScriptError
- 개발
- 청소년복지론
- 장고프로젝트
- 자바스크립트for문
- sqlite
- 스택과큐의차이점
- cmd명령어
- 사례관리
- 장고웹프로젝트
- R데이터분석
- PostgreSQL
- 안드로이드
- 장고
- 자바스크립트날짜
- 파이썬
- 자바스크립트날짜get
- 스택개념
- 오류종류
- vue프로젝트
- 장고웹
- 큐개념
- Python
- 자바스크립트forinforof차이
- 자바스크립트날짜형식
- vue환경설정
- forof문
- Today
- Total
목록전체 글 (127)
지금도 개발중

저번 글에서는 데이터 정제 중 빠진데이터 제거하기, 결측치 정제에 대해 배우는 시간이었습니다. 잠시 복습하는 겸 결측치 정제를 다시 확인하고 그 다음 바로 이상한 데이터 제거하기, 이상치 정제에 대해 글을 써보도록하겠습니다. 결측치 정제에 대해 복습 * 결측치 확인 및 출력 is.na(df); //결측치 확인 table(is.na(df)); //결측치 빈도 출력 * is.na()를 filter()에 적용하면 결측치가 있는 행을 제거할 수 있다. 먼저 결측치가 있는 행만 추출한 다음 제거하기! df %>% filter(is.na(score)) df % filter(!is.na(score)) // is.na()앞에 '아니다'를 의미하는 ! 기호를 붙여 !is.na()를 입력하면 NA가 아닌 값을 출력할 수 ..

1. 데이터 결측치 찾기 * 샘플데이터 만들기 df % filter(is.na(score)) df % filter(!is.na(score)) // is.na()앞에 '아니다'를 의미하는 ! 기호를 붙여 !is.na()를 입력하면 NA가 아닌 값을 출력할 수 있다. df %>% filter(is.na(sex)) df % filter(!is.na(sex)) 3. 결측치가 하나라도 있으면 바로 제거할 수 있는 함수 na.omit() * na.omit()은 결측치가 하나라도 있으면 모두 제거하기 때문에 간편한 측면이 있지만, 분석에 필요한 행까지 제거할 수 있다는 단점이 있다. df_nomiss % summarise(mean_math = mean(math, na.rm = T), sum_math = sum(mat..

1. 데이터 가공하기 * 해당 함수들도 전 글에서 사용했던 dplyr 함수입니다. filter() : 행 추출 1) %>% 파이프 연산자 : ctrl + shift + m 단축키 ex) exam %>% filter(class == 1) #exam에서 class가 1인 경우만 추출해서 출력 filter를 이용해서 아래와 같이 출력할 수 있습니다. 그 외 쓸 수 있는 filter 조건 exam %>% filter(math > 50 & class == 1); #& and문 exam %>% filter(math > 50 | class != 1); #| or문 2) %in% 매치 연산자 ex) exam %>% filter(class %in% c(1, 3)); #1반, 3반에 해당하면 추출 * 위와 같이 여러 수를..

1. 데이터를 파악할 때 쓰는 함수들 head() : 데이터 앞부분 출력 ex) head(df_exam) - 앞에서부터 6행까지 출력 ex) head(df_exam, 10) - 앞에서부터 10행까지 출력 tail() : 데이터 뒷부분 출력 ex) tail(df_exam) - 뒤에서부터 6행까지 출력 ex) tail(df_exam, 10) - 뒤에서부터 10행까지 출력 View() : 뷰어 창에서 데이터 확인 * 단 view()로 입력하면 Could not find function "view"라고 나온다 꼭 V 대문자 dim() : 데이터 차원 출력 데이터가 몇 행, 몇 열로 구성되어있는지 확인할 수 있는 함수 결과값 : 11 5 str() : 데이터 속성 출력 데이터에 들어 있는 변수들의 속성을 보여준다..