데이터 R지?
Ch9_데이터구조_3.3NA처리
jsBae
2022. 5. 1. 16:09
데이터가 비어있는 값을 결측치(Missing Value) 라고 한다
종류 | 의미 | 설명 |
is.na() | 결측치 확인 및 대체 | 데이터가 결측치면 T, 아니면 F |
anyNA() | 결측치 확인 | 데이터 전체를 대상으로 확인 |
na.rm() | 결측치 제외 | na.rm = TRUE 설정하면 결측치를 제외하고 분석 |
na.omit() | 결측치 제거 | NA가 있는 행은 제거 |
> data <- read.csv("class_mean_NA.csv")
> data
X class korean english math
1 1 1 81 82 78
2 2 2 NA 86 NA
3 3 3 85 NA 81
4 4 4 83 87 80
> is.na(data)
X class korean english math
[1,] FALSE FALSE FALSE FALSE FALSE
[2,] FALSE FALSE TRUE FALSE TRUE
[3,] FALSE FALSE FALSE TRUE FALSE
[4,] FALSE FALSE FALSE FALSE FALSE
> anyNA(data)
[1] TRUE
> mean(data)
[1] NA
Warning message:
In mean.default(data) :
인자가 수치형 또는 논리형이 아니므로 NA를 반환합니다
> mean(data$korean, na.rm = T)
[1] 83
> data_1 <- na.omit(data)
> data_1
X class korean english math
1 1 1 81 82 78
4 4 4 83 87 80
> anyNA(data_1)
[1] FALSE
728x90
반응형