데이터 R지?

Ch9_데이터구조_3.3NA처리

jsBae 2022. 5. 1. 16:09

데이터가 비어있는 값을 결측치(Missing Value) 라고 한다

종류 의미 설명
is.na() 결측치 확인 및 대체 데이터가 결측치면 T, 아니면 F
anyNA() 결측치 확인 데이터 전체를 대상으로 확인
na.rm() 결측치 제외 na.rm = TRUE 설정하면 결측치를 제외하고 분석
na.omit() 결측치 제거 NA가 있는 행은 제거
> data <- read.csv("class_mean_NA.csv")
> data
  X class korean english math
1 1     1     81      82   78
2 2     2     NA      86   NA
3 3     3     85      NA   81
4 4     4     83      87   80
> is.na(data)
         X class korean english  math
[1,] FALSE FALSE  FALSE   FALSE FALSE
[2,] FALSE FALSE   TRUE   FALSE  TRUE
[3,] FALSE FALSE  FALSE    TRUE FALSE
[4,] FALSE FALSE  FALSE   FALSE FALSE
> anyNA(data)
[1] TRUE
> mean(data)
[1] NA
Warning message:
In mean.default(data) :
  인자가 수치형 또는 논리형이 아니므로 NA를 반환합니다
  
> mean(data$korean, na.rm = T)
[1] 83
> data_1 <- na.omit(data)
> data_1
  X class korean english math
1 1     1     81      82   78
4 4     4     83      87   80
> anyNA(data_1)
[1] FALSE

 

728x90
반응형