데이터 R지?

Ch9_데이터구조_3.4 이상치 제거

jsBae 2022. 5. 1. 20:58
이상치 (outlier) :  논리적 또는 통계학적으로 정상 범주에서 크게 벗어난 데이터

> outlier <- data.frame(sex=c(1,2,2,3,1),
+                       class=c("A","B","A","C","A"))
> outlier
  sex class
1   1     A
2   2     B
3   2     A
4   3     C
5   1     A

이상치를 확인했다면 결측치로 변환

> outlier$sex <- ifelse(outlier$sex==3, NA, outlier$sex)
> outlier
  sex class
1   1     A
2   2     B
3   2     A
4  NA     C
5   1     A

> outlier <- na.omit(outlier)
> outlier
  sex class
1   1     A
2   2     B
3   2     A
5   1     A

 

728x90
반응형