티스토리 뷰

이상치 (outlier) :  논리적 또는 통계학적으로 정상 범주에서 크게 벗어난 데이터

> outlier <- data.frame(sex=c(1,2,2,3,1),
+                       class=c("A","B","A","C","A"))
> outlier
  sex class
1   1     A
2   2     B
3   2     A
4   3     C
5   1     A

이상치를 확인했다면 결측치로 변환

> outlier$sex <- ifelse(outlier$sex==3, NA, outlier$sex)
> outlier
  sex class
1   1     A
2   2     B
3   2     A
4  NA     C
5   1     A

> outlier <- na.omit(outlier)
> outlier
  sex class
1   1     A
2   2     B
3   2     A
5   1     A

 

728x90
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
반응형