Data Science/R package

dplyr_arrange()

jsBae 2022. 5. 4. 00:35
더보기

순서대로 정렬하기

#기본 오름차순

> exam %>% arrange(math)
   id class math english science
1   9     3   20      98      15
2   5     2   25      80      65
3   4     1   30      98      58
4   3     1   45      86      78
5  12     3   45      85      32
6  13     4   46      98      65
7  14     4   48      87      12
8   1     1   50      98      50
9   6     2   50      89      98
10 10     3   50      98      45
11 16     4   58      98      65
12  2     1   60      97      60
13 11     3   65      65      65
14 17     5   65      68      98
15 15     4   75      56      78
16 20     5   78      83      58
17  7     2   80      90      45
18 18     5   80      78      90
19 19     5   89      68      87
20  8     2   90      78      25

#내림차순으로 정렬하기

> exam %>% arrange(desc(math))
   id class math english science
1   8     2   90      78      25
2  19     5   89      68      87
3   7     2   80      90      45
4  18     5   80      78      90
5  20     5   78      83      58
6  15     4   75      56      78
7  11     3   65      65      65
8  17     5   65      68      98
9   2     1   60      97      60
10 16     4   58      98      65
11  1     1   50      98      50
12  6     2   50      89      98
13 10     3   50      98      45
14 14     4   48      87      12
15 13     4   46      98      65
16  3     1   45      86      78
17 12     3   45      85      32
18  4     1   30      98      58
19  5     2   25      80      65
20  9     3   20      98      15

# 정렬 기준 변수 여러개 지정

> exam %>% arrange(class,math)
   id class math english science
1   4     1   30      98      58
2   3     1   45      86      78
3   1     1   50      98      50
4   2     1   60      97      60
5   5     2   25      80      65
6   6     2   50      89      98
7   7     2   80      90      45
8   8     2   90      78      25
9   9     3   20      98      15
10 12     3   45      85      32
11 10     3   50      98      45
12 11     3   65      65      65
13 13     4   46      98      65
14 14     4   48      87      12
15 16     4   58      98      65
16 15     4   75      56      78
17 17     5   65      68      98
18 20     5   78      83      58
19 18     5   80      78      90
20 19     5   89      68      87

 

연습문제

mpg 데이터를 이용해서 분석 문제를 해결해보세요.

Q1. "audi"에서 생산한 자동차 중에 어떤 자동차 모델의 hwy(고속도로 연비)가 높은지 알아보려고 합니다.
"audi"에서 생산한 자동차 중 hwy 1~5위에 해당하는 자동차의 데이터를 출력하세요.

df <- mpg
colnames(df)

> df %>% 
+   filter(manufacturer=="audi") %>% 
+   arrange(desc(hwy)) %>% 
+   head(5)
  manufacturer      model displ year cyl      trans drv cty hwy fl   class
1         audi         a4   2.0 2008   4 manual(m6)   f  20  31  p compact
2         audi         a4   2.0 2008   4   auto(av)   f  21  30  p compact
3         audi         a4   1.8 1999   4   auto(l5)   f  18  29  p compact
4         audi         a4   1.8 1999   4 manual(m5)   f  21  29  p compact
5         audi a4 quattro   2.0 2008   4 manual(m6)   4  20  28  p compact

 

728x90
반응형