Jak posortować ramkę danych według wielu kolumn?

Chcę posortować ramkę danych według wielu kolumn. Na przykład, z data.frame poniżej, chciałbym posortować według kolumny z (malejąco), a następnie według kolumny b (rosnąco):

dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), 
      levels = c("Low", "Med", "Hi"), ordered = TRUE),
      x = c("A", "D", "A", "C"), y = c(8, 3, 9, 9),
      z = c(1, 1, 1, 2))
dd
    b x y z
1  Hi A 8 1
2 Med D 3 1
3  Hi A 9 1
4 Low C 9 2
Rozwiązanie

Możesz użyć funkcji order() bezpośrednio bez uciekania się do narzędzi dodatkowych -- zobacz tę prostszą odpowiedź, która używa sztuczki bezpośrednio z góry kodu example(order):

R> dd[with(dd, order(-z, b)), ]
    b x y z
4 Low C 9 2
2 Med D 3 1
1  Hi A 8 1
3  Hi A 9 1
  • Edytuj jakieś 2+ lat później:* Właśnie zapytano, jak to zrobić według indeksu kolumny. Odpowiedzią jest po prostu przekazanie pożądanej kolumny (kolumn) sortowania do funkcji order():
R> dd[order(-dd[,4], dd[,1]), ]
    b x y z
4 Low C 9 2
2 Med D 3 1
1  Hi A 8 1
3  Hi A 9 1
R> 

zamiast używać nazwy kolumny (i with() dla łatwiejszego/bardziej bezpośredniego dostępu).

Komentarze (10)

Dzięki tej (bardzo pomocnej) funkcji autorstwa Kevina Wrighta, umieszczonej w sekcji tips na wiki R, można to łatwo osiągnąć.

sort(dd,by = ~ -z + b)
#     b x y z
# 4 Low C 9 2
# 2 Med D 3 1
# 1  Hi A 8 1
# 3  Hi A 9 1
Komentarze (1)

Alternatywnie, używając pakietu Deducer


library(Deducer)
dd
Komentarze (0)