Hoe sorteer ik een dataframe op meerdere kolom(men)

Ik wil een data.frame sorteren op meerdere kolommen. Bijvoorbeeld, met het data.frame hieronder wil ik sorteren op kolom z (aflopend) en daarna op kolom b (oplopend):

dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), 
      levels = c("Low", "Med", "Hi"), ordered = TRUE),
      x = c("A", "D", "A", "C"), y = c(8, 3, 9, 9),
      z = c(1, 1, 1, 2))
dd
    b x y z
1  Hi A 8 1
2 Med D 3 1
3  Hi A 9 1
4 Low C 9 2
Oplossing

Je kunt de order() functie direct gebruiken zonder je toevlucht te nemen tot add-on tools -- zie dit eenvoudiger antwoord dat een truc gebruikt direct vanaf de top van de example(order) code:

R> dd[with(dd, order(-z, b)), ]
    b x y z
4 Low C 9 2
2 Med D 3 1
1  Hi A 8 1
3  Hi A 9 1

Edit zo'n 2+ jaar later: Er werd net gevraagd hoe je dit per kolom index kan doen. Het antwoord is om gewoon de gewenste sorteerkolom(men) door te geven aan de order() functie:

R> dd[order(-dd[,4], dd[,1]), ]
    b x y z
4 Low C 9 2
2 Med D 3 1
1  Hi A 8 1
3  Hi A 9 1
R> 

in plaats van de naam van de kolom te gebruiken (en met() voor eenvoudiger/meer directe toegang).

Commentaren (10)

Met deze (zeer nuttige) functie van Kevin Wright, geplaatst in de tips sectie van de R wiki, is dit eenvoudig te bereiken.

sort(dd,by = ~ -z + b)
#     b x y z
# 4 Low C 9 2
# 2 Med D 3 1
# 1  Hi A 8 1
# 3  Hi A 9 1
Commentaren (1)

Als alternatief, met behulp van het pakket Deducer


library(Deducer)
dd
Commentaren (0)