Как да сортираме списък от низове?

Кой е най-добрият начин за създаване на азбучно сортиран списък в Python?

Решение

Основен отговор:

mylist = ["b", "C", "A"]
mylist.sort()

Това променя първоначалния ви списък (т.е. сортира на място). За да получите сортирано копие на списъка, без да променяте оригинала, използвайте функцията sorted():

for x in sorted(mylist):
    print x

Въпреки това горните примери са малко наивни, защото не вземат предвид локалите и извършват сортиране, чувствително към малки и големи букви. Можете да се възползвате от незадължителния параметър key, за да зададете потребителски ред на сортиране (алтернативата, използваща cmp, е остаряло решение, тъй като трябва да се оценява многократно - key се изчислява само веднъж за всеки елемент).

И така, да се сортира според текущата локалност, като се вземат предвид специфичните за езика правила (cmp_to_key е помощна функция от functools):

sorted(mylist, key=cmp_to_key(locale.strcoll))

И накрая, ако е необходимо, можете да посочите custom locale за сортиране:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

Последна забележка: ще видите примери за сортиране без отчитане на големи и малки букви, които използват метода lower() - те са неправилни, защото работят само за подмножеството ASCII символи. Тези два метода са неправилни за всякакви данни, които не са на английски език:

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)
Коментари (8)
list.sort()

Наистина е толкова просто :)

Коментари (0)

Но как се справят с правилата за сортиране, специфични за езика? Взема ли се предвид локалът?

Не, list.sort() е обща функция за сортиране. Ако искате да сортирате в съответствие с правилата на Unicode, ще трябва да дефинирате потребителска функция за сортиране на ключове. Можете да опитате да използвате модула pyuca, но не знам доколко е завършен.

Коментари (0)