如何对一个字符串列表进行排序？

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']

# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

之前的例子mylist.sort(key=lambda x: x.lower())对于仅有ASCII码的上下文也能正常工作。

18

0

John Millikin

资料来源非AMP版本编辑

但这如何处理特定语言的排序规则？它是否考虑到了地域性？

没有，list.sort()是一个通用的排序函数。如果你想根据Unicode规则进行排序，你必须定义一个自定义的排序键函数。你可以尝试使用 pyuca 模块，但我不知道它有多完整。

10

0

Mahmud Ahsan

资料来源非AMP版本编辑

请使用Python3中的sorted()函数。

items = ["love", "like", "play", "cool", "my"]
sorted(items2)

10

0

JON

资料来源非AMP版本编辑

假设s = "ZWzaAd"。

要对上面的字符串进行排序，简单的解决方案是下面的一个。

print ''.join(sorted(s))

AkshayNevrekar

编辑本段答案14日二月 2018 в 7:46

0

Dragos Alexe

资料来源非AMP版本编辑

＆gt; 或者也许。

names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog']
print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))

0

vlz

资料来源非AMP版本编辑

老问题了，但是如果你想在不设置locale.LC_ALL的情况下进行本地识别排序，你可以使用本回答建议的PyICU库来实现。

import icu # PyICU

def sorted_strings(strings, locale=None):
如果locale是None，则返回sorted(strings)。
return sorted(strings)
collator = icu.Collator.createInstance(icu.Locale(locale))
返回 sorted(strings, key=collator.getSortKey)

然后用例如

new_list = sorted_strings(list_of_strings, "de_DE.utf8")

这对我来说是可行的，不需要安装任何语言或改变其他系统设置。

(这个建议已经在上面的评论中提出了，但我想把它放在更突出的位置，因为我自己一开始也没注意到。)

0

Eli Courtwright · Accepted Answer · 2008-08-30T17:10:12+00:00

基本答案。

mylist = ["b", "C", "A"]
mylist.sort()

这就修改了你的原始列表（即就地排序）。要获得一个排序的列表副本，而不改变原始列表，请使用 sorted() 函数。

for x in sorted(mylist):
    print x

然而，上面的例子有点天真，因为它们没有考虑到地域性，并进行了区分大小写的排序。你可以利用可选的参数key来指定自定义的排序顺序（另一种方法，使用cmp，是一种被废弃的解决方案，因为它必须被多次评估 - key只对每个元素计算一次）。

所以，要根据当前的locale进行排序，考虑到特定语言的规则（cmp_to_key 是functools的一个辅助函数）。

sorted(mylist, key=cmp_to_key(locale.strcoll))

最后，如果你需要，你可以指定一个自定义locale来进行排序。

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

最后注意：你会看到使用lower()方法的不区分大小写的排序例子--那些是不正确的，因为它们只对ASCII字符子集有效。这两种方法对任何非英语数据都是错误的。

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)