在Python中创建按字母排序的列表的最佳方式是什么?
基本答案。
mylist = ["b", "C", "A"] mylist.sort()
这就修改了你的原始列表(即就地排序)。要获得一个排序的列表副本,而不改变原始列表,请使用 sorted() 函数。
sorted()
for x in sorted(mylist): print x
然而,上面的例子有点天真,因为它们没有考虑到地域性,并进行了区分大小写的排序。你可以利用可选的参数key来指定自定义的排序顺序(另一种方法,使用cmp,是一种被废弃的解决方案,因为它必须被多次评估 - key只对每个元素计算一次)。
key
cmp
所以,要根据当前的locale进行排序,考虑到特定语言的规则(cmp_to_key 是functools的一个辅助函数)。
cmp_to_key
sorted(mylist, key=cmp_to_key(locale.strcoll))
最后,如果你需要,你可以指定一个自定义locale来进行排序。
import locale locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale assert sorted((u'Ab', u'ad', u'aa'), key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']
最后注意:你会看到使用lower()方法的不区分大小写的排序例子--那些是不正确的,因为它们只对ASCII字符子集有效。这两种方法对任何非英语数据都是错误的。
lower()
# this is incorrect! mylist.sort(key=lambda x: x.lower()) # alternative notation, a bit faster, but still wrong mylist.sort(key=str.lower)
还值得注意的是[sorted()][1]函数。
for x in sorted(list): print x
这将返回一个新的、经过排序的列表版本,而不改变原来的列表。
[1]: https://docs.python.org/3/library/functions.html#sorted "sorted"
list.sort()
真的就是这么简单 :)
对字符串进行排序的正确方法是:{{{52936}}。
import locale locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad'] # Without using locale.strcoll you get: assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']
之前的例子mylist.sort(key=lambda x: x.lower())对于仅有ASCII码的上下文也能正常工作。
mylist.sort(key=lambda x: x.lower())
但这如何处理特定语言的排序规则?它是否考虑到了地域性?
没有,list.sort()是一个通用的排序函数。如果你想根据Unicode规则进行排序,你必须定义一个自定义的排序键函数。你可以尝试使用 pyuca 模块,但我不知道它有多完整。
请使用Python3中的sorted()函数。
items = ["love", "like", "play", "cool", "my"] sorted(items2)
假设s = "ZWzaAd"。
s = "ZWzaAd"
要对上面的字符串进行排序,简单的解决方案是下面的一个。
print ''.join(sorted(s))
> 或者也许。
names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog'] print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))
老问题了,但是如果你想在不设置locale.LC_ALL的情况下进行本地识别排序,你可以使用本回答建议的PyICU库来实现。
locale.LC_ALL
import icu # PyICU def sorted_strings(strings, locale=None): 如果locale是None,则返回sorted(strings)。 return sorted(strings) collator = icu.Collator.createInstance(icu.Locale(locale)) 返回 sorted(strings, key=collator.getSortKey)
然后用例如
new_list = sorted_strings(list_of_strings, "de_DE.utf8")
这对我来说是可行的,不需要安装任何语言或改变其他系统设置。
(这个建议已经在上面的评论中提出了,但我想把它放在更突出的位置,因为我自己一开始也没注意到。)
基本答案。
这就修改了你的原始列表(即就地排序)。要获得一个排序的列表副本,而不改变原始列表,请使用
sorted()
函数。然而,上面的例子有点天真,因为它们没有考虑到地域性,并进行了区分大小写的排序。你可以利用可选的参数
key
来指定自定义的排序顺序(另一种方法,使用cmp
,是一种被废弃的解决方案,因为它必须被多次评估 -key
只对每个元素计算一次)。所以,要根据当前的locale进行排序,考虑到特定语言的规则(
cmp_to_key
是functools的一个辅助函数)。最后,如果你需要,你可以指定一个自定义locale来进行排序。
最后注意:你会看到使用
lower()
方法的不区分大小写的排序例子--那些是不正确的,因为它们只对ASCII字符子集有效。这两种方法对任何非英语数据都是错误的。还值得注意的是[
sorted()
][1]函数。这将返回一个新的、经过排序的列表版本,而不改变原来的列表。
[1]: https://docs.python.org/3/library/functions.html#sorted "sorted"
真的就是这么简单 :)
对字符串进行排序的正确方法是:{{{52936}}。
之前的例子
mylist.sort(key=lambda x: x.lower())
对于仅有ASCII码的上下文也能正常工作。没有,
list.sort()
是一个通用的排序函数。如果你想根据Unicode规则进行排序,你必须定义一个自定义的排序键函数。你可以尝试使用 pyuca 模块,但我不知道它有多完整。请使用Python3中的sorted()函数。
假设
s = "ZWzaAd"
。要对上面的字符串进行排序,简单的解决方案是下面的一个。
> 或者也许。
老问题了,但是如果你想在不设置
locale.LC_ALL
的情况下进行本地识别排序,你可以使用本回答建议的PyICU库来实现。然后用例如
这对我来说是可行的,不需要安装任何语言或改变其他系统设置。
(这个建议已经在上面的评论中提出了,但我想把它放在更突出的位置,因为我自己一开始也没注意到。)