你如何将一份清单分成大小均匀的几块?

我有一个任意长度的列表,我需要把它分割成同等大小的块并对其进行操作。有一些明显的方法可以做到这一点,比如保留一个计数器和两个列表,当第二个列表填满时,将其添加到第一个列表中,并为下一轮数据清空第二个列表,但这有可能非常昂贵。

我想知道是否有人对任何长度的列表有一个好的解决方案,例如使用生成器。

我在itertools中寻找有用的东西,但没有找到明显有用的东西。不过,可能已经错过了。

相关问题。什么是最 "Pythonic "的方式来迭代一个列表?

解决办法

这里有一个生成器,可以产生你想要的块状物。

def chunks(l, n):
    """Yield successive n-sized chunks from l."""
    for i in range(0, len(l), n):
        yield l[i:i + n]

import pprint
pprint.pprint(list(chunks(range(10, 75), 10)))
[[10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
 [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
 [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
 [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
 [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
 [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
 [70, 71, 72, 73, 74]]

如果你使用Python 2,你应该使用xrange()而不是range()

def chunks(l, n):
    """Yield successive n-sized chunks from l."""
    for i in xrange(0, len(l), n):
        yield l[i:i + n]

你也可以简单地使用列表理解,而不是写一个函数,尽管把这样的操作封装在命名的函数中是个好主意,这样你的代码更容易理解。Python 3:

[l[i:i + n] for i in range(0, len(l), n)]

Python 2版本。

[l[i:i + n] for i in xrange(0, len(l), n)]
评论(10)

这里有一个生成器,可以对任意的迭代表进行工作。

def split_seq(iterable, size):
    it = iter(iterable)
    item = list(itertools.islice(it, size))
    while item:
        yield item
        item = list(itertools.islice(it, size))

例子。

>>> import pprint
>>> pprint.pprint(list(split_seq(xrange(75), 10)))
[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
 [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
 [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
 [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
 [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
 [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
 [70, 71, 72, 73, 74]]
评论(0)

如果你知道名单大小。

def SplitList(mylist, chunk_size):
    return [mylist[offs:offs+chunk_size] for offs in range(0, len(mylist), chunk_size)]

如果你不知道(一个迭代器)。

def IterChunks(sequence, chunk_size):
    res = []
    for item in sequence:
        res.append(item)
        if len(res) >= chunk_size:
            yield res
            res = []
    if res:
        yield res  # yield the last, incomplete, portion

在后一种情况下,如果你能确定序列总是包含整数个给定大小的块(即没有不完整的最后一个块),可以用更漂亮的方式重新表述。

评论(1)