リストを均等な大きさの塊に分割するには?

任意の長さのリストがあり、それを同じサイズのチャンクに分割して演算する必要があります。カウンタと2つのリストを保持し、2つ目のリストがいっぱいになったら、それを1つ目のリストに追加し、2つ目のリストを空にして次のデータラウンドに備えるなど、明らかな方法がありますが、これは非常にコストがかかる可能性があります。

しかし、これは非常にコストがかかる可能性があります。誰かジェネレーターを使うなどして、任意の長さのリストに対する良い解決策を持っていないかと思います。

私は itertools で有用なものを探していましたが、明らかに有用なものは見つかりませんでした。見逃しているかもしれませんが。

関連する質問です。チャンクでリストを反復処理する最も「パイソン的」な方法は何ですか?.

ソリューション

欲しいチャンクを生成するジェネレーターがあります。

def chunks(l, n):
    """Yield successive n-sized chunks from l."""
    for i in range(0, len(l), n):
        yield l[i:i + n]

import pprint
pprint.pprint(list(chunks(range(10, 75), 10)))
[[10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
 [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
 [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
 [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
 [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
 [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
 [70, 71, 72, 73, 74]]

Python 2を使用している場合は、range()ではなくxrange()を使用してください。

def chunks(l, n):
    """Yield successive n-sized chunks from l."""
    for i in xrange(0, len(l), n):
        yield l[i:i + n]

また、関数を書く代わりに単純にリスト内包を使うこともできますが、コードを理解しやすくするために、このような操作を名前付き関数でカプセル化するのは良いアイデアです。Python 3:

[l[i:i + n] for i in range(0, len(l), n)]

Python 2 バージョン。

[l[i:i + n] for i in xrange(0, len(l), n)]
解説 (10)

ここでは,任意のイテレータブルで動作するジェネレータを紹介します.

def split_seq(iterable, size):
    it = iter(iterable)
    item = list(itertools.islice(it, size))
    while item:
        yield item
        item = list(itertools.islice(it, size))

>>> import pprint
>>> pprint.pprint(list(split_seq(xrange(75), 10)))
[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
 [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
 [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
 [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
 [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
 [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
 [70, 71, 72, 73, 74]]
解説 (0)

リストサイズを知っていれば

def SplitList(mylist, chunk_size):
    return [mylist[offs:offs+chunk_size] for offs in range(0, len(mylist), chunk_size)]

そうでない場合(イテレータ)。

def IterChunks(sequence, chunk_size):
    res = []
    for item in sequence:
        res.append(item)
        if len(res) >= chunk_size:
            yield res
            res = []
    if res:
        yield res  # yield the last, incomplete, portion

後者の場合、シーケンスが常に与えられたサイズのチャンクを整数個含んでいる(つまり、最後のチャンクが不完全ではない)ことが確認できれば、より美しい方法で言い換えることができます。

解説 (1)