Python NumPy 配列の要素のうち、ある値よりも大きいものをすべて置き換える

2次元のNumPy配列があり、その中の閾値T以上の値をすべて255.0に置き換えたいと思っています。私の知る限りでは、最も基本的な方法は

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255

1.最も簡潔でピシッとした方法は何ですか?

2.もっと早く(もしかしたらもっと簡潔に、もっとパイソン的に)できる方法はありますか?

これは、人間の頭部のMRIスキャンのウィンドウ/レベル調整サブルーチンの一部になります。2D numpy配列は、画像のピクセルデータです。

ソリューション

これを行うには、NumPy'のビルトインFancyインデックスを使用するのが最も早く、かつ簡潔な方法だと思います。arrという名前のndarrayがあれば、次のようにすべての要素>255を値x`で置き換えることができます。

arr[arr > 255] = x

これを私のマシンで500×500のランダム行列を用いて、すべての値>0.5を5に置き換えて実行したところ、平均7.59msかかりました。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
解説 (9)

実際には、arr < 255のときはarr、それ以外のときは255という別の配列が欲しいわけですから、これは簡単にできます。

result = np.minimum(arr, 255)

より一般的には、下界や上界に対しては

result = np.clip(arr, 0, 255)

255以上の値にアクセスしたいだけなら、@mtitan8'さんの回答の方が一般的ですが、np.clipnp.minimum(またはnp.maximum)の方が使い勝手が良く、より高速に処理できます。

In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop

In [293]: %%timeit
   .....: c = np.copy(a)
   .....: c[a>255] = 255
   .....: 
10000 loops, best of 3: 86.6 µs per loop

インプレースで行いたい(つまり、resultを作成する代わりにarrを修正する)場合は、np.minimumoutパラメータを使用できます。

np.minimum(arr, 255, out=arr)

または

np.clip(arr, 0, 255, arr)

(関数'の定義と同じ順序で引数を指定するので、out=の名前はオプションです)。

インプレースモディフィケーションでは、ブーリアンインデックスを使用することで大幅にスピードアップしますが(コピーを作成してから個別に修正する必要はありません)、それでもminimumには及びません。

In [328]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: np.minimum(a, 255, a)
   .....: 
100000 loops, best of 3: 303 µs per loop

In [329]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: a[a>255] = 255
   .....: 
100000 loops, best of 3: 356 µs per loop

比較のために、値を最大値だけでなく最小値でも制限したい場合、clip がなければ、次のような方法でこれを 2 回行わなければなりません。

np.minimum(a, 255, a)
np.maximum(a, 0, a)

とかになります。


a[a>255] = 255
a[a
解説 (4)

numpy.putmask]1**の使用を検討することができます。

np.putmask(arr, arr>=T, 255.0)

Numpy'の内蔵インデックスとの性能比較です。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop
解説 (1)