我有一個2D(二維) NumPy數組,並希望用255.0替換大於或等於閾值T的所有值。據我所知,最基礎的方法是:
shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
for y in range(0, shape[1]):
if arr[x, y] >= T:
result[x, y] = 255
-
有更簡潔和pythonic的方式來做到這一點嗎?
-
有沒有更快(可能不那麽簡潔和/或不那麽pythonic)的方式來做到這一點?
這將成為人體頭部MRI掃描窗口/等級調整子程序的一部分,2D numpy數組是圖像像素數據。
最佳解決思路
我認為最快和最簡潔的方法是使用Numpy的內置索引。如果您有名為arr
的ndarray
,則可以按如下所示將所有元素>255
替換為值x
:
arr[arr > 255] = x
我用500 x 500的隨機矩陣在我的機器上運行了這個函數,用5替換了所有> 0.5的值,平均耗時7.59ms。
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
次佳解決思路
因為實際上需要一個不同的數組,arr
,其中arr < 255
,可以簡單地完成:
result = np.minimum(arr, 255)
更一般地,對於下限和/或上限:
result = np.clip(arr, 0, 255)
如果隻是想訪問超過255的值,np.clip
和np.minimum
(或者np.maximum
)對你的情況更好更快。
In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop
In [293]: %%timeit
.....: c = np.copy(a)
.....: c[a>255] = 255
.....:
10000 loops, best of 3: 86.6 µs per loop
如果要執行in-place(即修改arr
而不是創建result
),則可以使用np.minimum
的out
參數:
np.minimum(arr, 255, out=arr)
或者
np.clip(arr, 0, 255, arr)
(out=
名稱是可選的,因為參數的順序與函數的定義相同。)
對於in-place修改,布爾索引加速了很多(不必分別修改和拷貝),但仍然不如minimum
:
In [328]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: np.minimum(a, 255, a)
.....:
100000 loops, best of 3: 303 µs per loop
In [329]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: a[a>255] = 255
.....:
100000 loops, best of 3: 356 µs per loop
比較來看,如果你想限製你的最大值和最小值,沒有clip
將不得不像下麵這樣做兩次
np.minimum(a, 255, a)
np.maximum(a, 0, a)
要麽,
a[a>255] = 255
a[a<0] = 0
第三種解決思路
可以通過使用where
功能來達到最快的速度:
例如,在numpy數組中查找大於0.2的項目,並用0代替它們:
import numpy as np
nums = np.random.rand(4,3)
print np.where(nums > 0.2, 0, nums)
第四種思路
可以考慮使用numpy.putmask:
np.putmask(arr, arr>=T, 255.0)
下麵是與Numpy內置索引的性能比較:
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop
In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop