当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.array.topk用法及代码示例


用法:

dask.array.topk(a, k, axis=- 1, split_every=None)

从给定轴上的 a 中提取 k 个最大的元素,并将它们从大到小排序返回。如果 k 为负数,则改为提取 -k 个最小元素,并将它们从最小到最大排序返回。

k 远小于块大小时,这表现最佳。所有结果将沿给定轴以单个块的形式返回。

参数

x: Array

正在排序的数据

k: int
axis: int, optional
split_every: int >=2, optional

请参阅reduce()。当 k 处于与块大小相同或更大的数量级时,此参数变得非常重要,因为它可以防止将输入数组的全部或重要部分一次全部放入内存中,并且在以下情况下也会对网络传输产生负面影响在分布式上运行。

返回

沿给定轴选择大小为 abs(k) 的 x。

例子

>>> import dask.array as da
>>> x = np.array([5, 1, 3, 6])
>>> d = da.from_array(x, chunks=2)
>>> d.topk(2).compute()
array([6, 5])
>>> d.topk(-2).compute()
array([1, 3])

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.array.topk。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。