当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.Series.clip用法及代码示例


用法:

Series.clip(lower=None, upper=None, out=None)

修剪输入阈值处的值。

此文档字符串是从 pandas.core.series.Series.clip 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

将边界外的值分配给边界值。阈值可以是奇异值或类似数组,在后一种情况下,裁剪是在指定轴上按元素执行的。

参数

lower浮点数或array-like,默认无

最小阈值。低于此阈值的所有值都将设置为它。缺少的阈值(例如 NA )不会裁剪该值。

upper浮点数或array-like,默认无

最大阈值。高于此阈值的所有值都将设置为它。缺少的阈值(例如 NA )不会裁剪该值。

axisint 或 str 轴名称,可选(Dask 中不支持)

沿给定轴将对象与上下对齐。

inplacebool,默认 False(在 Dask 中不支持)

是否对数据执行就地操作。

*args, **kwargs

附加关键字无效,但可能会被接受以与 numpy 兼容。

返回

Series 或 DataFrame 或 None

与调用对象相同的类型,替换剪辑边界之外的值或 None 如果 inplace=True

例子

>>> data = {'col_0': [9, -3, 0, -1, 5], 'col_1': [-2, -7, 6, 8, -5]}  
>>> df = pd.DataFrame(data)  
>>> df  
   col_0  col_1
0      9     -2
1     -3     -7
2      0      6
3     -1      8
4      5     -5

使用下限和上限阈值的每列剪辑:

>>> df.clip(-4, 6)  
   col_0  col_1
0      6     -2
1     -3     -4
2      0      6
3     -1      6
4      5     -4

使用每个列元素的特定下限和上限阈值的剪辑:

>>> t = pd.Series([2, -4, -1, 6, 3])  
>>> t  
0    2
1   -4
2   -1
3    6
4    3
dtype: int64
>>> df.clip(t, t + 4, axis=0)  
   col_0  col_1
0      6      2
1     -3     -4
2      0      3
3      6      8
4      5      3

使用每个列元素的特定较低阈值的剪辑,缺少值:

>>> t = pd.Series([2, -4, np.NaN, 6, 3])  
>>> t  
0    2.0
1   -4.0
2    NaN
3    6.0
4    3.0
dtype: float64
>>> df.clip(t, axis=0)  
col_0  col_1
0      9      2
1     -3     -4
2      0      6
3      6      8
4      5      3

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.Series.clip。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。