當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.Series.clip用法及代碼示例


用法:

Series.clip(lower=None, upper=None, out=None)

修剪輸入閾值處的值。

此文檔字符串是從 pandas.core.series.Series.clip 複製而來的。

可能存在與 Dask 版本的一些不一致之處。

將邊界外的值分配給邊界值。閾值可以是奇異值或類似數組,在後一種情況下,裁剪是在指定軸上按元素執行的。

參數

lower浮點數或array-like,默認無

最小閾值。低於此閾值的所有值都將設置為它。缺少的閾值(例如 NA )不會裁剪該值。

upper浮點數或array-like,默認無

最大閾值。高於此閾值的所有值都將設置為它。缺少的閾值(例如 NA )不會裁剪該值。

axisint 或 str 軸名稱,可選(Dask 中不支持)

沿給定軸將對象與上下對齊。

inplacebool,默認 False(在 Dask 中不支持)

是否對數據執行就地操作。

*args, **kwargs

附加關鍵字無效,但可能會被接受以與 numpy 兼容。

返回

Series 或 DataFrame 或 None

與調用對象相同的類型,替換剪輯邊界之外的值或 None 如果 inplace=True

例子

>>> data = {'col_0': [9, -3, 0, -1, 5], 'col_1': [-2, -7, 6, 8, -5]}  
>>> df = pd.DataFrame(data)  
>>> df  
   col_0  col_1
0      9     -2
1     -3     -7
2      0      6
3     -1      8
4      5     -5

使用下限和上限閾值的每列剪輯:

>>> df.clip(-4, 6)  
   col_0  col_1
0      6     -2
1     -3     -4
2      0      6
3     -1      6
4      5     -4

使用每個列元素的特定下限和上限閾值的剪輯:

>>> t = pd.Series([2, -4, -1, 6, 3])  
>>> t  
0    2
1   -4
2   -1
3    6
4    3
dtype: int64
>>> df.clip(t, t + 4, axis=0)  
   col_0  col_1
0      6      2
1     -3     -4
2      0      3
3      6      8
4      5      3

使用每個列元素的特定較低閾值的剪輯,缺少值:

>>> t = pd.Series([2, -4, np.NaN, 6, 3])  
>>> t  
0    2.0
1   -4.0
2    NaN
3    6.0
4    3.0
dtype: float64
>>> df.clip(t, axis=0)  
col_0  col_1
0      9      2
1     -3     -4
2      0      6
3      6      8
4      5      3

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.Series.clip。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。