用法:
DataFrame.std(axis=None, skipna=True, ddof=1, split_every=False, dtype=None, out=None, numeric_only=None)
返回请求轴上的样本标准偏差。
此文档字符串是从 pandas.core.frame.DataFrame.std 复制而来的。
可能存在与 Dask 版本的一些不一致之处。
默认由 N-1 归一化。这可以使用 ddof 参数进行更改。
- axis:{索引 (0), 列 (1)}
- skipna:布尔值,默认为真
排除 NA/空值。如果整行/列为 NA,则结果将为 NA。
- level:int 或级别名称,默认无(Dask 中不支持)
如果轴是 MultiIndex(分层),则沿特定级别计数,折叠成一个系列。
- ddof:整数,默认 1
Delta 自由度。计算中使用的除数是 N - ddof,其中 N 表示元素的数量。
- numeric_only:布尔值,默认无
仅包括 float、int、boolean 列。如果没有,将尝试使用所有内容,然后仅使用数字数据。未针对系列实施。
- Series 或 DataFrame(如果指定了级别)
参数:
返回:
注意:
要具有与
numpy.std
相同的行为,请使用ddof=0
(而不是默认的ddof=1
)例子:
>>> df = pd.DataFrame({'person_id': [0, 1, 2, 3], ... 'age': [21, 25, 62, 43], ... 'height': [1.61, 1.87, 1.49, 2.01]} ... ).set_index('person_id') >>> df age height person_id 0 21 1.61 1 25 1.87 2 62 1.49 3 43 2.01
列的标准偏差可以找到如下:
>>> df.std() age 18.786076 height 0.237417
或者,
ddof=0
可以设置为按 N 而不是 N-1 进行归一化:>>> df.std(ddof=0) age 16.269219 height 0.205609
相关用法
- Python dask.dataframe.DataFrame.sub用法及代码示例
- Python dask.dataframe.DataFrame.set_index用法及代码示例
- Python dask.dataframe.DataFrame.shape用法及代码示例
- Python dask.dataframe.DataFrame.sum用法及代码示例
- Python dask.dataframe.DataFrame.select_dtypes用法及代码示例
- Python dask.dataframe.DataFrame.shuffle用法及代码示例
- Python dask.dataframe.DataFrame.squeeze用法及代码示例
- Python dask.dataframe.DataFrame.sort_values用法及代码示例
- Python dask.dataframe.DataFrame.applymap用法及代码示例
- Python dask.dataframe.DataFrame.mod用法及代码示例
- Python dask.dataframe.DataFrame.cummin用法及代码示例
- Python dask.dataframe.DataFrame.truediv用法及代码示例
- Python dask.dataframe.DataFrame.round用法及代码示例
- Python dask.dataframe.DataFrame.ne用法及代码示例
- Python dask.dataframe.DataFrame.partitions用法及代码示例
- Python dask.dataframe.DataFrame.to_bag用法及代码示例
- Python dask.dataframe.DataFrame.any用法及代码示例
- Python dask.dataframe.DataFrame.itertuples用法及代码示例
- Python dask.dataframe.DataFrame.count用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.std。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。