当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas DataFrame mad方法用法及代码示例


Pandas DataFrame.mad(~)方法计算出平均绝对偏差(MAD) 对于 DataFrame 的每一行或每一列。

请注意,MAD 的计算方式如下:

其中,

  • 是行/列中数据点的数量

  • 是行/列中的第

  • 是行/列的平均值

参数

1.axis | intstring | optional

是否按行或按列计算 MAD:

说明

"index"0

MAD 是针对每一列计算的。

"columns"1

MAD 是针对每一行计算的。

默认情况下,axis=0

2. skipna | boolean | optional

是否跳过 NaN 。跳过的 NaN 不会计入总大小 ( ),总大小是计算 MAD 时的除数。默认情况下,skipna=True

3. level | stringint | optional

要考虑的级别的名称或整数索引。仅当您的 DataFrame 是多索引时,这才相关。

返回值

如果指定了level参数,则将返回DataFrame。否则,将返回Series

例子

考虑以下 DataFrame :

df = pd.DataFrame({"A":[2,4,6],"B":[2,5,8]})
df



   A  B
0  2  2
1  4  5
2  6  8

按列计算 MAD

计算每列的 MAD:

df.mad()



A    1.333333
B    2.000000
dtype: float64

逐行计算 MAD

计算每行的 MAD:

df.mad(axis=1)



0    0.0
1    0.5
2    1.0
dtype: float64

指定skipna

考虑以下 DataFrame :

df = pd.DataFrame({"A":[3,pd.np.nan,5]})
df



   A
0  3.0
1  NaN
2  5.0

默认情况下, skipna=True ,这意味着所有缺失值都将被忽略:

df.mad()   # skipna=True



A    1.0
dtype: float64

考虑缺失值:

df.mad(skipna=False)



A   NaN
dtype: float64

对于 skipna=False ,如果行/列包含一个或多个缺失值,则该行/列的 MAD 将为 NaN

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | mad method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。