Python Pandas DataFrame mad方法用法及代码示例

Pandas DataFrame.mad(~)方法计算出平均绝对偏差(MAD) 对于 DataFrame 的每一行或每一列。

请注意，MAD 的计算方式如下：

其中，

1.axis | int 或 string | optional

是否按行或按列计算 MAD：

轴	说明
`"index"` 或 `0`	MAD 是针对每一列计算的。
`"columns"` 或 `1`	MAD 是针对每一行计算的。

默认情况下，axis=0 。

2. skipna | boolean | optional

是否跳过 NaN 。跳过的 NaN 不会计入总大小 ( $N$ )，总大小是计算 MAD 时的除数。默认情况下，skipna=True 。

3. level | string 或 int | optional

要考虑的级别的名称或整数索引。仅当您的 DataFrame 是多索引时，这才相关。

如果指定了level参数，则将返回DataFrame。否则，将返回Series。

考虑以下 DataFrame ：

df = pd.DataFrame({"A":[2,4,6],"B":[2,5,8]})
df



   A  B
0  2  2
1  4  5
2  6  8

计算每列的 MAD：

df.mad()



A    1.333333
B    2.000000
dtype: float64

计算每行的 MAD：

df.mad(axis=1)



0    0.0
1    0.5
2    1.0
dtype: float64

考虑以下 DataFrame ：

df = pd.DataFrame({"A":[3,pd.np.nan,5]})
df



   A
0  3.0
1  NaN
2  5.0

默认情况下， skipna=True ，这意味着所有缺失值都将被忽略：

df.mad()   # skipna=True



A    1.0
dtype: float64

考虑缺失值：

df.mad(skipna=False)



A   NaN
dtype: float64

对于 skipna=False ，如果行/列包含一个或多个缺失值，则该行/列的 MAD 将为 NaN 。

相关用法

注：本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | mad method。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。