Python Pandas dataframe.sem()用法及代码示例

Python是进行数据分析的一种出色语言，主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种，使导入和分析数据更加容易。

Pandas dataframe.sem()函数返回所请求轴上的平均值的无偏标准误差。统计量的标准误差(SE)(通常是参数的估计值)是其采样分布的标准偏差[1]或该标准偏差的估计值。如果参数或统计量是平均值，则称为平均值标准误差(SEM)。

用法：DataFrame.sem(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)

参数：
axis:{索引(0)，列(1)}
skipna:排除NA /空值。如果整个行/列均为NA，则结果为NA
level:如果轴是MultiIndex(分层)，则沿特定级别计数，并折叠为Series
ddof:Delta自由度。计算中使用的除数为N-ddof，其中N表示元素数。
numeric_only:仅包括float，int，boolean列。如果为None，将尝试使用所有内容，然后仅使用数字数据。未针对系列实施

返回：sem：Series或DataFrame(如果指定级别)

要链接到代码中使用的CSV文件，请单击此处

范例1：采用sem()函数，以在索引轴上查找给定数据帧的平均值的标准误差。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# Print the dataframe 
df

让我们使用dataframe.sem()函数以查找索引轴上均值的标准误差。

# find standard error of the mean of all the columns 
df.sem(axis = 0)

输出：

注意，所有非数字列和值都不会自动包含在 DataFrame 的计算中。我们不必专门输入数字列来计算平均值的标准误。

范例2：采用sem()函数以求出列轴平均值的标准误差。也不要跳过NaN数据帧计算中的值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# Calculate the standard error of  
# the mean of all the rows in dataframe 
df.sem(axis = 1, skipna = False)

输出：

当我们包括NaN值，那么它将导致该特定行或列为NaN

相关用法

注：本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.sem()。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。