Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas dataframe.sem()
函数返回所请求轴上的平均值的无偏标准误差。统计量的标准误差(SE)(通常是参数的估计值)是其采样分布的标准偏差[1]或该标准偏差的估计值。如果参数或统计量是平均值,则称为平均值标准误差(SEM)。
用法:DataFrame.sem(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)
参数:
axis:{索引(0),列(1)}
skipna:排除NA /空值。如果整个行/列均为NA,则结果为NA
level:如果轴是MultiIndex(分层),则沿特定级别计数,并折叠为Series
ddof:Delta自由度。计算中使用的除数为N-ddof,其中N表示元素数。
numeric_only:仅包括float,int,boolean列。如果为None,将尝试使用所有内容,然后仅使用数字数据。未针对系列实施
返回:sem:Series或DataFrame(如果指定级别)
要链接到代码中使用的CSV文件,请单击此处
范例1:采用sem()
函数,以在索引轴上查找给定数据帧的平均值的标准误差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
让我们使用dataframe.sem()
函数以查找索引轴上均值的标准误差。
# find standard error of the mean of all the columns
df.sem(axis = 0)
输出:
注意,所有非数字列和值都不会自动包含在 DataFrame 的计算中。我们不必专门输入数字列来计算平均值的标准误。
范例2:采用sem()
函数以求出列轴平均值的标准误差。也不要跳过NaN
数据帧计算中的值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Calculate the standard error of
# the mean of all the rows in dataframe
df.sem(axis = 1, skipna = False)
输出:
当我们包括NaN
值,那么它将导致该特定行或列为NaN
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.sem()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。