Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas dataframe.sem()
函數返回所請求軸上的平均值的無偏標準誤差。統計量的標準誤差(SE)(通常是參數的估計值)是其采樣分布的標準偏差[1]或該標準偏差的估計值。如果參數或統計量是平均值,則稱為平均值標準誤差(SEM)。
用法:DataFrame.sem(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)
參數:
axis:{索引(0),列(1)}
skipna:排除NA /空值。如果整個行/列均為NA,則結果為NA
level:如果軸是MultiIndex(分層),則沿特定級別計數,並折疊為Series
ddof:Delta自由度。計算中使用的除數為N-ddof,其中N表示元素數。
numeric_only:僅包括float,int,boolean列。如果為None,將嘗試使用所有內容,然後僅使用數字數據。未針對係列實施
返回:sem:Series或DataFrame(如果指定級別)
要鏈接到代碼中使用的CSV文件,請單擊此處
範例1:采用sem()
函數,以在索引軸上查找給定數據幀的平均值的標準誤差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
讓我們使用dataframe.sem()
函數以查找索引軸上均值的標準誤差。
# find standard error of the mean of all the columns
df.sem(axis = 0)
輸出:
注意,所有非數字列和值都不會自動包含在 DataFrame 的計算中。我們不必專門輸入數字列來計算平均值的標準誤。
範例2:采用sem()
函數以求出列軸平均值的標準誤差。也不要跳過NaN
數據幀計算中的值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Calculate the standard error of
# the mean of all the rows in dataframe
df.sem(axis = 1, skipna = False)
輸出:
當我們包括NaN
值,那麽它將導致該特定行或列為NaN
相關用法
- Python pandas.map()用法及代碼示例
- Python Pandas Series.str.len()用法及代碼示例
- Python Pandas.factorize()用法及代碼示例
- Python Pandas TimedeltaIndex.name用法及代碼示例
- Python Pandas dataframe.ne()用法及代碼示例
- Python Pandas Series.between()用法及代碼示例
- Python Pandas DataFrame.where()用法及代碼示例
- Python Pandas Series.add()用法及代碼示例
- Python Pandas.pivot_table()用法及代碼示例
- Python Pandas Series.mod()用法及代碼示例
- Python Pandas Dataframe.at[ ]用法及代碼示例
- Python Pandas Dataframe.iat[ ]用法及代碼示例
- Python Pandas.pivot()用法及代碼示例
- Python Pandas dataframe.mul()用法及代碼示例
- Python Pandas.melt()用法及代碼示例
注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.sem()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。