Python Pandas dataframe.sem()用法及代碼示例

Python是進行數據分析的一種出色語言，主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種，使導入和分析數據更加容易。

Pandas dataframe.sem()函數返回所請求軸上的平均值的無偏標準誤差。統計量的標準誤差(SE)(通常是參數的估計值)是其采樣分布的標準偏差[1]或該標準偏差的估計值。如果參數或統計量是平均值，則稱為平均值標準誤差(SEM)。

用法：DataFrame.sem(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)

參數：
axis:{索引(0)，列(1)}
skipna:排除NA /空值。如果整個行/列均為NA，則結果為NA
level:如果軸是MultiIndex(分層)，則沿特定級別計數，並折疊為Series
ddof:Delta自由度。計算中使用的除數為N-ddof，其中N表示元素數。
numeric_only:僅包括float，int，boolean列。如果為None，將嘗試使用所有內容，然後僅使用數字數據。未針對係列實施

返回：sem：Series或DataFrame(如果指定級別)

要鏈接到代碼中使用的CSV文件，請單擊此處

範例1：采用sem()函數，以在索引軸上查找給定數據幀的平均值的標準誤差。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# Print the dataframe 
df

讓我們使用dataframe.sem()函數以查找索引軸上均值的標準誤差。

# find standard error of the mean of all the columns 
df.sem(axis = 0)

輸出：

注意，所有非數字列和值都不會自動包含在 DataFrame 的計算中。我們不必專門輸入數字列來計算平均值的標準誤。

範例2：采用sem()函數以求出列軸平均值的標準誤差。也不要跳過NaN數據幀計算中的值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.read_csv("nba.csv") 
  
# Calculate the standard error of  
# the mean of all the rows in dataframe 
df.sem(axis = 1, skipna = False)

輸出：

當我們包括NaN值，那麽它將導致該特定行或列為NaN

相關用法

注：本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.sem()。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。