當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas Dataframe.describe()用法及代碼示例


Python是進行數據分析的一種出色語言,主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas describe()用於查看一些基本的統計詳細信息,例如數據幀的百分位數,均值,標準差等或一係列數值。當此方法應用於一係列字符串時,它將返回不同的輸出,如以下示例所示。

用法:DataFrame.describe(percentiles=None, include=None, exclude=None)

參數:
percentile:列出像0-1之間的數字的數據類型以返回各自的百分位數
include:描述 DataFrame 時要包括的數據類型列表。默認為無
exclude:描述 DataFrame 時要排除的數據類型列表。默認為無

返回類型: DataFrame 的統計摘要。

要下載以下示例中使用的數據集,請單擊此處。在以下示例中,使用的 DataFrame 包含一些NBA球員的數據。下麵是任何操作之前的數據幀圖像。

範例1:描述具有對象和數字數據類型的 DataFrame

在此示例中,描述了 DataFrame ,並傳遞了['object']以包含參數以查看對象係列的描述。將[.20,.40,.60,.80]傳遞給百分位數參數,以查看數字係列的相應百分位數。

# importing pandas module  
import pandas as pd  
  
# importing regex module 
import re 
    
# making data frame  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")  
    
# removing null values to avoid errors  
data.dropna(inplace = True)  
  
# percentile list 
perc =[.20, .40, .60, .80] 
  
# list of dtypes to include 
include =['object', 'float', 'int'] 
  
# calling describe method 
desc = data.describe(percentiles = perc, include = include) 
  
# display 
desc

輸出:
如輸出圖像中所示,返回了數據幀的統計描述以及各自傳遞的百分位數。對於帶有字符串的列,返回NaN進行數字運算。


範例2:描述字符串係列

在此示例中,“名稱”列調用describe方法,以查看對象數據類型的行為。

# importing pandas module  
import pandas as pd  
  
# importing regex module 
import re 
    
# making data frame  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")  
    
# removing null values to avoid errors  
data.dropna(inplace = True)  
  
# calling describe method 
desc = data["Name"].describe() 
  
# display 
desc

輸出:
如輸出圖像中所示,describe()的行為對於一係列字符串是不同的。
在這種情況下,返回了不同的統計信息,例如值的計數,唯一值,出現次數的最高值和發生頻率。



相關用法


注:本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Dataframe.describe() method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。