Python是進行數據分析的一種出色語言,主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas describe()用於查看一些基本的統計詳細信息,例如數據幀的百分位數,均值,標準差等或一係列數值。當此方法應用於一係列字符串時,它將返回不同的輸出,如以下示例所示。
用法:DataFrame.describe(percentiles=None, include=None, exclude=None)
參數:
percentile:列出像0-1之間的數字的數據類型以返回各自的百分位數
include:描述 DataFrame 時要包括的數據類型列表。默認為無
exclude:描述 DataFrame 時要排除的數據類型列表。默認為無
返回類型: DataFrame 的統計摘要。
要下載以下示例中使用的數據集,請單擊此處。在以下示例中,使用的 DataFrame 包含一些NBA球員的數據。下麵是任何操作之前的數據幀圖像。
範例1:描述具有對象和數字數據類型的 DataFrame
在此示例中,描述了 DataFrame ,並傳遞了['object']以包含參數以查看對象係列的描述。將[.20,.40,.60,.80]傳遞給百分位數參數,以查看數字係列的相應百分位數。
# importing pandas module
import pandas as pd
# importing regex module
import re
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# percentile list
perc =[.20, .40, .60, .80]
# list of dtypes to include
include =['object', 'float', 'int']
# calling describe method
desc = data.describe(percentiles = perc, include = include)
# display
desc
輸出:
如輸出圖像中所示,返回了數據幀的統計描述以及各自傳遞的百分位數。對於帶有字符串的列,返回NaN進行數字運算。
範例2:描述字符串係列
在此示例中,“名稱”列調用describe方法,以查看對象數據類型的行為。
# importing pandas module
import pandas as pd
# importing regex module
import re
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# calling describe method
desc = data["Name"].describe()
# display
desc
輸出:
如輸出圖像中所示,describe()的行為對於一係列字符串是不同的。
在這種情況下,返回了不同的統計信息,例如值的計數,唯一值,出現次數的最高值和發生頻率。
相關用法
- Python pandas.to_numeric用法及代碼示例
- Python pandas.period_range()用法及代碼示例
- Python pandas.date_range()用法及代碼示例
- Python Pandas DataFrame.to_html()用法及代碼示例
- Python Pandas Series.plot()用法及代碼示例
- Python Pandas DataFrame.to_latex()用法及代碼示例
- Python Pandas Series.str.isspace()用法及代碼示例
- Python pandas.map()用法及代碼示例
- Python Pandas Series.str.pad()用法及代碼示例
- Python Pandas DataFrame.where()用法及代碼示例
- Python Pandas Series.var用法及代碼示例
- Python Pandas Series.between()用法及代碼示例
注:本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Dataframe.describe() method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。