Python Pandas Dataframe.sample()用法及代碼示例

Python是進行數據分析的一種出色語言，主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種，使導入和分析數據更加容易。

Pandas sample()用於根據函數調用程序數據幀生成樣本隨機行或列。

用法：

DataFrame.sample(n =無，frac =無，replace = False，權重=無，random_state =無，軸=無)

參數：

n:int值，要生成的隨機行數。
frac:浮點值，返回(浮點值*數據幀值的長度)。 frac不能與n一起使用。
replace:布爾值，如果為True，則返回帶有替換值的樣本。
axis:行是0或“行”，列是1或“列”。

返回類型：與調用者類型相同的新對象。

要下載使用的CSV文件，請單擊此處。

範例1： DataFrame 中的隨機行

在此示例中，通過.sample()方法生成了兩個隨機行，並在以後進行比較。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file  
data = pd.read_csv("employees.csv") 
  
# generating one row  
row1 = data.sample(n = 1) 
  
# display 
row1 
  
# generating another row 
row2 = data.sample(n = 1) 
  
# display 
row2

輸出：
如輸出圖像所示，生成的兩個隨機樣本行彼此不同。

範例2：生成25％的數據幀樣本
在此示例中，從數據幀中生成了25％的隨機樣本數據。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file  
data = pd.read_csv("employees.csv") 
  
# generating one row  
rows = data.sample(frac =.25) 
  
# checking if sample is 0.25 times data or not 
  
if (0.25*(len(data))== len(rows)):
    print( "Cool") 
    print(len(data), len(rows)) 
  
# display 
rows

輸出：
如輸出圖像所示，生成的樣本長度為數據幀的25％。另外，樣本是隨機生成的。

相關用法

注：本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Dataframe.sample()。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。