当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas Dataframe.sample()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas sample()用于根据函数调用程序数据帧生成样本随机行或列。

用法:

DataFrame.sample(n =无,frac =无,replace = False,权重=无,random_state =无,轴=无)

参数:

n:int值,要生成的随机行数。
frac:浮点值,返回(浮点值*数据帧值的长度)。 frac不能与n一起使用。
replace:布尔值,如果为True,则返回带有替换值的样本。
axis:行是0或“行”,列是1或“列”。

返回类型:与调用者类型相同的新对象。

要下载使用的CSV文件,请单击此处。

范例1: DataFrame 中的随机行

在此示例中,通过.sample()方法生成了两个随机行,并在以后进行比较。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file  
data = pd.read_csv("employees.csv") 
  
# generating one row  
row1 = data.sample(n = 1) 
  
# display 
row1 
  
# generating another row 
row2 = data.sample(n = 1) 
  
# display 
row2

输出:
如输出图像所示,生成的两个随机样本行彼此不同。


范例2:生成25%的数据帧样本
在此示例中,从数据帧中生成了25%的随机样本数据。

# importing pandas package 
import pandas as pd 
  
# making data frame from csv file  
data = pd.read_csv("employees.csv") 
  
# generating one row  
rows = data.sample(frac =.25) 
  
# checking if sample is 0.25 times data or not 
  
if (0.25*(len(data))== len(rows)):
    print( "Cool") 
    print(len(data), len(rows)) 
  
# display 
rows

输出:
如输出图像所示,生成的样本长度为数据帧的25%。另外,样本是随机生成的。



相关用法


注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Dataframe.sample()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。