当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.DataFrame.sample用法及代码示例


用法:

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, keep_index=True)

从对象的轴返回项目的随机样本。

您可以使用random_state 来获得重现性。

参数

n整数,可选

从轴返回的项目数。不能与 frac 一起使用。如果 frac = 无,则默认值 = 1。

frac浮点数,可选

要返回的轴项目的分数。不能与 n 一起使用。

replace布尔值,默认为 False

允许或禁止对同一行多次采样。轴 = 1/“列”尚不支持替换 == True

weightsstr 或ndarray-like,可选

仅支持axis=1/”columns”

random_stateint,numpy RandomState 或无,默认无

随机数生成器的种子(如果是 int),或者无。如果没有,将选择一个随机种子。如果是 RandomState,种子将从当前状态中提取。

axis{0 或‘index’,1 或‘columns’,无},默认无

要采样的轴。接受轴号或名称。默认是给定数据类型的统计轴(系列和数据帧为 0)。 Series 和 Index 不支持axis=1。

返回

系列或 DataFrame 或索引

一个与调用者相同类型的新对象,包含从调用者对象中随机抽样的 n 个项目。

例子

>>> import cudf as cudf
>>> df = cudf.DataFrame({"a":{1, 2, 3, 4, 5}})
>>> df.sample(3)
   a
1  2
3  4
0  1
>>> sr = cudf.Series([1, 2, 3, 4, 5])
>>> sr.sample(10, replace=True)
1    4
3    1
2    4
0    5
0    1
4    5
4    1
0    2
0    3
3    2
dtype: int64
>>> df = cudf.DataFrame(
... {"a":[1, 2], "b":[2, 3], "c":[3, 4], "d":[4, 5]})
>>> df.sample(2, axis=1)
   a  c
0  1  3
1  2  4

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.DataFrame.sample。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。