用法:
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, keep_index=True)
从对象的轴返回项目的随机样本。
您可以使用random_state 来获得重现性。
- n:整数,可选
从轴返回的项目数。不能与 frac 一起使用。如果 frac = 无,则默认值 = 1。
- frac:浮点数,可选
要返回的轴项目的分数。不能与 n 一起使用。
- replace:布尔值,默认为 False
允许或禁止对同一行多次采样。轴 = 1/“列”尚不支持替换 == True
- weights:str 或ndarray-like,可选
仅支持axis=1/”columns”
- random_state:int,numpy RandomState 或无,默认无
随机数生成器的种子(如果是 int),或者无。如果没有,将选择一个随机种子。如果是 RandomState,种子将从当前状态中提取。
- axis:{0 或‘index’,1 或‘columns’,无},默认无
要采样的轴。接受轴号或名称。默认是给定数据类型的统计轴(系列和数据帧为 0)。 Series 和 Index 不支持axis=1。
- 系列或 DataFrame 或索引
一个与调用者相同类型的新对象,包含从调用者对象中随机抽样的 n 个项目。
参数:
返回:
例子:
>>> import cudf as cudf >>> df = cudf.DataFrame({"a":{1, 2, 3, 4, 5}}) >>> df.sample(3) a 1 2 3 4 0 1
>>> sr = cudf.Series([1, 2, 3, 4, 5]) >>> sr.sample(10, replace=True) 1 4 3 1 2 4 0 5 0 1 4 5 4 1 0 2 0 3 3 2 dtype: int64
>>> df = cudf.DataFrame( ... {"a":[1, 2], "b":[2, 3], "c":[3, 4], "d":[4, 5]}) >>> df.sample(2, axis=1) a c 0 1 3 1 2 4
相关用法
- Python cudf.DataFrame.subtract用法及代码示例
- Python cudf.DataFrame.stack用法及代码示例
- Python cudf.DataFrame.sum_of_squares用法及代码示例
- Python cudf.DataFrame.set_index用法及代码示例
- Python cudf.DataFrame.sin用法及代码示例
- Python cudf.DataFrame.std用法及代码示例
- Python cudf.DataFrame.scale用法及代码示例
- Python cudf.DataFrame.sqrt用法及代码示例
- Python cudf.DataFrame.size用法及代码示例
- Python cudf.DataFrame.searchsorted用法及代码示例
- Python cudf.DataFrame.skew用法及代码示例
- Python cudf.DataFrame.sum用法及代码示例
- Python cudf.DataFrame.sort_index用法及代码示例
- Python cudf.DataFrame.sort_values用法及代码示例
- Python cudf.DataFrame.sub用法及代码示例
- Python cudf.DataFrame.select_dtypes用法及代码示例
- Python cudf.DataFrame.mod用法及代码示例
- Python cudf.DataFrame.isin用法及代码示例
- Python cudf.DataFrame.rmul用法及代码示例
- Python cudf.DataFrame.apply用法及代码示例
注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.DataFrame.sample。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。