當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.DataFrame.sample用法及代碼示例


用法:

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, keep_index=True)

從對象的軸返回項目的隨機樣本。

您可以使用random_state 來獲得重現性。

參數

n整數,可選

從軸返回的項目數。不能與 frac 一起使用。如果 frac = 無,則默認值 = 1。

frac浮點數,可選

要返回的軸項目的分數。不能與 n 一起使用。

replace布爾值,默認為 False

允許或禁止對同一行多次采樣。軸 = 1/“列”尚不支持替換 == True

weightsstr 或ndarray-like,可選

僅支持axis=1/”columns”

random_stateint,numpy RandomState 或無,默認無

隨機數生成器的種子(如果是 int),或者無。如果沒有,將選擇一個隨機種子。如果是 RandomState,種子將從當前狀態中提取。

axis{0 或‘index’,1 或‘columns’,無},默認無

要采樣的軸。接受軸號或名稱。默認是給定數據類型的統計軸(係列和數據幀為 0)。 Series 和 Index 不支持axis=1。

返回

係列或 DataFrame 或索引

一個與調用者相同類型的新對象,包含從調用者對象中隨機抽樣的 n 個項目。

例子

>>> import cudf as cudf
>>> df = cudf.DataFrame({"a":{1, 2, 3, 4, 5}})
>>> df.sample(3)
   a
1  2
3  4
0  1
>>> sr = cudf.Series([1, 2, 3, 4, 5])
>>> sr.sample(10, replace=True)
1    4
3    1
2    4
0    5
0    1
4    5
4    1
0    2
0    3
3    2
dtype: int64
>>> df = cudf.DataFrame(
... {"a":[1, 2], "b":[2, 3], "c":[3, 4], "d":[4, 5]})
>>> df.sample(2, axis=1)
   a  c
0  1  3
1  2  4

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.DataFrame.sample。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。