當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.to_numpy用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.to_numpy 的用法。

用法:

DataFrame.to_numpy() → numpy.ndarray

表示此 DataFrame 或係列中的值的 NumPy ndarray。

注意

僅當生成的 NumPy ndarray 預計很小時才應使用此方法,因為所有數據都加載到驅動程序的內存中。

返回

numpy.ndarray

例子

>>> ps.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
array([[1, 3],
       [2, 4]])

對於異構數據,必須使用最低通用類型。

>>> ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5]}).to_numpy()
array([[1. , 3. ],
       [2. , 4.5]])

對於數字和非數字類型的混合,輸出數組將具有 object dtype。

>>> df = ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5], "C": pd.date_range('2000', periods=2)})
>>> df.to_numpy()
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
       [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)

對於係列,

>>> ps.Series(['a', 'b', 'a']).to_numpy()
array(['a', 'b', 'a'], dtype=object)

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.to_numpy。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。