Python pyspark Series.to_numpy用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.to_numpy 的用法。

用法: Series.to_numpy() → numpy.ndarray

表示此 DataFrame 或係列中的值的 NumPy ndarray。

注意

僅當生成的 NumPy ndarray 預計很小時才應使用此方法，因為所有數據都加載到驅動程序的內存中。

numpy.ndarray

例子：

>>> ps.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
array([[1, 3],
       [2, 4]])

對於異構數據，必須使用最低通用類型。

>>> ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5]}).to_numpy()
array([[1. , 3. ],
       [2. , 4.5]])

對於數字和非數字類型的混合，輸出數組將具有 object dtype。

>>> df = ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5], "C": pd.date_range('2000', periods=2)})
>>> df.to_numpy()
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
       [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)

對於係列，

>>> ps.Series(['a', 'b', 'a']).to_numpy()
array(['a', 'b', 'a'], dtype=object)

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.to_numpy。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

返回：

例子：