Python pyspark Series.to_numpy用法及代码示例

本文简要介绍 pyspark.pandas.Series.to_numpy 的用法。

用法: Series.to_numpy() → numpy.ndarray

表示此 DataFrame 或系列中的值的 NumPy ndarray。

注意

仅当生成的 NumPy ndarray 预计很小时才应使用此方法，因为所有数据都加载到驱动程序的内存中。

numpy.ndarray

例子：

>>> ps.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
array([[1, 3],
       [2, 4]])

对于异构数据，必须使用最低通用类型。

>>> ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5]}).to_numpy()
array([[1. , 3. ],
       [2. , 4.5]])

对于数字和非数字类型的混合，输出数组将具有 object dtype。

>>> df = ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5], "C": pd.date_range('2000', periods=2)})
>>> df.to_numpy()
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
       [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)

对于系列，

>>> ps.Series(['a', 'b', 'a']).to_numpy()
array(['a', 'b', 'a'], dtype=object)

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.to_numpy。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

返回：

例子：