当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.to_numpy用法及代码示例


本文简要介绍 pyspark.pandas.Series.to_numpy 的用法。

用法:

Series.to_numpy() → numpy.ndarray

表示此 DataFrame 或系列中的值的 NumPy ndarray。

注意

仅当生成的 NumPy ndarray 预计很小时才应使用此方法,因为所有数据都加载到驱动程序的内存中。

返回

numpy.ndarray

例子

>>> ps.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
array([[1, 3],
       [2, 4]])

对于异构数据,必须使用最低通用类型。

>>> ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5]}).to_numpy()
array([[1. , 3. ],
       [2. , 4.5]])

对于数字和非数字类型的混合,输出数组将具有 object dtype。

>>> df = ps.DataFrame({"A": [1, 2], "B": [3.0, 4.5], "C": pd.date_range('2000', periods=2)})
>>> df.to_numpy()
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
       [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)

对于系列,

>>> ps.Series(['a', 'b', 'a']).to_numpy()
array(['a', 'b', 'a'], dtype=object)

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.to_numpy。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。