当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python dask.dataframe.from_dask_array用法及代码示例

用法:

dask.dataframe.from_dask_array(x, columns=None, index=None, meta=None)

从 Dask 数组创建 Dask DataFrame。

将 2d 数组转换为 DataFrame,将 1d 数组转换为 Series。

参数

xda.Array
columns列表或字符串

如果是 DataFrame,则为列名列表,如果是 Series,则为单个字符串

indexdask.dataframe.Index,可选

用于输出 Series 或 DataFrame 的可选 dask 索引。

默认输出索引取决于x 是否有任何未知块。如果有任何未知块,则输出具有所有分区的None(每个块一个)。如果所有块都已知,则创建具有已知分区的默认索引。

如果要将 Dask Array 与现有的 dask Series 或 DataFrame 一致,并且希望索引匹配,则指定 index 可能很有用。

meta对象,可选

可以为 dask 传递可选的 meta 参数以指定要返回的具体数据帧类型。默认情况下,使用 pandas DataFrame。

例子

>>> import dask.array as da
>>> import dask.dataframe as dd
>>> x = da.ones((4, 2), chunks=(2, 2))
>>> df = dd.io.from_dask_array(x, columns=['a', 'b'])
>>> df.compute()
     a    b
0  1.0  1.0
1  1.0  1.0
2  1.0  1.0
3  1.0  1.0

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.from_dask_array。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。