当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.DataFrame.append用法及代码示例


用法:

DataFrame.append(other, interleave_partitions=False)

other 行追加到调用者的末尾,返回一个新对象。

此文档字符串是从 pandas.core.frame.DataFrame.append 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

other 中不在调用者中的列被添加为新列。

参数

otherDataFrame 或 Series/dict-like 对象,或这些对象的列表

要附加的数据。

ignore_indexbool,默认 False(在 Dask 中不支持)

如果为 True,则生成的轴将标记为 0、1、...、n - 1。

verify_integritybool,默认 False(在 Dask 中不支持)

如果为 True,则在创建具有重复项的索引时引发 ValueError。

sortbool,默认 False(在 Dask 中不支持)

如果selfother 的列未对齐,则对列进行排序。

返回

DataFrame

一个新的 DataFrame,由 caller 的行和 other 的行组成。

注意

如果传递了 dict/series 的列表并且键都包含在 DataFrame 的索引中,则生成的 DataFrame 中列的顺序将保持不变。

迭代地将行附加到 DataFrame 可能比单个连接的计算密集度更高。更好的解决方案是将这些行附加到列表中,然后将列表与原始 DataFrame 一次性连接起来。

例子

>>> df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'), index=['x', 'y'])  
>>> df  
   A  B
x  1  2
y  3  4
>>> df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'), index=['x', 'y'])  
>>> df.append(df2)  
   A  B
x  1  2
y  3  4
x  5  6
y  7  8

ignore_index 设置为 True:

>>> df.append(df2, ignore_index=True)  
   A  B
0  1  2
1  3  4
2  5  6
3  7  8

以下虽然不推荐用于生成 DataFrame 的方法,但显示了从多个数据源生成 DataFrame 的两种方法。

效率较低:

>>> df = pd.DataFrame(columns=['A'])  
>>> for i in range(5):  
...     df = df.append({'A': i}, ignore_index=True)
>>> df  
   A
0  0
1  1
2  2
3  3
4  4

更高效:

>>> pd.concat([pd.DataFrame([i], columns=['A']) for i in range(5)],  
...           ignore_index=True)
   A
0  0
1  1
2  2
3  3
4  4

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.append。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。