当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python cudf.concat用法及代码示例

用法:

cudf.concat(objs, axis=0, join='outer', ignore_index=False, sort=None)

逐行连接 DataFrame、Series 或 Indices。

参数

objsDataFrame、Series 或 Index 的列表
axis{0/'index', 1/'columns'},默认 0

要连接的轴。

join{‘inner’, ‘outer’},默认 ‘outer’

如何处理其他轴(或轴)上的索引。

ignore_index布尔值,默认为 False

设置 True 以忽略 objs 的索引并提供默认范围索引。

sort布尔值,默认为 False

如果尚未对齐,则对非串联轴进行排序。

返回

一个类似类型的新对象,其中包含 objs 中每个对象的行。

例子

合并两个 Series

>>> import cudf
>>> s1 = cudf.Series(['a', 'b'])
>>> s2 = cudf.Series(['c', 'd'])
>>> s1
0    a
1    b
dtype: object
>>> s2
0    c
1    d
dtype: object
>>> cudf.concat([s1, s2])
0    a
1    b
0    c
1    d
dtype: object

通过将 ignore_index 选项设置为 True 来清除现有索引并在结果中将其重置。

>>> cudf.concat([s1, s2], ignore_index=True)
0    a
1    b
2    c
3    d
dtype: object

将两个具有相同列的 DataFrame 对象组合在一起。

>>> df1 = cudf.DataFrame([['a', 1], ['b', 2]],
...                    columns=['letter', 'number'])
>>> df1
  letter  number
0      a       1
1      b       2
>>> df2 = cudf.DataFrame([['c', 3], ['d', 4]],
...                    columns=['letter', 'number'])
>>> df2
  letter  number
0      c       3
1      d       4
>>> cudf.concat([df1, df2])
  letter  number
0      a       1
1      b       2
0      c       3
1      d       4

将 DataFrame 对象与重叠列组合并返回所有内容。交叉点外的列将填充 null 值。

>>> df3 = cudf.DataFrame([['c', 3, 'cat'], ['d', 4, 'dog']],
...                    columns=['letter', 'number', 'animal'])
>>> df3
  letter  number animal
0      c       3    cat
1      d       4    dog
>>> cudf.concat([df1, df3], sort=False)
  letter  number animal
0      a       1   <NA>
1      b       2   <NA>
0      c       3    cat
1      d       4    dog

DataFrame 对象与重叠列组合在一起,并仅返回那些通过将inner 传递给join 关键字参数来共享的对象。

>>> cudf.concat([df1, df3], join="inner")
  letter  number
0      a       1
1      b       2
0      c       3
1      d       4

通过传入 axis=1 沿 x 轴水平组合 DataFrame 对象。

>>> df4 = cudf.DataFrame([['bird', 'polly'], ['monkey', 'george']],
...                    columns=['animal', 'name'])
>>> df4
   animal    name
0    bird   polly
1  monkey  george
>>> cudf.concat([df1, df4], axis=1)
  letter  number  animal    name
0      a       1    bird   polly
1      b       2  monkey  george

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.concat。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。