当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.insert用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.insert 的用法。

用法:

DataFrame.insert(loc: int, column: Union[Any, Tuple[Any, …]], value: Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, Series, Iterable], allow_duplicates: bool = False) → None

将列插入DataFrame中的指定位置。

如果 column 已包含在 DataFrame 中,则引发 ValueError,除非 allow_duplicates 设置为 True。

参数

locint

插入索引。必须验证 0 <= loc <= len(columns)。

columnstr、数字或可散列对象

插入列的标签。

valueint、Series 或类似数组
allow_duplicates布尔型,可选

例子

>>> psdf = ps.DataFrame([1, 2, 3])
>>> psdf.sort_index()
   0
0  1
1  2
2  3
>>> psdf.insert(0, 'x', 4)
>>> psdf.sort_index()
   x  0
0  4  1
1  4  2
2  4  3
>>> from pyspark.pandas.config import set_option, reset_option
>>> set_option("compute.ops_on_diff_frames", True)
>>> psdf.insert(1, 'y', [5, 6, 7])
>>> psdf.sort_index()
   x  y  0
0  4  5  1
1  4  6  2
2  4  7  3
>>> psdf.insert(2, 'z', ps.Series([8, 9, 10]))
>>> psdf.sort_index()
   x  y   z  0
0  4  5   8  1
1  4  6   9  2
2  4  7  10  3
>>> reset_option("compute.ops_on_diff_frames")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.insert。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。