当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.drop用法及代码示例

本文简要介绍 pyspark.pandas.DataFrame.drop 的用法。

用法:

DataFrame.drop(labels: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]], None] = None, axis: Union[int, str] = 1, columns: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

从列中删除指定的标签。

通过指定标签名称和 axis=1 或列来删除列。同时指定标签和列时,只会删除标签。删除行尚未实现。

参数

labels单个标签或类似列表

要删除的列标签。

axis{1 或 ‘columns’},默认 1
columns单个标签或类似列表

替代指定轴(labels, axis=1 等效于 columns=labels)。

返回

droppedDataFrame

注意

目前该函数仅支持axis = 1,axis = 0尚未实现。

例子

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> df
   x  y  z  w
0  1  3  5  7
1  2  4  6  8
>>> df.drop('x', axis=1)
   y  z  w
0  3  5  7
1  4  6  8
>>> df.drop(['y', 'z'], axis=1)
   x  w
0  1  7
1  2  8
>>> df.drop(columns=['y', 'z'])
   x  w
0  1  7
1  2  8

还支持MultiIndex

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> columns = [('a', 'x'), ('a', 'y'), ('b', 'z'), ('b', 'w')]
>>> df.columns = pd.MultiIndex.from_tuples(columns)
>>> df  
   a     b
   x  y  z  w
0  1  3  5  7
1  2  4  6  8
>>> df.drop('a')  
   b
   z  w
0  5  7
1  6  8

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.drop。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。