Python pyspark DataFrame.drop用法及代码示例

本文简要介绍 pyspark.pandas.DataFrame.drop 的用法。

用法: DataFrame.drop(labels: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]], None] = None, axis: Union[int, str] = 1, columns: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

从列中删除指定的标签。

通过指定标签名称和 axis=1 或列来删除列。同时指定标签和列时，只会删除标签。删除行尚未实现。

参数：

labels：单个标签或类似列表: 要删除的列标签。
axis：{1 或 ‘columns’}，默认 1
columns：单个标签或类似列表: 替代指定轴(labels, axis=1 等效于 columns=labels)。

dropped：DataFrame

注意：

目前该函数仅支持axis = 1，axis = 0尚未实现。

例子：

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> df
   x  y  z  w
0  1  3  5  7
1  2  4  6  8

>>> df.drop('x', axis=1)
   y  z  w
0  3  5  7
1  4  6  8

>>> df.drop(['y', 'z'], axis=1)
   x  w
0  1  7
1  2  8

>>> df.drop(columns=['y', 'z'])
   x  w
0  1  7
1  2  8

还支持MultiIndex

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> columns = [('a', 'x'), ('a', 'y'), ('b', 'z'), ('b', 'w')]
>>> df.columns = pd.MultiIndex.from_tuples(columns)
>>> df  
   a     b
   x  y  z  w
0  1  3  5  7
1  2  4  6  8
>>> df.drop('a')  
   b
   z  w
0  5  7
1  6  8

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.drop。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

注意：

例子：