Python pyspark DataFrame.drop用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.drop 的用法。

用法: DataFrame.drop(labels: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]], None] = None, axis: Union[int, str] = 1, columns: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

從列中刪除指定的標簽。

通過指定標簽名稱和 axis=1 或列來刪除列。同時指定標簽和列時，隻會刪除標簽。刪除行尚未實現。

參數：

labels：單個標簽或類似列表: 要刪除的列標簽。
axis：{1 或 ‘columns’}，默認 1
columns：單個標簽或類似列表: 替代指定軸(labels, axis=1 等效於 columns=labels)。

dropped：DataFrame

注意：

目前該函數僅支持axis = 1，axis = 0尚未實現。

例子：

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> df
   x  y  z  w
0  1  3  5  7
1  2  4  6  8

>>> df.drop('x', axis=1)
   y  z  w
0  3  5  7
1  4  6  8

>>> df.drop(['y', 'z'], axis=1)
   x  w
0  1  7
1  2  8

>>> df.drop(columns=['y', 'z'])
   x  w
0  1  7
1  2  8

還支持MultiIndex

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> columns = [('a', 'x'), ('a', 'y'), ('b', 'z'), ('b', 'w')]
>>> df.columns = pd.MultiIndex.from_tuples(columns)
>>> df  
   a     b
   x  y  z  w
0  1  3  5  7
1  2  4  6  8
>>> df.drop('a')  
   b
   z  w
0  5  7
1  6  8

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.drop。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

注意：

例子：