當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.drop用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.drop 的用法。

用法:

DataFrame.drop(labels: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]], None] = None, axis: Union[int, str] = 1, columns: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

從列中刪除指定的標簽。

通過指定標簽名稱和 axis=1 或列來刪除列。同時指定標簽和列時,隻會刪除標簽。刪除行尚未實現。

參數

labels單個標簽或類似列表

要刪除的列標簽。

axis{1 或 ‘columns’},默認 1
columns單個標簽或類似列表

替代指定軸(labels, axis=1 等效於 columns=labels)。

返回

droppedDataFrame

注意

目前該函數僅支持axis = 1,axis = 0尚未實現。

例子

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> df
   x  y  z  w
0  1  3  5  7
1  2  4  6  8
>>> df.drop('x', axis=1)
   y  z  w
0  3  5  7
1  4  6  8
>>> df.drop(['y', 'z'], axis=1)
   x  w
0  1  7
1  2  8
>>> df.drop(columns=['y', 'z'])
   x  w
0  1  7
1  2  8

還支持MultiIndex

>>> df = ps.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6], 'w': [7, 8]},
...                   columns=['x', 'y', 'z', 'w'])
>>> columns = [('a', 'x'), ('a', 'y'), ('b', 'z'), ('b', 'w')]
>>> df.columns = pd.MultiIndex.from_tuples(columns)
>>> df  
   a     b
   x  y  z  w
0  1  3  5  7
1  2  4  6  8
>>> df.drop('a')  
   b
   z  w
0  5  7
1  6  8

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.drop。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。