当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.DataFrame.dropna用法及代码示例


用法:

DataFrame.dropna(how='any', subset=None, thresh=None)

删除缺失值。

此文档字符串是从 pandas.core.frame.DataFrame.dropna 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

有关哪些值被视为缺失以及如何处理缺失数据的更多信息,请参阅用户指南。

参数

axis{0 或 ‘index’,1 或 ‘columns’},默认 0(Dask 中不支持)

确定是否删除了包含缺失值的行或列。

  • 0 或‘index’:删除包含缺失值的行。
  • 1 或‘columns’:删除包含缺失值的列。
how{‘any’, ‘all’},默认 ‘any’

当我们至少有一个 NA 或全部 NA 时,确定是否从 DataFrame 中删除行或列。

  • ‘any’:如果存在任何 NA 值,请删除该行或列。
  • ‘all’:如果所有值都是 NA,则删除该行或列。
thresh整数,可选

需要许多非 NA 值。

subset列标签或标签序列,可选

沿其他轴考虑的标签,例如如果您要删除行,这些将是要包含的列列表。

inplacebool,默认 False(在 Dask 中不支持)

如果为 True,则在原地执行操作并返回 None。

返回

DataFrame 或无

带有 NA 条目的 DataFrame 从其中删除或 None 如果 inplace=True

例子

>>> df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],  
...                    "toy": [np.nan, 'Batmobile', 'Bullwhip'],
...                    "born": [pd.NaT, pd.Timestamp("1940-04-25"),
...                             pd.NaT]})
>>> df  
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

删除至少缺少一个元素的行。

>>> df.dropna()  
     name        toy       born
1  Batman  Batmobile 1940-04-25

删除至少缺少一个元素的列。

>>> df.dropna(axis='columns')  
       name
0    Alfred
1    Batman
2  Catwoman

删除缺少所有元素的行。

>>> df.dropna(how='all')  
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

只保留至少有 2 个非 NA 值的行。

>>> df.dropna(thresh=2)  
       name        toy       born
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

定义在哪些列中查找缺失值。

>>> df.dropna(subset=['name', 'toy'])  
       name        toy       born
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

将具有有效条目的 DataFrame 保留在同一变量中。

>>> df.dropna(inplace=True)  
>>> df  
     name        toy       born
1  Batman  Batmobile 1940-04-25

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.dropna。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。