当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.DataFrame.dropna用法及代码示例


用法:

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

从列中删除包含空值的行(或列)。

参数

axis{0, 1},可选

是否删除包含空值的行(axis=0,默认)或列(axis=1)。

how{“any”, “all”},可选

指定如何决定是否删除行(或列)。 any(默认)删除包含至少一个空值的行(或列)。 all 仅删除包含 all 空值的行(或列)。

thresh: int, optional

如果指定,则删除包含小于 thresh 非空值的每一行(或列)

subset列表,可选

删除行时要考虑的列列表(默认情况下考虑所有列)。或者,在删除列时,子集是要考虑的行列表。

inplace布尔值,默认为 False

如果为 True,则在原地执行操作并返回 None。

返回

删除包含空值的行/列的 DataFrame 副本。

例子

>>> import cudf
>>> df = cudf.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
...                    "toy": ['Batmobile', None, 'Bullwhip'],
...                    "born": [np.datetime64("1940-04-25"),
...                             np.datetime64("NaT"),
...                             np.datetime64("NaT")]})
>>> df
       name        toy                 born
0    Alfred  Batmobile  1940-04-25 00:00:00
1    Batman       <NA>                 <NA>
2  Catwoman   Bullwhip                 <NA>

删除至少一个元素为空的行。

>>> df.dropna()
     name        toy       born
0  Alfred  Batmobile 1940-04-25

删除至少一个元素为空的列。

>>> df.dropna(axis='columns')
       name
0    Alfred
1    Batman
2  Catwoman

删除所有元素为空的行。

>>> df.dropna(how='all')
       name        toy                 born
0    Alfred  Batmobile  1940-04-25 00:00:00
1    Batman       <NA>                 <NA>
2  Catwoman   Bullwhip                 <NA>

仅保留具有至少 2 个非空值的行。

>>> df.dropna(thresh=2)
       name        toy                 born
0    Alfred  Batmobile  1940-04-25 00:00:00
2  Catwoman   Bullwhip                 <NA>

定义在哪些列中查找空值。

>>> df.dropna(subset=['name', 'born'])
     name        toy       born
0  Alfred  Batmobile 1940-04-25

将具有有效条目的 DataFrame 保留在同一变量中。

>>> df.dropna(inplace=True)
>>> df
     name        toy       born
0  Alfred  Batmobile 1940-04-25

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.DataFrame.dropna。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。