当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.DataFrame.mode用法及代码示例


用法:

DataFrame.mode(axis=0, numeric_only=False, dropna=True)

获取沿选定轴的每个元素的模式。

一组值的众数是出现频率最高的值。它可以是多个值。

参数

axis{0 或 ‘index’,1 或 ‘columns’},默认 0

搜索模式时要迭代的轴:

  • 0 或‘index’:获取每列的模式
  • 1 或‘columns’:获取每一行的模式。
numeric_only布尔值,默认为 False

如果为 True,则仅适用于数字列。

dropna布尔值,默认为真

不要考虑 NA/NaN/NaT 的计数。

返回

DataFrame

每列或每行的模式。

注意

axis 参数当前不受支持。

例子

>>> import cudf
>>> df = cudf.DataFrame({
...     "species": ["bird", "mammal", "arthropod", "bird"],
...     "legs": [2, 4, 8, 2],
...     "wings": [2.0, None, 0.0, None]
... })
>>> df
     species  legs wings
0       bird     2   2.0
1     mammal     4  <NA>
2  arthropod     8   0.0
3       bird     2  <NA>

默认不考虑缺失值,翅膀的众数都是0和2。物种和腿的第二行包含NA,因为它们只有一个众数,但DataFrame有两行。

>>> df.mode()
  species  legs  wings
0    bird     2    0.0
1    <NA>  <NA>    2.0

考虑设置 dropna=False , NA 值,它们可以是模式(如翅膀)。

>>> df.mode(dropna=False)
  species  legs wings
0    bird     2  <NA>

设置 numeric_only=True ,只计算数值列的模式,忽略其他类型的列。

>>> df.mode(numeric_only=True)
   legs  wings
0     2    0.0
1  <NA>    2.0

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.DataFrame.mode。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。