当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.DataFrame.count用法及代码示例


用法:

DataFrame.count(axis=None, split_every=False, numeric_only=None)

计算每一列或每一行的非 NA 单元格。

此文档字符串是从 pandas.core.frame.DataFrame.count 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

None , NaN , NaT 和可选的 numpy.inf(取决于 pandas.options.mode.use_inf_as_na )被认为是 NA。

参数

axis{0 或 ‘index’,1 或 ‘columns’},默认 0

如果为每列生成 0 或 ‘index’ 计数。如果为每一行生成 1 或 ‘columns’ 计数。

levelint 或 str,可选(Dask 中不支持)

如果轴是 MultiIndex(分层),则沿特定的 level 计数,折叠成 DataFramestr 指定级别名称。

numeric_only布尔值,默认为 False

仅包括 float , intboolean 数据。

返回

Series或DataFrame

对于每一列/行,非 NA/空条目的数量。如果指定了 level ,则返回 DataFrame

例子

从字典构造 DataFrame:

>>> df = pd.DataFrame({"Person":  
...                    ["John", "Myla", "Lewis", "John", "Myla"],
...                    "Age": [24., np.nan, 21., 33, 26],
...                    "Single": [False, True, True, True, False]})
>>> df  
   Person   Age  Single
0    John  24.0   False
1    Myla   NaN    True
2   Lewis  21.0    True
3    John  33.0    True
4    Myla  26.0   False

注意未计数的 NA 值:

>>> df.count()  
Person    5
Age       4
Single    5
dtype: int64

每行的计数:

>>> df.count(axis='columns')  
0    3
1    2
2    3
3    3
4    3
dtype: int64

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.count。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。