本文简要介绍
pyspark.pandas.window.Rolling.count
的用法。用法:
Rolling.count() → FrameLike
窗口内任何非 NaN 观测值的滚动计数。
注意
此 API 的当前实现使用 Spark 的 Window 而不指定分区规范。这会导致将所有数据移动到单个机器中的单个分区中,并可能导致严重的性能下降。避免对非常大的数据集使用此方法。
- Series.expanding:使用 Series 数据调用对象。
- DataFrame.expanding:使用 DataFrame 调用对象。
- Series.count:完整系列的计数。
- DataFrame.count:完整 DataFrame 的计数。
返回:
例子:
>>> s = ps.Series([2, 3, float("nan"), 10]) >>> s.rolling(1).count() 0 1.0 1 1.0 2 0.0 3 1.0 dtype: float64
>>> s.rolling(3).count() 0 1.0 1 2.0 2 2.0 3 2.0 dtype: float64
>>> s.to_frame().rolling(1).count() 0 0 1.0 1 1.0 2 0.0 3 1.0
>>> s.to_frame().rolling(3).count() 0 0 1.0 1 2.0 2 2.0 3 2.0
相关用法
- Python pyspark Rolling.mean用法及代码示例
- Python pyspark Rolling.max用法及代码示例
- Python pyspark Rolling.sum用法及代码示例
- Python pyspark Rolling.min用法及代码示例
- Python pyspark RowMatrix.numCols用法及代码示例
- Python pyspark RowMatrix.computePrincipalComponents用法及代码示例
- Python pyspark RowMatrix.computeSVD用法及代码示例
- Python pyspark RowMatrix.multiply用法及代码示例
- Python pyspark Row.asDict用法及代码示例
- Python pyspark RobustScaler用法及代码示例
- Python pyspark RowMatrix.computeCovariance用法及代码示例
- Python pyspark RowMatrix.computeGramianMatrix用法及代码示例
- Python pyspark RowMatrix.rows用法及代码示例
- Python pyspark RowMatrix.numRows用法及代码示例
- Python pyspark RowMatrix.columnSimilarities用法及代码示例
- Python pyspark Row用法及代码示例
- Python pyspark RowMatrix.tallSkinnyQR用法及代码示例
- Python pyspark RowMatrix.computeColumnSummaryStatistics用法及代码示例
- Python pyspark RDD.saveAsTextFile用法及代码示例
- Python pyspark RDD.keyBy用法及代码示例
- Python pyspark RDD.sumApprox用法及代码示例
- Python pyspark RDD.lookup用法及代码示例
- Python pyspark RDD.zipWithIndex用法及代码示例
- Python pyspark RDD.sampleByKey用法及代码示例
- Python pyspark RDD.coalesce用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.window.Rolling.count。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。