当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.round用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.round 的用法。

用法:

DataFrame.round(decimals: Union[int, Dict[Union[Any, Tuple[Any, …]], int], Series] = 0) → DataFrame

将 DataFrame 四舍五入为可变的小数位数。

参数

decimals整数,字典,系列

每列舍入的小数位数。如果给出 int,则将每列舍入到相同位数。否则 dict 和 Series 舍入到可变数量的位置。如果 decimals 是类似字典,则列名称应位于键中;如果 decimals 是系列,则列名称应位于索引中。 decimals 中未包含的任何列将保持原样。 decimals 中不是输入列的元素将被忽略。

注意

如果decimals 是一个系列,预计它会很小,因为所有数据都加载到驱动程序的内存中。

返回

DataFrame

例子

>>> df = ps.DataFrame({'A':[0.028208, 0.038683, 0.877076],
...                    'B':[0.992815, 0.645646, 0.149370],
...                    'C':[0.173891, 0.577595, 0.491027]},
...                    columns=['A', 'B', 'C'],
...                    index=['first', 'second', 'third'])
>>> df
               A         B         C
first   0.028208  0.992815  0.173891
second  0.038683  0.645646  0.577595
third   0.877076  0.149370  0.491027
>>> df.round(2)
           A     B     C
first   0.03  0.99  0.17
second  0.04  0.65  0.58
third   0.88  0.15  0.49
>>> df.round({'A': 1, 'C': 2})
          A         B     C
first   0.0  0.992815  0.17
second  0.0  0.645646  0.58
third   0.9  0.149370  0.49
>>> decimals = ps.Series([1, 0, 2], index=['A', 'B', 'C'])
>>> df.round(decimals)
          A    B     C
first   0.0  1.0  0.17
second  0.0  1.0  0.58
third   0.9  0.0  0.49

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.round。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。