当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.DataFrame.iterrows用法及代码示例


用法:

DataFrame.iterrows()

将 DataFrame 行作为 (index, Series) 对进行迭代。

此文档字符串是从 pandas.core.frame.DataFrame.iterrows 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

生成(Yield)

index标签或标签元组

行的索引。 MultiIndex 的元组。

dataSeries

该行的数据作为一个系列。

注意

  1. 因为iterrows为每一行返回一个系列,它确实不是跨行保留数据类型(数据帧跨列保留数据类型)。例如,

    >>> df = pd.DataFrame([[1, 1.5]], columns=['int', 'float'])  
    >>> row = next(df.iterrows())[1]  
    >>> row  
    int      1.0
    float    1.5
    Name: 0, dtype: float64
    >>> print(row['int'].dtype)  
    float64
    >>> print(df['int'].dtype)  
    int64

    要在迭代行时保留 dtypes,最好使用 itertuples() 返回值的命名元组,并且通常比 iterrows 快。

  2. 你永远不应该修改你正在迭代的东西。这不能保证在所有情况下都有效。根据数据类型,迭代器返回一个副本而不是一个视图,写入它不会有任何效果。

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.iterrows。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。