当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PyTorch DataFrameMaker用法及代码示例


本文简要介绍python语言中 torchdata.datapipes.iter.DataFrameMaker 的用法。

用法:

class torchdata.datapipes.iter.DataFrameMaker(source_dp: IterDataPipe[torchdata.datapipes.iter.util.dataframemaker.T_co], dataframe_size: int = 1000, dtype=None, columns: Optional[List[str]] = None, device: str = '')

参数

  • source_dp-IterDataPipe 包含数据行

  • dataframe_size-每个 DataFrame 中的数据行数,可以选择页面大小

  • dtype-为 DataFrame 指定 TorchArrow dtype,使用 torcharrow.dtypes.DType

  • columns-指定 DataFrame 的列名称的 str 列表

  • device-指定将存储DataFrame的设备

获取多行数据,将其中的一些数据批处理在一起并创建 TorchArrow DataFrames (函数名称: dataframe )。

注意

DataFrame 中包含大量行和内存使用之间存在权衡。请仔细选择一个值。

示例

>>> from torchdata.datapipes.iter import IterableWrapper
>>> import torcharrow.dtypes as dt
>>> source_data = [(i,) for i in range(3)]
>>> source_dp = IterableWrapper(source_data)
>>> DTYPE = dt.Struct([dt.Field("Values", dt.int32)])
>>> df_dp = source_dp.dataframe(dtype=DTYPE)
>>> list(df_dp)[0]
  index    Values
-------  --------
      0         0
      1         1
      2         2
dtype: Struct([Field('Values', int32)]), count: 3, null_count: 0

相关用法


注:本文由纯净天空筛选整理自pytorch.org大神的英文原创作品 torchdata.datapipes.iter.DataFrameMaker。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。