當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python cudf.DataFrame用法及代碼示例

用法:

class cudf.DataFrame(data=None, index=None, columns=None, dtype=None, nan_as_null=True)

一個 GPU DataFrame 對象。

參數

dataarray-like、Iterable、dict 或 DataFrame。

Dict 可以包含 Series、數組、常量或 list-like 對象。

index索引或array-like

用於結果幀的索引。如果輸入數據沒有索引信息部分並且沒有提供索引,則默認為 RangeIndex。

columns索引或array-like

用於生成的框架的列標簽。如果沒有提供列標簽,將默認為 RangeIndex (0, 1, 2, ..., n)。

dtypedtype,默認無

要強製的數據類型。隻允許使用一個 dtype。如果沒有,推斷。

nan_as_null布爾值,默認為真

如果 None /True ,將 np.nan 值轉換為 null 值。如果 False ,保持 np.nan 值不變。

例子

使用 __setitem__ 構建 DataFrame :

>>> import cudf
>>> df = cudf.DataFrame()
>>> df['key'] = [0, 1, 2, 3, 4]
>>> df['val'] = [float(i + 10) for i in range(5)]  # insert column
>>> df
   key   val
0    0  10.0
1    1  11.0
2    2  12.0
3    3  13.0
4    4  14.0

通過列的 dict 構建 DataFrame:

>>> import numpy as np
>>> from datetime import datetime, timedelta
>>> t0 = datetime.strptime('2018-10-07 12:00:00', '%Y-%m-%d %H:%M:%S')
>>> n = 5
>>> df = cudf.DataFrame({
...     'id': np.arange(n),
...     'datetimes': np.array(
...     [(t0+ timedelta(seconds=x)) for x in range(n)])
... })
>>> df
    id            datetimes
0    0  2018-10-07 12:00:00
1    1  2018-10-07 12:00:01
2    2  2018-10-07 12:00:02
3    3  2018-10-07 12:00:03
4    4  2018-10-07 12:00:04

通過行列表作為元組構建 DataFrame:

>>> df = cudf.DataFrame([
...     (5, "cats", "jump", np.nan),
...     (2, "dogs", "dig", 7.5),
...     (3, "cows", "moo", -2.1, "occasionally"),
... ])
>>> df
   0     1     2     3             4
0  5  cats  jump  <NA>          <NA>
1  2  dogs   dig   7.5          <NA>
2  3  cows   moo  -2.1  occasionally

從 Pandas DataFrame 轉換:

>>> import pandas as pd
>>> pdf = pd.DataFrame({'a': [0, 1, 2, 3],'b': [0.1, 0.2, None, 0.3]})
>>> pdf
   a    b
0  0  0.1
1  1  0.2
2  2  NaN
3  3  0.3
>>> df = cudf.from_pandas(pdf)
>>> df
   a     b
0  0   0.1
1  1   0.2
2  2  <NA>
3  3   0.3

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.DataFrame。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。