Python pyspark DataFrame.from_records用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.from_records 的用法。

用法: static DataFrame.from_records(data: Union[numpy.ndarray, List[tuple], dict, pandas.core.frame.DataFrame], index: Union[str, list, numpy.ndarray] = None, exclude: list = None, columns: list = None, coerce_float: bool = False, nrows: int = None) → pyspark.pandas.frame.DataFrame

將結構化或記錄 ndarray 轉換為 DataFrame。

參數：

data：ndarray(結構化數據類型)、元組列表、字典或DataFrame
index：字符串、字段列表、類似數組: 用作索引的數組字段，交替使用一組特定的輸入標簽
exclude：序列，默認無: 要排除的列或字段
columns：序列，默認無: 要使用的列名。如果傳遞的數據沒有與之關聯的名稱，則此參數提供列的名稱。否則，此參數指示結果中列的順序(數據中未找到的任何名稱都將變為 all-NA 列)
coerce_float：布爾值，默認為 False: 嘗試將非字符串、非數字對象(如 decimal.Decimal)的值轉換為浮點數，這對 SQL 結果集很有用
nrows：整數，默認無: 如果數據是迭代器，則要讀取的行數

df：DataFrame

例子：

使用 dict 作為輸入

>>> ps.DataFrame.from_records({'A': [1, 2, 3]})
   A
0  1
1  2
2  3

使用元組列表作為輸入

>>> ps.DataFrame.from_records([(1, 2), (3, 4)])
   0  1
0  1  2
1  3  4

使用NumPy數組作為輸入

>>> ps.DataFrame.from_records(np.eye(3))
     0    1    2
0  1.0  0.0  0.0
1  0.0  1.0  0.0
2  0.0  0.0  1.0

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.from_records。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：