當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Row用法及代碼示例


本文簡要介紹 pyspark.sql.Row 的用法。

用法:

class pyspark.sql.Row

DataFrame 中的一行。可以訪問其中的字段:

  • 類似屬性(row.key)

  • 像字典值(row[key])

key in row 將搜索行鍵。

Row 可用於通過使用命名參數來創建行對象。不允許省略命名參數來表示該值為 None 或缺失。在這種情況下,這應該明確設置為 None。

在 3.0.0 版中更改:從命名參數創建的行不再具有按字母順序排序的字段名稱,而是按輸入的位置排序。

例子

>>> row = Row(name="Alice", age=11)
>>> row
Row(name='Alice', age=11)
>>> row['name'], row['age']
('Alice', 11)
>>> row.name, row.age
('Alice', 11)
>>> 'name' in row
True
>>> 'wrong_key' in row
False

Row 也可以用來創建另一個 Row 類,然後它可以用來創建 Row 對象,例如

>>> Person = Row("name", "age")
>>> Person
<Row('name', 'age')>
>>> 'name' in Person
True
>>> 'wrong_key' in Person
False
>>> Person("Alice", 11)
Row(name='Alice', age=11)

此表單還可用於將行創建為元組值,即具有未命名的字段。

>>> row1 = Row("Alice", 11)
>>> row2 = Row(name="Alice", age=11)
>>> row1 == row2
True

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.Row。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。