当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Row用法及代码示例


本文简要介绍 pyspark.sql.Row 的用法。

用法:

class pyspark.sql.Row

DataFrame 中的一行。可以访问其中的字段:

  • 类似属性(row.key)

  • 像字典值(row[key])

key in row 将搜索行键。

Row 可用于通过使用命名参数来创建行对象。不允许省略命名参数来表示该值为 None 或缺失。在这种情况下,这应该明确设置为 None。

在 3.0.0 版中更改:从命名参数创建的行不再具有按字母顺序排序的字段名称,而是按输入的位置排序。

例子

>>> row = Row(name="Alice", age=11)
>>> row
Row(name='Alice', age=11)
>>> row['name'], row['age']
('Alice', 11)
>>> row.name, row.age
('Alice', 11)
>>> 'name' in row
True
>>> 'wrong_key' in row
False

Row 也可以用来创建另一个 Row 类,然后它可以用来创建 Row 对象,例如

>>> Person = Row("name", "age")
>>> Person
<Row('name', 'age')>
>>> 'name' in Person
True
>>> 'wrong_key' in Person
False
>>> Person("Alice", 11)
Row(name='Alice', age=11)

此表单还可用于将行创建为元组值,即具有未命名的字段。

>>> row1 = Row("Alice", 11)
>>> row2 = Row(name="Alice", age=11)
>>> row1 == row2
True

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.Row。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。