本文简要介绍
pyspark.sql.Row
的用法。用法:
class pyspark.sql.Row
DataFrame
中的一行。可以访问其中的字段:类似属性(
row.key
)像字典值(
row[key]
)
key in row
将搜索行键。Row 可用于通过使用命名参数来创建行对象。不允许省略命名参数来表示该值为 None 或缺失。在这种情况下,这应该明确设置为 None。
在 3.0.0 版中更改:从命名参数创建的行不再具有按字母顺序排序的字段名称,而是按输入的位置排序。
例子:
>>> row = Row(name="Alice", age=11) >>> row Row(name='Alice', age=11) >>> row['name'], row['age'] ('Alice', 11) >>> row.name, row.age ('Alice', 11) >>> 'name' in row True >>> 'wrong_key' in row False
Row 也可以用来创建另一个 Row 类,然后它可以用来创建 Row 对象,例如
>>> Person = Row("name", "age") >>> Person <Row('name', 'age')> >>> 'name' in Person True >>> 'wrong_key' in Person False >>> Person("Alice", 11) Row(name='Alice', age=11)
此表单还可用于将行创建为元组值,即具有未命名的字段。
>>> row1 = Row("Alice", 11) >>> row2 = Row(name="Alice", age=11) >>> row1 == row2 True
相关用法
- Python pyspark RowMatrix.numCols用法及代码示例
- Python pyspark RowMatrix.computePrincipalComponents用法及代码示例
- Python pyspark RowMatrix.computeSVD用法及代码示例
- Python pyspark RowMatrix.multiply用法及代码示例
- Python pyspark Row.asDict用法及代码示例
- Python pyspark RowMatrix.computeCovariance用法及代码示例
- Python pyspark RowMatrix.computeGramianMatrix用法及代码示例
- Python pyspark RowMatrix.rows用法及代码示例
- Python pyspark RowMatrix.numRows用法及代码示例
- Python pyspark RowMatrix.columnSimilarities用法及代码示例
- Python pyspark RowMatrix.tallSkinnyQR用法及代码示例
- Python pyspark RowMatrix.computeColumnSummaryStatistics用法及代码示例
- Python pyspark Rolling.mean用法及代码示例
- Python pyspark Rolling.max用法及代码示例
- Python pyspark RobustScaler用法及代码示例
- Python pyspark Rolling.count用法及代码示例
- Python pyspark Rolling.sum用法及代码示例
- Python pyspark Rolling.min用法及代码示例
- Python pyspark RDD.saveAsTextFile用法及代码示例
- Python pyspark RDD.keyBy用法及代码示例
- Python pyspark RDD.sumApprox用法及代码示例
- Python pyspark RDD.lookup用法及代码示例
- Python pyspark RDD.zipWithIndex用法及代码示例
- Python pyspark RDD.sampleByKey用法及代码示例
- Python pyspark RDD.coalesce用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.Row。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。