当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark schema_of_json用法及代码示例


本文简要介绍 pyspark.sql.functions.schema_of_json 的用法。

用法:

pyspark.sql.functions.schema_of_json(json, options=None)

解析 JSON 字符串并以 DDL 格式推断其架构。

2.4.0 版中的新函数。

参数

json Column 或 str

JSON 字符串或包含 JSON 字符串的可折叠字符串列。

options字典,可选

控制解析的选项。接受与 JSON 数据源相同的选项。请参阅您使用的版本中的Data Source Option

在 3.0 版中更改:它接受options控制模式推断的参数。

例子

>>> df = spark.range(1)
>>> df.select(schema_of_json(lit('{"a": 0}')).alias("json")).collect()
[Row(json='STRUCT<`a`: BIGINT>')]
>>> schema = schema_of_json('{a: 1}', {'allowUnquotedFieldNames':'true'})
>>> df.select(schema.alias("json")).collect()
[Row(json='STRUCT<`a`: BIGINT>')]

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.functions.schema_of_json。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。