当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark SQL Functions month方法用法及代码示例


PySpark SQL 函数的month(~) 方法提取每个列值的月份部分,该值可以是字符串或日期类型。

参数

1.col | stringColumn

从中提取月份的日期列。

返回值

整数的 Column 对象。

例子

考虑以下带有一些 datetime 值的 PySpark DataFrame:

import datetime
df = spark.createDataFrame([["Alex", datetime.date(1995,12,16)], ["Bob", datetime.date(1995,5,9)]], ["name", "birthday"])
df.show()



+----+----------+
|name|  birthday|
+----+----------+
|Alex|1995-12-16|
| Bob|1995-05-09|
+----+----------+

提取 PySpark DataFrame 中日期时间值的月份部分

要获取日期时间值的月份部分:

from pyspark.sql import functions as F
df.select(F.month("birthday").alias("month")).show()



+-----+
|month|
+-----+
|   12|
|    5|
+-----+

在这里,我们将名称 "month" 分配给 month(~) 返回的 Column 对象。

提取 PySpark DataFrame 中日期字符串的月份部分

要获取日期字符串的月份部分:

df = spark.createDataFrame([["Alex", "1995-12-16"], ["Bob", "1990-05-06"]], ["name", "birthday"])
df.select(F.month("birthday").alias("day")).show()



+-----+
|month|
+-----+
|   12|
|    5|
+-----+

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark SQL Functions | month method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。