本文簡要介紹
pyspark.sql.functions.regexp_extract
的用法。用法:
pyspark.sql.functions.regexp_extract(str, pattern, idx)
從指定的字符串列中提取與 Java 正則表達式匹配的特定組。如果正則表達式不匹配,或者指定的組不匹配,則返回一個空字符串。
1.5.0 版中的新函數。
例子:
>>> df = spark.createDataFrame([('100-200',)], ['str']) >>> df.select(regexp_extract('str', r'(\d+)-(\d+)', 1).alias('d')).collect() [Row(d='100')] >>> df = spark.createDataFrame([('foo',)], ['str']) >>> df.select(regexp_extract('str', r'(\d+)', 1).alias('d')).collect() [Row(d='')] >>> df = spark.createDataFrame([('aaaac',)], ['str']) >>> df.select(regexp_extract('str', '(a+)(b)?(c)', 2).alias('d')).collect() [Row(d='')]
相關用法
- Python pyspark regexp_replace用法及代碼示例
- Python pyspark register_index_accessor用法及代碼示例
- Python pyspark register_series_accessor用法及代碼示例
- Python pyspark register_dataframe_accessor用法及代碼示例
- Python pyspark read_json用法及代碼示例
- Python pyspark reverse用法及代碼示例
- Python pyspark read_parquet用法及代碼示例
- Python pyspark read_spark_io用法及代碼示例
- Python pyspark read_delta用法及代碼示例
- Python pyspark read_orc用法及代碼示例
- Python pyspark read_table用法及代碼示例
- Python pyspark read_sql_query用法及代碼示例
- Python pyspark repeat用法及代碼示例
- Python pyspark read_excel用法及代碼示例
- Python pyspark read_csv用法及代碼示例
- Python pyspark read_sql_table用法及代碼示例
- Python pyspark read_sql用法及代碼示例
- Python pyspark read_html用法及代碼示例
- Python pyspark range用法及代碼示例
- Python pyspark rand用法及代碼示例
- Python pyspark rpad用法及代碼示例
- Python pyspark round用法及代碼示例
- Python pyspark randn用法及代碼示例
- Python pyspark create_map用法及代碼示例
- Python pyspark date_add用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.functions.regexp_extract。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。