當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.fillna用法及代碼示例


本文簡要介紹 pyspark.sql.DataFrame.fillna 的用法。

用法:

DataFrame.fillna(value, subset=None)

替換空值,na.fill() 的別名。 DataFrame.fillna() DataFrameNaFunctions.fill() 互為別名。

版本 1.3.1 中的新函數。

參數

valueint、float、string、bool 或 dict

用於替換空值的值。如果值是 dict,則忽略 subset 並且 value 必須是從列名(字符串)到替換值的映射。替換值必須是 int、float、boolean 或 string。

subsetstr,元組或列表,可選

要考慮的列名的可選列表。子集中指定的不具有匹配數據類型的列將被忽略。例如,如果value 是一個字符串,並且子集包含一個非字符串列,則簡單地忽略非字符串列。

例子

>>> df4.na.fill(50).show()
+---+------+-----+
|age|height| name|
+---+------+-----+
| 10|    80|Alice|
|  5|    50|  Bob|
| 50|    50|  Tom|
| 50|    50| null|
+---+------+-----+
>>> df5.na.fill(False).show()
+----+-------+-----+
| age|   name|  spy|
+----+-------+-----+
|  10|  Alice|false|
|   5|    Bob|false|
|null|Mallory| true|
+----+-------+-----+
>>> df4.na.fill({'age': 50, 'name': 'unknown'}).show()
+---+------+-------+
|age|height|   name|
+---+------+-------+
| 10|    80|  Alice|
|  5|  null|    Bob|
| 50|  null|    Tom|
| 50|  null|unknown|
+---+------+-------+

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrame.fillna。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。