本文簡要介紹
pyspark.pandas.DataFrame.assign
的用法。用法:
DataFrame.assign(**kwargs: Any) → pyspark.pandas.frame.DataFrame
將新列分配給 DataFrame。
返回一個包含所有原始列以及新列的新對象。重新分配的現有列將被覆蓋。
- **kwargs:{str:可調用,係列或索引}的字典
列名是關鍵字。如果這些值是可調用的,則會在 DataFrame 上計算它們並分配給新列。可調用不得更改輸入DataFrame(盡管pandas-on-Spark不檢查它)。如果值不可調用(例如係列或文字),則僅對它們進行賦值。
- DataFrame
除了所有現有列之外,還包含新的DataFrame。
參數:
返回:
注意:
可以在同一個
assign
中分配多個列,但不能引用新創建或修改的列。 Python 3.6 及更高版本的 pandas 支持此函數,但 pandas-on-Spark 不支持此函數。在pandas-on-Spark 中,首先計算所有項目,然後分配。例子:
>>> df = ps.DataFrame({'temp_c': [17.0, 25.0]}, ... index=['Portland', 'Berkeley']) >>> df temp_c Portland 17.0 Berkeley 25.0
其中值是可調用的,在
df
上評估:>>> df.assign(temp_f=lambda x: x.temp_c * 9 / 5 + 32) temp_c temp_f Portland 17.0 62.6 Berkeley 25.0 77.0
或者,可以通過直接引用現有係列或序列來實現相同的行為,您還可以在同一分配中創建多個列。
>>> assigned = df.assign(temp_f=df['temp_c'] * 9 / 5 + 32, ... temp_k=df['temp_c'] + 273.15, ... temp_idx=df.index) >>> assigned[['temp_c', 'temp_f', 'temp_k', 'temp_idx']] temp_c temp_f temp_k temp_idx Portland 17.0 62.6 290.15 Portland Berkeley 25.0 77.0 298.15 Berkeley
相關用法
- Python pyspark DataFrame.astype用法及代碼示例
- Python pyspark DataFrame.align用法及代碼示例
- Python pyspark DataFrame.any用法及代碼示例
- Python pyspark DataFrame.alias用法及代碼示例
- Python pyspark DataFrame.applymap用法及代碼示例
- Python pyspark DataFrame.append用法及代碼示例
- Python pyspark DataFrame.apply用法及代碼示例
- Python pyspark DataFrame.at用法及代碼示例
- Python pyspark DataFrame.add_prefix用法及代碼示例
- Python pyspark DataFrame.all用法及代碼示例
- Python pyspark DataFrame.add用法及代碼示例
- Python pyspark DataFrame.axes用法及代碼示例
- Python pyspark DataFrame.aggregate用法及代碼示例
- Python pyspark DataFrame.abs用法及代碼示例
- Python pyspark DataFrame.agg用法及代碼示例
- Python pyspark DataFrame.at_time用法及代碼示例
- Python pyspark DataFrame.add_suffix用法及代碼示例
- Python pyspark DataFrame.to_latex用法及代碼示例
- Python pyspark DataFrame.plot.bar用法及代碼示例
- Python pyspark DataFrame.to_delta用法及代碼示例
- Python pyspark DataFrame.quantile用法及代碼示例
- Python pyspark DataFrame.cumsum用法及代碼示例
- Python pyspark DataFrame.iloc用法及代碼示例
- Python pyspark DataFrame.dropDuplicates用法及代碼示例
- Python pyspark DataFrame.printSchema用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.assign。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。