Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Dataframe.add()
方法用于添加数据帧和其他逐元素(二进制运算符add)。等效于 DataFrame +其他,但支持用fill_value代替输入之一中的丢失数据。
用法: DataFrame.add(other, axis=’columns’, level=None, fill_value=None)
参数:
other:系列,DataFrame或常量
axis:{0,1,'索引','列'}对于“系列”输入,轴与“
fill_value:[无值或浮点值,默认为无]用此值填充缺失的(NaN)值。如果两个DataFrame位置都丢失,则结果将丢失。
level:[int或name]在一个级别上广播,在传递的MultiIndex级别上匹配Index值
返回值:结果DataFrame
# Importing Pandas as pd
import pandas as pd
# Importing numpy as np
import numpy as np
# Creating a dataframe
# Setting the seed value to re-generate the result.
np.random.seed(25)
df = pd.DataFrame(np.random.rand(10, 3), columns =['A', 'B', 'C'])
# np.random.rand(10, 3) has generated a
# random 2-Dimensional array of shape 10 * 3
# which is then converted to a dataframe
df
注意: add()
函数类似于“ +”操作,但add()
为输入之一中的缺失值提供了额外的支持。
# We want NaN values in dataframe.
# so let's fill the last row with NaN value
df.iloc[-1] = np.nan
df
使用以下方法向 DataFrame 添加常量值add()
函数:
# add 1 to all the elements
# of the data frame
df.add(1)
注意上面的输出,df中的nan单元未进行任何加法运算dataframe.add()
函数具有属性fill_value
。这将用分配的值填充缺失值(Nan)。如果两个 DataFrame 值都丢失,那么结果将丢失。
让我们来看看如何做。
# We have given a default value
# of '10' for all the nan cells
df.add(1, fill_value = 10)
所有的nan单元格先填充10个,然后再添加1个。将系列添加到 DataFrame :
对于系列输入,索引的维必须与 DataFrame 和系列都匹配。
# Create a Series of 10 values
tk = pd.Series(np.ones(10))
# tk is a Series of 10 elements
# all filled with 1
# Add tk(series) to the df(dataframe)
# along the index axis
df.add(tk, axis ='index')
将一个数据帧与其他数据帧相加
# Create a second dataframe
# First set the seed to regenerate the result
np.random.seed(10)
# Create a 5 * 5 dataframe
df2 = pd.DataFrame(np.random.rand(5, 5), columns =['A', 'B', 'C', 'D', 'E'])
df2
让我们对这两个数据帧进行逐元素加法
df.add(df2)
请注意,所得 DataFrame 的尺寸为10 * 5,并且在所有 DataFrame 中任一 DataFrame 具有nan值的单元格中都具有nan值。
修复它-
# Set a default value of 10 for nan cells
# nan value won't be filled for those cells
# in which both data frames has nan value
df.add(df2, fill_value = 10)
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.add()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。