Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。 Pandas 就是其中之一,它使导入和分析数据变得更加容易。
Pandas astype() 是最重要的方法之一。它用于更改系列的数据类型。当 DataFrame 是从 csv 文件制作的时,列被导入并自动设置数据类型,这很多时候并不是它实际应该有的。例如,salary 列可以作为字符串导入,但要进行操作,我们必须将其转换为浮点数。astype() 用于进行此类数据类型转换。
用法:DataFrame.astype(dtype, copy=True, errors=’raise’)
参数:
dtype:要将系列转换为的数据类型。 (例如 str、float、int)
copy:复制 dataframe/series.errors:Error 在转换为无效数据类型时引发。例如 dict 到字符串。 ‘raise’ 将引发错误,而 ‘ignore’ 将通过而不会引发错误。
Return type:数据类型改变的系列
下载以下示例中使用的数据集,请单击此处。在以下示例中,使用的 DataFrame 包含一些 NBA 球员的数据。下面附上任何操作前的 DataFrame 图像。
例:
本例中,导入 DataFrame ,并在 DataFrame 上调用.dtypes查看series的数据类型。之后,使用 .astype() 方法转换一些列并再次查看 dtype 以查看更改。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# storing dtype before converting
before = data.dtypes
# converting dtypes using astype
data["Salary"]= data["Salary"].astype(int)
data["Number"]= data["Number"].astype(str)
# storing dtype after converting
after = data.dtypes
# printing to compare
print("BEFORE CONVERSION\n", before, "\n")
print("AFTER CONVERSION\n", after, "\n")
输出:
如输出图像所示,列的数据类型进行了相应的转换。
相关用法
- Python Pandas series.cumprod()用法及代码示例
- Python Pandas Series.cumsum()用法及代码示例
- Python Pandas series.cummax()用法及代码示例
- Python Pandas Series.cummin()用法及代码示例
- Python Pandas Series.nonzero()用法及代码示例
- Python Pandas Series.mad()用法及代码示例
- Python Pandas Series.data用法及代码示例
注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Series.astype() to convert Data type of series。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。