Python pandas.DataFrame.convert_dtypes用法及代码示例

用法: DataFrame.convert_dtypes(infer_objects=True, convert_string=True, convert_integer=True, convert_boolean=True, convert_floating=True)

使用支持 pd.NA 的 dtypes 将列转换为可能的最佳 dtypes。

参数：

infer_objects：布尔值，默认为真

是否应将对象 dtypes 转换为可能的最佳类型。

convert_string：布尔值，默认为真

对象 dtypes 是否应转换为 StringDtype() 。

convert_integer：布尔值，默认为真

如果可能，是否可以转换为整数扩展类型。

convert_boolean：布尔值，默认为真

对象 dtypes 是否应转换为 BooleanDtypes() 。

convert_floating：布尔值，默认为真

如果可能，是否可以转换为浮点数扩展类型。如果 convert_integer 也是 True，如果可以将浮点数忠实地转换为整数，则将优先考虑整数 dtype。

Series或DataFrame: 具有新 dtype 的输入对象的副本。

注意：

默认情况下，convert_dtypes 将尝试将 Series(或 DataFrame 中的每个 Series)转换为支持 pd.NA 的 dtypes。通过使用选项 convert_string 、 convert_integer 、 convert_boolean 和 convert_boolean ，可以分别关闭对 StringDtype 、整数扩展类型、 BooleanDtype 或浮点扩展类型的单独转换。

对于 object-dtyped 列，如果 infer_objects 是 True ，则使用正常系列/数据帧构造期间的推理规则。然后，如果可能，转换为 StringDtype 、 BooleanDtype 或适当的整数或浮点扩展类型，否则保留为 object 。

如果 dtype 是整数，则转换为适当的整数扩展类型。

如果 dtype 是数字，并且由所有整数组成，则转换为适当的整数扩展类型。否则，转换为适当的浮点数扩展类型。

将来，随着添加支持 pd.NA 的新 dtype，此方法的结果将更改为支持这些新 dtype。

例子：

>>> df = pd.DataFrame(
...     {
...         "a":pd.Series([1, 2, 3], dtype=np.dtype("int32")),
...         "b":pd.Series(["x", "y", "z"], dtype=np.dtype("O")),
...         "c":pd.Series([True, False, np.nan], dtype=np.dtype("O")),
...         "d":pd.Series(["h", "i", np.nan], dtype=np.dtype("O")),
...         "e":pd.Series([10, np.nan, 20], dtype=np.dtype("float")),
...         "f":pd.Series([np.nan, 100.5, 200], dtype=np.dtype("float")),
...     }
... )

从具有默认 dtypes 的 DataFrame 开始。

>>> df
   a  b      c    d     e      f
0  1  x   True    h  10.0    NaN
1  2  y  False    i   NaN  100.5
2  3  z    NaN  NaN  20.0  200.0

>>> df.dtypes
a      int32
b     object
c     object
d     object
e    float64
f    float64
dtype:object

转换 DataFrame 以使用可能的最佳 dtypes。

>>> dfn = df.convert_dtypes()
>>> dfn
   a  b      c     d     e      f
0  1  x   True     h    10   <NA>
1  2  y  False     i  <NA>  100.5
2  3  z   <NA>  <NA>    20  200.0

>>> dfn.dtypes
a      Int32
b     string
c    boolean
d     string
e      Int64
f    Float64
dtype:object

从 np.nan 表示的一系列字符串和缺失数据开始。

>>> s = pd.Series(["a", "b", np.nan])
>>> s
0      a
1      b
2    NaN
dtype:object

获取具有 dtype StringDtype 的系列。

>>> s.convert_dtypes()
0       a
1       b
2    <NA>
dtype:string

相关用法

注：本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.DataFrame.convert_dtypes。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

注意：

例子：