当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.Series.info用法及代码示例


用法:

Series.info(verbose=None, buf=None, max_cols=None, memory_usage=None, show_counts=True)

打印系列的简明摘要。

此方法打印有关系列的信息,包括索引 dtype、非空值和内存使用情况。

参数

dataSeries

要打印有关信息的系列。

verbose布尔型,可选

是否打印完整的摘要。默认情况下,遵循pandas.options.display.max_info_columns 中的设置。

buf可写缓冲区,默认为 sys.stdout

将输出发送到哪里。默认情况下,输出打印到 sys.stdout。如果您需要进一步处理输出,请传递一个可写缓冲区。

memory_usage布尔,str,可选

指定是否应显示 Series 元素(包括索引)的总内存使用量。默认情况下,这遵循 pandas.options.display.memory_usage 设置。

True 总是显示内存使用情况。 False 从不显示内存使用情况。 ‘deep’ 的值相当于“True with deep introspection”。内存使用以人类可读的单位(base-2 表示)显示。在没有深入自省的情况下,基于列 dtype 和行数进行内存估计,假设值消耗相应 dtype 的相同内存量。使用深度内存自省,以计算资源为代价执行实际内存使用计算。

show_counts布尔型,可选

是否显示非空计数。默认情况下,仅当 DataFrame 小于 pandas.options.display.max_info_rowspandas.options.display.max_info_columns 时才会显示。 True 值始终显示计数,而 False 从不显示计数。

返回

None

此方法打印 Series 的摘要并返回 None。

例子

>>> int_values = [1, 2, 3, 4, 5]
>>> text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
>>> s = pd.Series(text_values, index=int_values)
>>> s.info()
<class 'pandas.core.series.Series'>
Int64Index:5 entries, 1 to 5
Series name:None
Non-Null Count  Dtype
--------------  -----
5 non-null      object
dtypes:object(1)
memory usage:80.0+ bytes

打印不包括有关其值的信息的摘要:

>>> s.info(verbose=False)
<class 'pandas.core.series.Series'>
Int64Index:5 entries, 1 to 5
dtypes:object(1)
memory usage:80.0+ bytes

Series.info 的管道输出到缓冲区而不是 sys.stdout,获取缓冲区内容并写入文本文件:

>>> import io
>>> buffer = io.StringIO()
>>> s.info(buf=buffer)
>>> s = buffer.getvalue()
>>> with open("df_info.txt", "w",
...           encoding="utf-8") as f: 
...     f.write(s)
260

memory_usage 参数允许深度自省模式,特别适用于大系列和fine-tune 内存优化:

>>> random_strings_array = np.random.choice(['a', 'b', 'c'], 10 ** 6)
>>> s = pd.Series(np.random.choice(['a', 'b', 'c'], 10 ** 6))
>>> s.info()
<class 'pandas.core.series.Series'>
RangeIndex:1000000 entries, 0 to 999999
Series name:None
Non-Null Count    Dtype
--------------    -----
1000000 non-null  object
dtypes:object(1)
memory usage:7.6+ MB
>>> s.info(memory_usage='deep')
<class 'pandas.core.series.Series'>
RangeIndex:1000000 entries, 0 to 999999
Series name:None
Non-Null Count    Dtype
--------------    -----
1000000 non-null  object
dtypes:object(1)
memory usage:55.3 MB

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Series.info。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。