当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.to_latex用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.to_latex 的用法。

用法:

DataFrame.to_latex(buf: Optional[IO[str]] = None, columns: Optional[List[Union[Any, Tuple[Any, …]]]] = None, col_space: Optional[int] = None, header: bool = True, index: bool = True, na_rep: str = 'NaN', formatters: Union[List[Callable[[Any], str]], Dict[Union[Any, Tuple[Any, …]], Callable[[Any], str]], None] = None, float_format: Optional[Callable[[float], str]] = None, sparsify: Optional[bool] = None, index_names: bool = True, bold_rows: bool = False, column_format: Optional[str] = None, longtable: Optional[bool] = None, escape: Optional[bool] = None, encoding: Optional[str] = None, decimal: str = '.', multicolumn: Optional[bool] = None, multicolumn_format: Optional[str] = None, multirow: Optional[bool] = None) → Optional[str]

将对象渲染到 LaTeX 表格环境表。

将对象渲染到表格环境表。您可以将其拼接到 LaTeX 文档中。需要 usepackage{booktabs}。

注意

仅当预期生成的 pandas 对象很小时才应使用此方法,因为所有数据都加载到驱动程序的内存中。如果输入很大,请考虑其他格式。

参数

buf文件说明符或无

要写入的缓冲区。如果为 None,则输出作为字符串返回。

columns标签列表,可选

要写入的列的子集。默认情况下写入所有列。

col_space整数,可选

每列的最小宽度。

headerbool 或 str 列表,默认 True

写出列名。如果给出了字符串列表,则假定它是列名的别名。

index布尔值,默认为真

写行名(索引)。

na_repstr,默认为“NaN”

缺少数据表示。

formatters{str: function} 的函数列表或字典,可选

按位置或名称应用于列元素的格式化函数。每个函数的结果必须是一个 unicode 字符串。列表的长度必须等于列数。

float_formatstr,可选

浮点数的格式字符串。

sparsify布尔型,可选

对于具有分层索引的 DataFrame 设置为 False 以打印每行的每个多索引键。默认情况下,将从配置模块读取该值。

index_names布尔值,默认为真

打印索引的名称。

bold_rows布尔值,默认为 False

在输出中使行标签加粗。

column_formatstr,可选

列格式如 LaTeX 表格式中指定,例如‘rcl’ 共 3 列。默认情况下,‘l’ 将用于除数字列(默认为 ‘r’)之外的所有列。

longtable布尔型,可选

默认情况下,将从 pandas 配置模块读取该值。使用长表环境而不是表格环境。需要将 usepackage{longtable} 添加到 LaTeX 序言中。

escape布尔型,可选

默认情况下,该值将从 pandas 配置模块中读取。当设置为 False 防止在列名中转义乳胶特殊字符。

encodingstr,可选

表示要在输出文件中使用的编码的字符串,在 Python 2 上默认为 ‘ascii’,在 Python 3 上默认为“utf-8”。

decimalstr,默认“。”

识别为小数分隔符的字符,例如',' 在欧洲。

multicolumn布尔值,默认为真

使用多列增强MultiIndex列。默认值将从配置模块中读取。

multicolumn_formatstr,默认 ‘l’

多列的对齐方式,类似于column_format 默认将从配置模块中读取。

multirow布尔值,默认为 False

使用多行来增强 MultiIndex 行。需要将 usepackage{multirow} 添加到 LaTeX 序言中。将在包含的行上打印居中标签(而不是顶部对齐),通过斜线分隔组。默认值将从 pandas 配置模块中读取。

返回

str 或 None

如果 buf 为 None,则以字符串形式返回生成的 LateX 格式。否则返回 None。

例子

>>> df = ps.DataFrame({'name': ['Raphael', 'Donatello'],
...                    'mask': ['red', 'purple'],
...                    'weapon': ['sai', 'bo staff']},
...                   columns=['name', 'mask', 'weapon'])
>>> print(df.to_latex(index=False)) 
\begin{tabular}{lll}
\toprule
      name &    mask &    weapon \\
\midrule
   Raphael &     red &       sai \\
 Donatello &  purple &  bo staff \\
\bottomrule
\end{tabular}

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.to_latex。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。