當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.to_latex用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.to_latex 的用法。

用法:

Series.to_latex(buf: Optional[IO[str]] = None, columns: Optional[List[Union[Any, Tuple[Any, …]]]] = None, col_space: Optional[int] = None, header: bool = True, index: bool = True, na_rep: str = 'NaN', formatters: Union[List[Callable[[Any], str]], Dict[Union[Any, Tuple[Any, …]], Callable[[Any], str]], None] = None, float_format: Optional[Callable[[float], str]] = None, sparsify: Optional[bool] = None, index_names: bool = True, bold_rows: bool = False, column_format: Optional[str] = None, longtable: Optional[bool] = None, escape: Optional[bool] = None, encoding: Optional[str] = None, decimal: str = '.', multicolumn: Optional[bool] = None, multicolumn_format: Optional[str] = None, multirow: Optional[bool] = None) → Optional[str]

將對象渲染到 LaTeX 表格環境表。

將對象渲染到表格環境表。您可以將其拚接到 LaTeX 文檔中。需要 usepackage{booktabs}。

注意

僅當預期生成的 pandas 對象很小時才應使用此方法,因為所有數據都加載到驅動程序的內存中。如果輸入很大,請考慮其他格式。

參數

buf文件說明符或無

要寫入的緩衝區。如果為 None,則輸出作為字符串返回。

columns標簽列表,可選

要寫入的列的子集。默認情況下寫入所有列。

col_space整數,可選

每列的最小寬度。

headerbool 或 str 列表,默認 True

寫出列名。如果給出了字符串列表,則假定它是列名的別名。

index布爾值,默認為真

寫行名(索引)。

na_repstr,默認為“NaN”

缺少數據表示。

formatters{str: function} 的函數列表或字典,可選

按位置或名稱應用於列元素的格式化函數。每個函數的結果必須是一個 unicode 字符串。列表的長度必須等於列數。

float_formatstr,可選

浮點數的格式字符串。

sparsify布爾型,可選

對於具有分層索引的 DataFrame 設置為 False 以打印每行的每個多索引鍵。默認情況下,將從配置模塊讀取該值。

index_names布爾值,默認為真

打印索引的名稱。

bold_rows布爾值,默認為 False

在輸出中使行標簽加粗。

column_formatstr,可選

列格式如 LaTeX 表格式中指定,例如‘rcl’ 共 3 列。默認情況下,‘l’ 將用於除數字列(默認為 ‘r’)之外的所有列。

longtable布爾型,可選

默認情況下,將從 pandas 配置模塊讀取該值。使用長表環境而不是表格環境。需要將 usepackage{longtable} 添加到 LaTeX 序言中。

escape布爾型,可選

默認情況下,該值將從 pandas 配置模塊中讀取。當設置為 False 防止在列名中轉義乳膠特殊字符。

encodingstr,可選

表示要在輸出文件中使用的編碼的字符串,在 Python 2 上默認為 ‘ascii’,在 Python 3 上默認為“utf-8”。

decimalstr,默認“。”

識別為小數分隔符的字符,例如',' 在歐洲。

multicolumn布爾值,默認為真

使用多列增強MultiIndex列。默認值將從配置模塊中讀取。

multicolumn_formatstr,默認 ‘l’

多列的對齊方式,類似於column_format 默認將從配置模塊中讀取。

multirow布爾值,默認為 False

使用多行來增強 MultiIndex 行。需要將 usepackage{multirow} 添加到 LaTeX 序言中。將在包含的行上打印居中標簽(而不是頂部對齊),通過斜線分隔組。默認值將從 pandas 配置模塊中讀取。

返回

str 或 None

如果 buf 為 None,則以字符串形式返回生成的 LateX 格式。否則返回 None。

例子

>>> df = ps.DataFrame({'name': ['Raphael', 'Donatello'],
...                    'mask': ['red', 'purple'],
...                    'weapon': ['sai', 'bo staff']},
...                   columns=['name', 'mask', 'weapon'])
>>> print(df.to_latex(index=False)) 
\begin{tabular}{lll}
\toprule
      name &    mask &    weapon \\
\midrule
   Raphael &     red &       sai \\
 Donatello &  purple &  bo staff \\
\bottomrule
\end{tabular}

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.to_latex。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。