當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.to_excel用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.to_excel 的用法。

用法:

Series.to_excel(excel_writer: Union[str, pandas.io.excel._base.ExcelWriter], sheet_name: str = 'Sheet1', na_rep: str = '', float_format: Optional[str] = None, columns: Union[str, List[str], None] = None, header: bool = True, index: bool = True, index_label: Union[str, List[str], None] = None, startrow: int = 0, startcol: int = 0, engine: Optional[str] = None, merge_cells: bool = True, encoding: Optional[str] = None, inf_rep: str = 'inf', verbose: bool = True, freeze_panes: Optional[Tuple[int, int]] = None) → None

將對象寫入 Excel 工作表。

注意

僅當生成的 DataFrame 預計很小時才應使用此方法,因為所有數據都加載到驅動程序的內存中。

要將單個對象寫入 Excel .xlsx 文件,隻需指定目標文件名。要寫入多個工作表,需要使用目標文件名創建ExcelWriter 對象,並在文件中指定要寫入的工作表。

通過指定唯一的 sheet_name 可以寫入多個工作表。將所有數據寫入文件後,有必要保存更改。請注意,使用已存在的文件名創建ExcelWriter 對象將導致現有文件的內容被擦除。

參數

excel_writerstr 或 ExcelWriter 對象

文件路徑或現有 ExcelWriter。

sheet_namestr,默認為“Sheet1”

將包含 DataFrame 的工作表的名稱。

na_repstr,默認“”

缺少數據表示。

float_formatstr,可選

浮點數的格式字符串。例如 float_format="%%.2f" 會將 0.1234 格式化為 0.12。

columnsstr 的序列或列表,可選

要寫的列。

headerbool 或 str 列表,默認 True

寫出列名。如果給出字符串列表,則假定它是列名的別名。

index布爾值,默認為真

寫行名(索引)。

index_labelstr 或序列,可選

如果需要,索引列的列標簽。如果未指定,並且 headerindex 為 True,則使用索引名稱。如果 DataFrame 使用 MultiIndex,則應給出序列。

startrow整數,默認 0

左上角單元格行轉儲數據幀。

startcol整數,默認 0

左上角單元格列轉儲 DataFrame 。

enginestr,可選

編寫要使用的引擎,‘openpyxl’ 或 ‘xlsxwriter’。您也可以通過選項 io.excel.xlsx.writerio.excel.xls.writerio.excel.xlsm.writer 進行設置。

merge_cells布爾值,默認為真

將 MultiIndex 和分層行寫入合並單元格。

encodingstr,可選

生成的 excel 文件的編碼。隻有 xlwt 需要,其他編寫器原生支持 unicode。

inf_repstr,默認 ‘inf’

無窮大的表示(Excel 中沒有無窮大的本機表示)。

verbose布爾值,默認為真

在錯誤日誌中顯示更多信息。

freeze_panesint 的元組(長度 2),可選

指定要凍結的從 1 開始的最底行和最右列。

注意

保存工作簿後,如果不重寫整個工作簿,就無法寫入更多數據。

例子

創建、寫入和保存工作簿:

>>> df1 = ps.DataFrame([['a', 'b'], ['c', 'd']],
...                    index=['row 1', 'row 2'],
...                    columns=['col 1', 'col 2'])
>>> df1.to_excel("output.xlsx")

要指定工作表名稱:

>>> df1.to_excel("output.xlsx")  
>>> df1.to_excel("output.xlsx",
...              sheet_name='Sheet_name_1')

如果您希望寫入工作簿中的多個工作表,則必須指定 ExcelWriter 對象:

>>> with pd.ExcelWriter('output.xlsx') as writer:  
...      df1.to_excel(writer, sheet_name='Sheet_name_1')
...      df2.to_excel(writer, sheet_name='Sheet_name_2')

要設置用於編寫 Excel 文件的庫,您可以傳遞 engine 關鍵字(根據文件擴展名自動選擇默認引擎):

>>> df1.to_excel('output1.xlsx', engine='xlsxwriter')

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.to_excel。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。