當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.plot.density用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.plot.density 的用法。

用法:

plot.density(bw_method=None, ind=None, **kwargs)

使用高斯核生成核密度估計圖。

參數

bw_method標量

用於計算估計器帶寬的方法。有關詳細信息,請參閱PySpark 中的KernelDensity。

indNumPy 數組或整數,可選

估計 PDF 的評估點。如果無(默認),則使用 1000 個等距點。如果 ind 是 NumPy 數組,則在傳遞的點處評估 KDE。如果ind 是整數,則使用ind 等距點數。

**kwargs可選的

要傳遞給 pandas-on-Spark.Series.plot() 的關鍵字參數。

返回

plotly.graph_objs.Figure

backend!=plotly 時返回自定義對象。當subplots=True(僅限 matplotlib)時返回 ndarray。

例子

應指定標量帶寬。使用較小的帶寬值可能會導致過度擬合,而使用較大的帶寬值可能會導致欠擬合:

>>> s = ps.Series([1, 2, 2.5, 3, 3.5, 4, 5])
>>> s.plot.kde(bw_method=0.3)
>>> s = ps.Series([1, 2, 2.5, 3, 3.5, 4, 5])
>>> s.plot.kde(bw_method=3)

ind 參數確定估計 KDF 繪圖的評估點:

>>> s = ps.Series([1, 2, 2.5, 3, 3.5, 4, 5])
>>> s.plot.kde(ind=[1, 2, 3, 4, 5], bw_method=0.3)

對於 DataFrame,它的工作方式與 Series 相同:

>>> df = ps.DataFrame({
...     'x': [1, 2, 2.5, 3, 3.5, 4, 5],
...     'y': [4, 4, 4.5, 5, 5.5, 6, 6],
... })
>>> df.plot.kde(bw_method=0.3)
>>> df = ps.DataFrame({
...     'x': [1, 2, 2.5, 3, 3.5, 4, 5],
...     'y': [4, 4, 4.5, 5, 5.5, 6, 6],
... })
>>> df.plot.kde(bw_method=3)
>>> df = ps.DataFrame({
...     'x': [1, 2, 2.5, 3, 3.5, 4, 5],
...     'y': [4, 4, 4.5, 5, 5.5, 6, 6],
... })
>>> df.plot.kde(ind=[1, 2, 3, 4, 5, 6], bw_method=0.3)

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.plot.density。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。