当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python numpy polynomial.polyfit用法及代码示例


本文简要介绍 python 语言中 numpy.polynomial.polynomial.polyfit 的用法。

用法:

polynomial.polynomial.polyfit(x, y, deg, rcond=None, full=False, w=None)

多项式与数据的最小二乘拟合。

返回多项式的系数这是适合数据值的最小二乘y在点给出x.如果y是一维的,返回的系数也将是一维的。如果y是 2-D 多次拟合完成,每列一个y,并且得到的系数存储在二维返回的相应列中。拟合多项式的形式为

其中 n 是度数。

参数

x 数组样,形状(M,)

的 x 坐标M样本(数据)点(x[i], y[i]).

y 数组样,形状(M,) 或者 (M,K)

样本点的 y 坐标。共享相同 x 坐标的几组样本点可以(独立地)通过一次调用来拟合numpy.polyfit通过传入y一个二维数组,每列包含一个数据集。

deg int 或 1-D 数组

拟合多项式的次数。如果 deg 是单个整数,则所有直到并包括 deg'th 项的项都包含在拟合中。对于 NumPy 版本 >= 1.11.0,可以使用指定要包含的项的度数的整数列表来代替。

rcond 浮点数,可选

拟合的相对条件数。奇异值小于rcond,相对于最大奇异值,将被忽略。默认值为len(x)*eps,其中每股收益是平台浮点类型的相对精度,大多数情况下约为 2e-16。

full 布尔型,可选

开关决定返回值的性质。当False(默认)只返回系数;当 True 时,还返返回自奇异值分解(用于求解拟合矩阵方程)的诊断信息。

w 数组样,形状(M,), 可选的

重量。如果不是 None,则权重 w[i] 适用于 x[i] 处的未平方残差 y[i] - y_hat[i]。理想情况下,选择权重以使产品w[i]*y[i] 的误差都具有相同的方差。使用 inverse-variance 加权时,请使用 w[i] = 1/sigma(y[i]) 。默认值为无。

返回

coef ndarray,形状(+ 1,) 或 (+ 1,K)

多项式系数从低到高排序。如果 y 是二维的,则 coef 的 k 列中的系数表示拟合 y 的 k-th 列中数据的多项式。

[residuals, rank, singular_values, rcond] 列表

这些值仅在 full == True 时返回

  • 残差 - 最小二乘拟合的残差平方和

  • rank - 缩放的 Vandermonde 矩阵的数值等级

  • singular_values - 缩放范德蒙矩阵的奇异值

  • rcond - rcond 的值。

有关详细信息,请参阅 numpy.linalg.lstsq

抛出

RankWarning

如果最小二乘拟合中的矩阵存在秩不足,则引发该错误。仅当 full == False 时才会引发警告。可以通过以下方式关闭警告:

>>> import warnings
>>> warnings.simplefilter('ignore', np.RankWarning)

注意

解是使加权平方误差之和最小化的多项式 p 的系数

其中 是权重。这个问题通过建立(通常)over-determined矩阵方程来解决:

其中 V 是 x 的加权伪 Vandermonde 矩阵,c 是要求解的系数,w 是权重,y 是观测值。然后使用 V 的奇异值分解求解该方程。

如果某些奇异值V太小以至于被忽视(和numpy.full==False), 一种RankWarning将被提高。这意味着可能很难确定系数值。拟合低阶多项式通常会消除警告(但可能不是您想要的,当然;如果您有独立的理由选择不工作的度数,您可能必须:a)重新考虑这些原因,和/或 b) 重新考虑您的数据质量)。这rcond参数也可以设置为小于其默认值的值,但结果拟合可能是虚假的并且有很大的舍入误差贡献。

使用双精度的多项式拟合倾向于 “fail” 大约(多项式)20 次。使用切比雪夫或勒让德级数的拟合通常条件较好,但很大程度上仍取决于样本点的分布和数据的平滑度。如果配合质量不合适,样条曲线可能是一个不错的选择。

例子

>>> np.random.seed(123)
>>> from numpy.polynomial import polynomial as P
>>> x = np.linspace(-1,1,51) # x "data": [-1, -0.96, ..., 0.96, 1]
>>> y = x**3 - x + np.random.randn(len(x)) # x^3 - x + N(0,1) "noise"
>>> c, stats = P.polyfit(x,y,3,full=True)
>>> np.random.seed(123)
>>> c # c[0], c[2] should be approx. 0, c[1] approx. -1, c[3] approx. 1
array([ 0.01909725, -1.30598256, -0.00577963,  1.02644286]) # may vary
>>> stats # note the large SSR, explaining the rather poor results
 [array([ 38.06116253]), 4, array([ 1.38446749,  1.32119158,  0.50443316, # may vary
          0.28853036]), 1.1324274851176597e-014]

一样的东西,没有额外的噪音

>>> y = x**3 - x
>>> c, stats = P.polyfit(x,y,3,full=True)
>>> c # c[0], c[2] should be "very close to 0", c[1] ~= -1, c[3] ~= 1
array([-6.36925336e-18, -1.00000000e+00, -4.08053781e-16,  1.00000000e+00])
>>> stats # note the minuscule SSR
[array([  7.46346754e-31]), 4, array([ 1.38446749,  1.32119158, # may vary
           0.50443316,  0.28853036]), 1.1324274851176597e-014]

相关用法


注:本文由纯净天空筛选整理自numpy.org大神的英文原创作品 numpy.polynomial.polynomial.polyfit。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。