当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python numpy polyfit用法及代码示例


本文简要介绍 python 语言中 numpy.polyfit 的用法。

用法:

numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)

最小二乘多项式拟合。

注意

这构成了旧多项式 API 的一部分。从版本 1.4 开始,首选在 numpy.polynomial 中定义的新多项式 API。可以在过渡指南中找到差异摘要。

拟合多项式p(x) = p[0] * x**deg + ... + p[deg]学位到点(x, y).返回系数向量p最小化订单中的平方误差,度-1, …0.

Polynomial.fit 类方法推荐用于新代码,因为它在数值上更稳定。有关详细信息,请参阅该方法的文档。

参数

x 数组, 形状 (M,)

M 个采样点的 x 坐标 (x[i], y[i])

y 数组, 形状 (M,) 或 (M, K)

样本点的 y 坐标。通过传入每列包含一个数据集的 2D-array,可以一次拟合多个共享相同 x 坐标的样本点数据集。

deg int

拟合多项式的次数

rcond 浮点数,可选

拟合的相对条件数。相对于最大奇异值小于此的奇异值将被忽略。默认值为 len(x)*eps,其中 eps 是浮点类型的相对精度,大多数情况下约为 2e-16。

full 布尔型,可选

开关确定返回值的性质。当它为 False(默认值)时,仅返回系数,当还返返回自奇异值分解的 True 诊断信息时。

w 数组,形状(M,),可选

重量。如果不是 None,则权重 w[i] 适用于 x[i] 处的未平方残差 y[i] - y_hat[i]。理想情况下,选择权重以使产品w[i]*y[i] 的误差都具有相同的方差。使用 inverse-variance 加权时,请使用 w[i] = 1/sigma(y[i]) 。默认值为无。

cov bool 或 str,可选

如果给定而不是False,不仅返回估计值,还返回其协方差矩阵。默认情况下,协方差按 chi2/dof 缩放,其中 dof = M - (deg + 1),即,权重被假定为不可靠,除非在相对意义上,并且所有内容都被缩放,使得减少的 chi2 是统一的。如果cov='unscaled',与权重为 w = 1/sigma 的情况相关,已知 sigma 是对不确定性的可靠估计。

返回

p ndarray,形状(deg + 1,)或(deg + 1,K)

多项式系数,最高功率优先。如果y是二维的,系数为k-th 数据集在p[:,k].

残差,排名,singular_values,rcond

这些值仅在 full == True 时返回

  • 残差 - 最小二乘拟合的残差平方和

  • rank - 缩放的 Vandermonde 的有效等级

    系数矩阵

  • singular_values - 缩放的 Vandermonde 的奇异值

    系数矩阵

  • rcond - rcond 的值。

有关详细信息,请参阅 numpy.linalg.lstsq

V ndarray,形状(M,M)或(M,M,K)

仅在以下情况下出现full == Falsecov == True.多项式系数估计的协方差矩阵。该矩阵的对角线是每个系数的方差估计。如果 y 是一个二维数组,那么k-th 数据集在V[:,:,k]

警告

RankWarning

最小二乘拟合中系数矩阵的秩不足。仅当 full == False 时才会引发警告。

可以通过以下方式关闭警告

>>> import warnings
>>> warnings.simplefilter('ignore', np.RankWarning)

注意

该解决方案使平方误差最小化

在等式中:

x[0]**n * p[0] + ... + x[0] * p[n-1] + p[n] = y[0]
x[1]**n * p[0] + ... + x[1] * p[n-1] + p[n] = y[1]
...
x[k]**n * p[0] + ... + x[k] * p[n-1] + p[n] = y[k]

系数p的系数矩阵是Vandermonde矩阵。

polyfit发出一个RankWarning当最小二乘拟合条件不好时。这意味着由于数值误差,最佳拟合并未明确定义。通过降低多项式次数或替换可以改善结果x经过x-x.mean()。这rcond参数也可以设置为小于其默认值的值,但结果拟合可能是虚假的:包括来自小的奇异值的贡献可能会给结果添加数值噪声。

请注意,当多项式的次数很大或样本点的间隔严重居中时,拟合多项式系数本质上是不良条件的。在这些情况下,应始终检查配合质量。当多项式拟合不令人满意时,样条曲线可能是一个不错的选择。

参考

1

维基百科,“Curve fitting”,https://en.wikipedia.org/wiki/Curve_fitting

2

维基百科,“Polynomial interpolation”,https://en.wikipedia.org/wiki/Polynomial_interpolation

例子

>>> import warnings
>>> x = np.array([0.0, 1.0, 2.0, 3.0,  4.0,  5.0])
>>> y = np.array([0.0, 0.8, 0.9, 0.1, -0.8, -1.0])
>>> z = np.polyfit(x, y, 3)
>>> z
array([ 0.08703704, -0.81349206,  1.69312169, -0.03968254]) # may vary

使用 poly1d 对象来处理多项式很方便:

>>> p = np.poly1d(z)
>>> p(0.5)
0.6143849206349179 # may vary
>>> p(3.5)
-0.34732142857143039 # may vary
>>> p(10)
22.579365079365115 # may vary

高阶多项式可能会剧烈振荡:

>>> with warnings.catch_warnings():
...     warnings.simplefilter('ignore', np.RankWarning)
...     p30 = np.poly1d(np.polyfit(x, y, 30))
...
>>> p30(4)
-0.80000000000000204 # may vary
>>> p30(5)
-0.99999999999999445 # may vary
>>> p30(4.5)
-0.10547061179440398 # may vary

示例:

>>> import matplotlib.pyplot as plt
>>> xp = np.linspace(-2, 6, 100)
>>> _ = plt.plot(x, y, '.', xp, p(xp), '-', xp, p30(xp), '--')
>>> plt.ylim(-2,2)
(-2, 2)
>>> plt.show()
numpy-polyfit-1.png

相关用法


注:本文由纯净天空筛选整理自numpy.org大神的英文原创作品 numpy.polyfit。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。