不可行起始牛顿法

时间:2023-02-09 20:24:21 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
不可行起始牛顿法

牛顿法(Newton's Method)是一种求解非线性方程组的有效近似求解方法,主要是解决实变函数的极值问题。主要应用于最小值问题的数值优化,常见的如梯度下降法,拟牛顿法、Levenberg-Marquardt方法等,它们都是求解非线性方程组的中立算法。

一、牛顿法的原理



牛顿法原理是寻找函数y = f(x)在某点x0处的泰勒展开式,即:

y = f(x0)+f’(x0)*(x-x0)+O(xx0)2

其中,O(xx0)2是泰勒展开式中其它未知项,值为x-x0时即为零 [1] 。将其带入方程:

f(x)=f(x0)+f’(x0)*(x-x0)

即可求出x1=x0-f(x0)/f’(x0),则x1x0的泰勒逼近值,这就是牛顿法的精髓。 二、牛顿法的工作方式

牛顿法的工作方式是求解一个连续的函数的极值,这个函数就是梯度下降法中提到的最小值函数,在这里我们以最小二乘法拟合曲线来描述牛顿法的工作方式:

三、牛顿法的优缺点

牛顿法具有准确性高、效率高的优点,是当前求解方程的首选技术; 1. 优点

(1)准确性高:牛顿法的关键是自适应的搜索步长,搜索步长可以很好的控制,牛顿法求解函数最小值时,可以更快地收敛到函数最低点,较梯度下降法更准确; (2)效率高:由于牛顿法是自适应搜索步长的,比如梯度下降法每次迭代还需要更改步长;而牛顿法采用自适应搜索步长,使得牛顿法的收敛速度远远大于梯度下降法,更快的收敛到最优值;

2. 缺点


(1)需要计算函数的海森矩阵(Hessian matrix),而海森矩阵的计算很耗费时间; (2)牛顿法不适合于使用在有噪声数据上,梯度下降法可以比较好的处理噪声,而牛顿法在有噪声数据上,收敛速度会变慢;

(3)当函数是非凸函数时,牛顿法无法收敛到局部最优解,容易陷入局部最优解。

四、牛顿法的应用

牛顿法在人工智能和机器学习中有大量的应用,主要用于求解最多的是非凸优化中的局部最优解。另外,由于它的优点,在梯度下降法减缓收敛步长难以迭代时,也可以使用牛顿法加快迭代速度及提高准确性,比如支持向量机(Support Vector Machines),K近邻(K Nearest Neighbor),神经网络(Neural Network)等。还可以用于多维函数求根、多维最小值问题、图像处理等场景下,更多应用可以自己去探索。


本文来源:https://www.wddqw.com/doc/a643f151ecf9aef8941ea76e58fafab069dc449a.html