非线性方程(组)的解法

本文关注非线性方程(组)的解法，包括一元情况下非线性方程的bisetion, regula falsi, 不动点迭代, Newton法, 多元情况下非线性方程组的Newton法, Broyden法。与之对比的是线性方程组的求解，如LU分解、QR分解等。

Bisection

求解线性方程组 $f(x)=0$ 相当于求解函数 $f(x)$ 的零点。

利用零点存在性定理来求解的方法就是二分法。根据闭区间套定理，二分法的收敛性很容易证明。

同时，区间的长度每次减半，精度等于最终区间的长度。

Regula Falsi

Regula falsi 也即 false position bisection，是二分法的一种变种，与二分法的区别是采用线性插值零点作为新的二分点。与二分法一样，它也是能保证收敛性的。

这种方法相当于用线性函数来逼近原函数 $f(x)$ ，那么很显然，当 $f(x)$ 与线性函数越接近，regula falsi的效果越好；反之，它的效果差于二分法。

Fixed Point Iteration

不动点迭代是一种经典的求解非线性方程的方法。在求解线性方程组的问题中，不动点迭代法相当于 Jacobi 迭代法。

不动点迭代的核心思想是将 $f(x)=0$ 转化为 $x=g(x)$ , 然后不断地进行迭代

x_{k+1}=g(x_k)

对于同一个问题，可以找到多个 $g(x)$ , 不动点迭代的效果取决于 $g(x)$ 的好坏。

Linear Convergence

假设精确解为 $x_*$ ，其满足 $x_*=g(x_*)$ . 那么

x_{k+1}-x_*=g(x_k)-g(x_*)=g'(\xi_k)(x_k-x_*)\le|g'(\xi_k)||x_k-x_*|

当 $|g'(x)|< 1, \forall x$ 时, 具有全局线性收敛性。

假设仅有 $|g'(x_*)|<1$ , 且 $g'(x)$ 连续，则有局部线性收敛性。

Quadratic Convergence

当 $g'(x_*)=0$ 时，在 $x_*$ 的邻域进行泰勒展开，有

x_{k+1}-x_*=g(x_k)-g(x_*)=\frac{g''(\xi)}{2!}(x-x_*)^2\le C(x_k-x_*)^2， \exist C

具有局部二次收敛性

Newton’s Method

Basic Newton’s Method

Newton 法的思想是用切线来近似 $f(x)$ , 即 $f(x)\approx f(x_0)+f'(x_0)(x-x_0)$

Newton 法的迭代公式为

x_{k+1}=x_k-\frac{f(x_k)}{f'(x_k)}

实际上，它是一种精心构造的不动点迭代法。令

g(x)=x-\frac{f(x)}{f'(x)}

g'(x)=1-\frac{(f'(x))^2-f(x)f''(x)}{(f'(x))^2}=\frac{f(x)f''(x)}{(f'(x))^2}

当 $f'(x_*)\not=0$ 时，根据前面的结论可以知道此时 Newton 法具有局部二次收敛。

可以证明当 $x_*$ 为重根(i.e. $f(x_*)=f'(x_*)=\cdots=f^{(m)}(x_*)$ ) 时，依然具有局部线性收敛性。

对于重根，可以做以下修正

x_{k+1}=x_k-\frac{(m+1)f(x_k)}{f'(x_k)}

这样也有局部二次收敛性，读者可以自行证明。

Secant Method

当求导的操作很贵时，可以考虑用割线来代替割线

f'(x_k)\approx \frac{f(x_k)-f(x_{k-1})}{x_k-x_{k-1}}

x_{k+1}=x_k-\frac{f(x_k)(x_k-x_{k-1})}{f(x_k)-f(x_{k-1})}

可以证明采用割线法，收敛阶为黄金分割比例 $\frac{1+\sqrt5}{2}\approx1.618$

引入 Newton 插值中 $n$ 阶差商的记号 $f[x_1,x_2,\dots,x_n]=\sum\limits_{i=1}^{k+1}f(x_i)\prod\limits_{j\ne i}(x_i-x_j)^{-1}$

这样，已知给定 $x_k,x_{k-1}$ ，加入 $x_*$ 进行插值，可以得到

0=f(x_*)=f(x_k)+f[x_k,x_{k-1}](x_*-x_k)+f[x_k,x_{k-1},x_*](x_*-x_k)(x_*-x_{k-1})

利用差商重写迭代公式

0=f(x_k)+f[x_k,x_{k-1}](x_{k+1}-x_k)

两式相减可以得到

x_*-x_{k+1}=-\frac{f[x_k,x_{k-1},x_*]}{f[x_k,x_{k-1}]}(x_*-x_k)(x_*-x_{k-1})

根据 Roole 中值定理， $n$ 阶差商具有以下性质

f[x_1,\dots,x_{n+1}]=f^{(n)}(\xi)/n!

所以当 $f$ 的一阶和二阶导数均有界时，有

|x_*-x_{k+1}|\le M |x_*-x_{k}||x_*-x_{k-1}|,\exist M

这与 Fibonacci 数列 $F_k$ 十分相关，可以证明

|x_*-x_{k}|\le C |x_*-x_{0}|^{F_k}

根据 $F_k$ 的通项公式，可以知道收敛阶为黄金分割比例 $\frac{1+\sqrt5}{2}\approx1.618$

Steffensen’s Method

迭代公式如下

x_{k+1}=x_k-\frac{f(x_k)}{\frac{f(x_k+f(x_k))-f(x_k)}{f(x_k)}}=x_k-\frac{(f(x_k))^2}{f(x_k+f(x_k))-f(x_k)}

这种方法二次收敛

非线性方程组的求解

以上的都是求解一元非线性方程的方法。以下讨论非线性方程组的解法 (特别指 $\R^n \mapsto \R^n$ ).

Newton’s Method

与一元的类似，将导数换成了Jacobi矩阵

x_{k+1}=x_k-J_k^{-1}f(x_k)

Good Broyden Method

在 Newton 法中，可以看出一个缺点是每一步迭代都要求解一次线性方程组，时间复杂度是 $O(n^3)$ ，很不划算。Broyden 方法就是为了解决这一问题。

它的目标是近似地求 $J_k$ ，从而使得求逆变得方便。很容易联想到 Sherman-Morrison-Woodbury 公式

(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}

假如每次更新 $J_k$ 都只加入秩一修正，那么就好办了

J_K=J_{k-1}+[rank\ 1]

因为 $J_k$ 为 Jacobi 矩阵，所以它应该满足 $J_k\Delta x_k=\Delta f_k$ ，这样当迭代足够多次后， $J_k$ 能较好地近似真实的 Jacobi 矩阵。

令 $r_k=\Delta f_k-J_{k-1}\Delta x_k=\Delta J\Delta x_k$

因为 $rank(\Delta J)=1$ , $\exist y_k,\Delta J=r_ky_k^T,y_k^T\Delta x_k=1$ . 同时，要使得 $||\Delta J||_F=||r_k||_2||y_k||_2$ 最小.

由 Cauchy 不等式可知 $||y_k||_2||\Delta x_k||_2 \ge 1$ , 因此 $||y_k||_2\ge \frac1{||\Delta x_k||_2}$ , 当且仅当 $y_k=\frac{\Delta x}{\Delta x_k^T\Delta x_k}$ 时，等号成立

所以可以知道 $J_k$ 的更新公式

J_k=J_{k-1}+\frac{(\Delta f_k-J_{k-1}\Delta x_k)\Delta x_k^T}{\Delta x_k^T\Delta x_k}

代入 Sherman-Morrison-Woodbury 公式可得

\begin{aligned} J_k^{-1}&=J_{k-1}^{-1}-\frac{J_{k-1}^{-1}(\Delta f_k-J_{k-1}\Delta x_k)\Delta x_k^TJ_{k-1}^{-1}}{\Delta x_k^T\Delta x_k+\Delta x_k^T\Delta x_k(\Delta f_k-J_{k-1}\Delta x_k)}\\ &=J^{-1}_{k-1}+\frac{(\Delta x_k-J_{k-1}^{-1}\Delta f_k)\Delta x_k^TJ_{k-1}^{-1}}{\Delta f_k^T\Delta f_k} \end{aligned}

Bad Broyden Method

所谓 Good 和 Bad，其实并不表示实际效果的好坏，只是两种方法名字的区分。Bad Broyden 方法是直接对 $J_k^{-1}$ 做秩一修正，也就是要满足

J_k^{-1}=J_{k-1}^{-1}+\Delta J

\Delta x_k=J_k^{-1}\Delta f_k

相同的处理，最终可以得到更新公式

J_k^{-1}=J_{k-1}^{-1}+\frac{(\Delta x_k-J_k^{-1}\Delta f_k)\Delta f_k^T}{\Delta f_k^T\Delta f_k}

数值算法

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

函数插值 Previous

lightsout game and its solution Next