顶部横幅广告
  • 微信
您当前的位置:首页 > 资讯

第九章 函数逼近

作者:三青 时间:2023-05-29 阅读数:人阅读

 

一、从空间角度分析函数逼近

1.函数逼近的一般问题

函数逼近到底要研究解决什么问题呢?这个问题主要是因为一个函数较为复杂,研究如何使用一些初等函数近似表示这个函数,目的是方便使用,可能比较简单的函数就是多项式函数,因此多项式函数常常用来逼近一个函数。换句话说,函数逼近就是使用简单的函数在自变量所在的定义域内不求都相等,但求尽量相近。逼近的结果就是选用的逼近函数不仅仅近似表达一个函数,而且容易计算机存储和操纵。函数逼近获得广泛应用也是计算数学发展的要求。

函数逼近包含最基本的三个要素:一个是函数族;一个是参数形式;一个是范数。那么下面就谈谈这三个形式。

函数族(记为 F\mathcal F):也就是如果要逼近一个函数f(x)f(x) ,我们选定一个集合,从这个集合内挑选一个函数来逼近这个函数 f(x)f(x)。为什么规定一个函数族呢?还是数学上的那句话,研究数学时候总给它设置一个范围,防止它失去控制,因此我们逼近f(x)f(x),不能所有的函数都去研究,那范围太广泛了,没法研究了,还有一个原因是我们选择一个简单函数来逼近f(x)f(x),那才有意义,否则逼近的函数比f(x)f(x)还复杂,那就没啥意思了。既然是函数族,一般在定义域[a,b][a,b] 上也就有如下四类:连续函数族,有界函数族,均方可积函数族和 pp 方的L-S可积函数族。分别记作如下: C[a,b],L∞[a,b],L2[a,b],Lp[a,b]\mathcal C[a,b],\mathcal L_\infty[a,b], \mathcal L_2[a,b], \mathcal L_p[a,b] 。我们选择这些函数也意味着即将用来逼近 f(x)f(x) 的函数就在这个函数族中。

函数族F\mathcal F常常是函数空间,而这个空间一般是向量空间或者线性空间,同时是无限维的。

逼近的形式:用来逼近 f(x)f(x)的函数,我们希望通过确定一些有限参数来确定这个逼近函数,那么所有这些参数对应的函数也是一个函数族,而且这个函数族是F\mathcal F 子集,我们记作 A\mathcal A ,即 A⊂F\mathcal A \subset \mathcal F 。这个函数族 A\mathcal A 也常常是线性空间,而且是有限维,其维数就是该逼近函数的参数个数。一言以蔽之:我们希望在 F\mathcal F中寻找到一些有限的特殊函数,它们的线性组合生成一个新的函数,这个函数用来逼近f(x)f(x) 。显然线性空间 A\mathcal A 和这些参数构成的向量组成的向量空间同构。

可以想象,这个逼近函数是从 F\mathcal F中找到一些简单函数组成的线性组合来逼近f(x)f(x),这些简单函数是已知的,使用参数将它们组合起来逼近复杂的函数,就灵活而且容易计算。为什么这样呢?因为线性组合就意味着只要通过调整参数就可以改变这个逼近函数,方便计算和控制,也方便计算机存储。这个技巧就是既可以利用复杂函数表达能力强的优点,又可以通过简单参数的调整来生成一个逼近函数。因为这一组函数有各种各样的特点,通过参数大小调节,发挥它们各自的长处,抑制各自的弱点,共同高效的表达一个函数。

范数:现在规定了函数族,也选用了一组函数来逼近函数 f(x)f(x),那么怎么确定对应的这组参数,进而获得逼近函数,使得满足逼近精度。也就是怎样给定一个误差标准,然后根据这个标准确定一组参数,进而计算出函数的线性组合,从而得到这个逼近函数。这就需要借助范数的概念,也就是寻找f∗(x)f^*(x) ,使得 ||f(x)−f∗(x)||||f(x)-f^*(x)||的值小于给定精度,当然我们如果能求得在A\mathcal A 中,使||f(x)−f∗(x)||||f(x)-f^*(x)||取最小值的 f∗(x)f^*(x) 最好了。

2. 从赋范线性空间角度看函数逼近问题

从上一节的函数逼近可以认识到,线性子空间A\mathcal A中选取一组函数,如果它们线性无关最好了,如果线性相关,会造成参数个数多于维数,多出参数又不能提高函数逼近效果,那就没意思了,因此一般选取最大线性无关组来作为逼近的基函数。而范数就选取几个常见的范数:

L∞\mathcal L_\infty 范数。名称有好几个:一致范数,极小极大范数,Chebyshv范数;

L2\mathcal L_2范数。最小二乘范数,欧几里德范数 (least - squares norm, Euclidean norm);

L1\mathcal L_1 范数。均值范数,曼哈顿范数 (mean norm, Manhattan norm);

Lp\mathcal L_p 范数。holder 范数,前面几个范数是 pp\infty , 2和1的特例。

Lω∞\mathcal L_{\omega\infty} 范数。加权 L∞\mathcal L_\infty 范数。

注意上面的范数定义既可以是积分也可以是点集的求和,比如

||f||p=[∫abω(x)|f(x)|pdx]1p||f||_p= \left[ \int_a^b \omega(x) |f(x)|^p dx \right ]^{\frac{1}{p}}||f||p=[∑i=1mω(xi)|f(xi)|pdx]1p||f||_p= \left[ \sum_{i=1}^m \omega(x_i) |f(x_i)|^p dx \right ]^{\frac{1}{p}}

从赋范线性空间的角度看,所谓函数逼近问题就是从给定函数线性空间中的一个函数 f(x)f(x) ,我们从线性子空间 A\mathcal A 中挑选一个函数 f∗(x)f^*(x) 逼近函数 f(x)f(x) ,衡量逼近效果同时也是选取逼近函数 f∗(x)f^*(x) 的依据就是范数 ||f(x)−f∗(x)||||f(x)-f^*(x)||的取值大小。

上面的分析意思就是:在给定不同的误差要求下,也就有了不同的逼近目标,那么不同的逼近目标也就可以得到不同的逼近类型。据此一般有三种类型:

(1) 可接受(良好)逼近:也就是给定 ϵ(≥0)\epsilon (\ge 0) ,如果逼近函数 f∗(x)f^*(x) 满足公式||f(x)−f∗(x)||≤ϵ||f(x)-f^*(x)|| \le \epsilon,此时我们说f∗(x)f^*(x)A\mathcal A 中的可接受逼近(或者良好逼近)。

(2) 最优逼近:如果 fB∗(x)f^*_B(x) 满足对于A\mathcal A中的任何其他逼近函数 f∗(x)f^*(x) ,都有下面公式成立:||f(x)−fB∗(x)||≤||f(x)−f∗(x)||||f(x)-f_B^*(x)|| \le ||f(x)-f^*(x)||,就称fB∗(x)f^*_B(x)A\mathcal A 中的最优逼近。

(3) 准最优逼近:如果A\mathcal A中的一个函数 fN∗(x)f_N^*(x) ,对于 0)">ρ(>0)\rho (>0) 和最优逼近fB∗(x)f^*_B(x),满足下面的公式||f(x)−fN∗(x)||≤(1+ρ)||f(x)−fB∗(x)||||f(x)-f_N^*(x)|| \le (1+\rho)||f(x)-f_B^*(x)||,就称fN∗(x)f_N^*(x)是准最优逼近。

(4) 相对可接受逼近:‖1−f∗(x)f(x)‖≤ϵ \Vert 1- \frac{f^*(x)}{f(x)} \Vert \le \epsilon ,这个条件就是相对误差小于给定值

显然,在同样的逼近误差精度要求下,选取不同的范数,则挑选的f∗(x)f^*(x) 也应不同,也就是选取的逼近函数也应该不同。

现在有一个好奇的问题,那就是给定线性子空间 A\mathcal A ,确定逼近范数,那么是否一定存在最优的逼近函数 fB∗(x)f_B^*(x) 呢?

这个问题如果将 A\mathcal A 仅仅限于多项式空间 PnP_n ,答案却是肯定的。因为有这个定理:对于给定一个数 p(1≤p≤∞)p (1 \le p \le \infty),确定Lp\mathcal L_p 范数,那么空间 Lp[a,b]\mathcal L_p[a,b] 中给定一个函数 f(x)f(x) ,一定可以在多项式空间PnP_n中找到唯一的最优多项式函数 pn(x)p_n(x) 逼近 f(x)f(x) 。显然这时的范数可以是 L1,L2,…,L∞ \mathcal L_1, \mathcal L_2, \dots, \mathcal L_\infty 。问题是如果 A\mathcal A 不是多项式空间,在不同的范数作为误差判断依据的情况下,是否还存在这种最优逼近函数呢?有没有通用的办法呢?下面讨论。

3. 从希尔伯特空间角度看

现在我们从希尔伯特空间看上面的函数逼近问题。如果 F\mathcal F 是希尔伯特空间, A\mathcal AF\mathcal F 的希尔伯特子空间,那么范数是从该希尔伯特空间的内积定义导出的范数。如果这样看问题的话,我们立刻就可以回答上面的问题,那就是 A\mathcal A 中必有唯一的函数 fB∗(x)f_B^*(x) 是在该范数定义下的 f(x)f(x) 的最优逼近。而且这个 fB∗(x)f_B^*(x) 很容易求出,就是 f(x)f(x)A\mathcal A上的投影。为什么有这个断言呢?因为这是由希尔伯特空间的投影定理决定的。

投影定理:设 MM 是内积空间 HH 的完备线性子空间,那么对任何 x∈Hx \in HxxMM 上的投影唯一地存在。也就是说存在 x0∈M,x1⊥Mx_0 \in M, x_1 \bot M 使得 x=x0+x1x=x_0+x_1 ,而且这种分解是唯一的,特别地,当 x∈Mx \in M 时, x0=xx_0=x 。(注意: HH是内积空间成立,当然是希尔伯特空间更成立了,MM 定义了内积,又是完备的,当然是希尔伯特空间了)。 x0x_0 就是 xxMM 上的投影,那么 x1x_1 是否是点 xx 到集合 MM 的距离呢?即是否有下式成立: ||x1||=||x−x0||=infy∈M|||x−y||||x_1||=||x-x_0||= \underset {y\in M} {inf} |||x-y|| .

投影的极值性质:上面的答案是肯定的,那就是:如果x0x_0xxMM 上的投影,那么 ||x−x0||||x-x_0|| 是点 xx 到集合 MM 的距离,也就是||x−x0||=infy∈M||x−y||||x-x_0||= \underset {y\in M} {inf} ||x-y||

投影定理以及投影的极值性质意味着:(1) 一个元素在希尔伯特空间必有投影;(2)这个投影是该元素在该希尔伯特空间的最优逼近(误差精度就是该空间定义的范数意义下)。如果换做函数希尔伯特空间的话,那就是一个给定函数在一个函数族构成的希尔伯特空间上的投影函数就是最优逼近函数。

我们从上面的分析中一下子就明白了一个问题:如果我们希望找到一个函数的最优逼近函数,则(1)确定一个希尔伯特空间,(2)计算该函数在该希尔伯特空间的投影。

了解了上面的最优逼近函数的确定方法以后,我们立刻发现,最优逼近函数的寻找关键是确定希尔伯特空间,而希尔伯特空间的确定关键是确定内积以及由内积导出的范数。现在我们看L1[a,b],L3[a,b],…,Lp[a,b]\mathcal L_1[a,b], \mathcal L_3[a,b], \dots, \mathcal L_p[a,b],这些空间定义的范数都不满足平行四边形公式,因此它们都不是希尔伯特空间,故任何一个函数在这些空间的投影不一定能找到最优逼近函数,例如L∞[0,π/2]\mathcal L_\infty [0,\pi/2],我们随便取两个函数y1=cosx,y2=sinxy_1=cosx, y_2=sinx ,我们根据平行四边形公式计算

||y1+y2||∞2+||y1−y2||∞2=(2)2+1=3||y_1+y_2||_\infty^2+||y_1-y_2||_\infty^2= (\sqrt{2})^2+1=3\\

2||y1||∞2+2||y2||∞2=2+2=42||y_1||_\infty^2+2||y_2||_\infty^2 =2 +2= 4 \\

可见L∞\mathcal L_\infty 范数不满足平行四边形公式,因此不可能由一个内积导出,这就表明L∞[a,b]\mathcal L_\infty [a,b]不可能是希尔伯特空间,因而对任何一个函数,在这个空间可能不存在最优逼近函数。这就明白了除了L2[a,b]\mathcal L_2[a,b] 外, pp 取其它值都不是希尔伯特空间。其实 y1=1,y2=xy_1=1,y_2=x 就可以验证。

(1) 下面补充一下怎么证明投影极值定理和投影定理。先证明极值定理:

因为 x0x_0xxMM 上的投影,因此 x0∈Mx_0 \in Mx−x0⊥Mx-x_0 \bot M,因此对于∀y∈M \forall y \in M ,由于 MM 是线性空间,必有 x0−y∈Mx_0-y \in M ,故而有 (x−x0)⊥(x0−y)(x-x_0) \bot (x_0-y) ,根据勾股定理,于是有||(x−x0)||2+||x0−y||2=||x−x0+x0−y||2=||x−y||2||(x-x_0)||^2 + ||x_0-y||^2 = ||x-x_0+x_0-y||^2=||x-y||^2,而 ||x0−y||2≥0||x_0-y||^2 \ge 0

立刻得出 ||(x−x0)||2≤||x−y||2||(x-x_0)||^2 \le ||x-y||^2 ,也就是||(x−x0)||≤||x−y||||(x-x_0)|| \le ||x-y||,这就表明||x−x0||=infy∈M||x−y||||x-x_0||= \underset {y\in M} {inf} ||x-y||。根据范数的性质,只有y=x0y=x_0 时候等号才成立,因此 x0x_0 是唯一的。

那么另外一个问题就是 x0x_0 作为 xx 的投影点是否也唯一呢?这个最简单的证明就是假如有两个投影点, x′x 也是投影点,那么必有 x−x0⊥M,x−x′⊥Mx-x_0 \bot M, x-x \bot M ,而 x0−x′∈Mx_0-x \in M ,于是立刻有 x0−x′⊥x−x0,x0−x′⊥x−x′x_0-x \bot x-x_0, x_0-x \bot x-x ,根据勾股定理,立刻有下面式子成立

||x0−x′||2+||x−x0||2=||x−x′||2,||x0−x′||2+||x−x′||2=||x−x0||2||x_0-x||^2 + ||x-x_0||^2=||x-x||^2, ||x_0-x||^2 + ||x-x||^2=||x-x_0||^2 ,将这两个式子左右相加,即有 2||x0−x′||2=02||x_0-x||^2=0 ,于是立刻有 x0=x′x_0=x 。我们看上面的证明都是利用投影的向量和 MM 中的向量的线性组合都和 x−x0x-x_0 垂直这么一个性质证明。如果将它们看成立体几何中的向量,立刻直观可以观察到。

(2) 现在看看投影定理怎么证明:

现在要证明存在 x0∈M,x1⊥Mx_0 \in M, x_1 \bot M 使得 x=x0+x1x=x_0+x_1 ,而且这种分解是唯一的,特别地,当 x∈Mx \in M时,x0=xx_0=x

首先要证明在 希尔伯特空间MM 中,存在唯一 x0x_0 使得 xxMM 的距离 dd||x−x0||||x-x_0|| 。(这就是极化定理)由点到 MM 距离的定义 d=ρ(x,M)=infy∈M||x−y||d=\rho(x,M) = \underset{y \in M}{inf}||x-y|| ,存在一个点列 {xn}\{x_n\} (xn∈M)(x_n \in M)limn→∞||xn−x||=d\lim_{n \rightarrow \infty} ||x_n-x||=d。我们现在构造两个元素 xm−xn2\frac{x_m-x_n}{2}xm+xn2−x\frac{x_m+x_n}{2}-x ,将这两个元素相加和相减,然后取范数则分别为 ||xm−x||||x_m-x||||xn−x||||x_n-x|| ,根据平行四边形公式则有:

2‖xm−xn2‖2=||xm−x||2+||xn−x||2−2‖xm+xn2−x‖2 \left \| \frac{x_m-x_n}{2} \right \| ^2=||x_m-x||^2+||x_n-x||^2 -2\left \| \frac{x_m+x_n}{2}-x \right \| \\

又由于 MM 是希尔伯特空间,因此 xm+xn2∈M\frac{x_m+x_n}{2} \in M ,从而有 ‖xm+xn2−x‖≥d\left \| \frac{x_m+x_n}{2}-x \right \| \ge d ,因此上式可以变为::

2‖xm−xn2‖2≤||xm−x||2+||xn−x||2−2d2 \left \| \frac{x_m-x_n}{2} \right \| ^2 \le||x_m-x||^2+||x_n-x||^2 -2d \\

而当 n,m→∞n ,m \rightarrow \infty时,上面不等式右边显然趋于0,因此不等式左边也趋于0,进而有{xn}\{x_n\} 是基本序列,又由于 MM 是希尔伯特空间,故必有 x0∈Mx_0 \in M ,使得 xn→x0x_n \rightarrow x_0 。这就表明存在 x0x_0 使得 xxMM 的距离 dd||x−x0||||x-x_0||。而 x0x_0 的唯一性也是显然的;

现在证明满足上面定理中的 x0x_0 存在,那么必有 x−x0⊥Mx-x_0 \bot M,这个证明也很有意思。我们先考虑要证明x−x0⊥Mx-x_0 \bot M,只要证明对于 ∀y∈M\forall y \in M ,都有(x−x0)⊥y(x-x_0) \bot y,我们已知条件就是 ||x−x0||=infy∈M||x−y||||x-x_0|| = \underset{y \in M}{inf}||x-y||,怎么用上这个条件呢?既然要证明垂直,我们首先想到是内积,既然取最小值,我们考虑可能要有导数之类的应用才好,因此要引入一个数值,而且yy 要和 x0x_0 联系起来,现在我们只考虑实数情况,那就是对于 λ\lambda ,那么 x0+λy∈Mx_0+\lambda y \in M ,也就意味着||x−x0||≤||x−x0−λy||||x-x_0|| \le ||x-x_0-\lambda y||,我们把它们两个取平分就可以转化为内积,进而有下式:

||x−x0||2≤||x−x0||2−2λ(x−x0,y)+λ2||y||2||x-x_0||^2 \le ||x-x_0||^2-2\lambda(x-x_0,y)+\lambda^2||y||^2 \\

显然上面不等式右边可以看作关于 λ\lambda的函数,存在极小值,而且这个极小值仍然大于不等式的左边||x−x0||2||x-x_0||^2 ,那就是

||x−x0||2≤||x−x0||2−2|(x−x0,y)|2||y||2+|(x−x0,y)|2||y||2||x-x_0||^2 \le ||x-x_0||^2-2\frac{|(x-x_0,y)|^2}{||y||^2}+\frac{|(x-x_0,y)|^2}{||y||^2} \\

||x−x0||2≤||x−x0||2−|(x−x0,y)|2||y||2||x-x_0||^2 \le ||x-x_0||^2-\frac{|(x-x_0,y)|^2}{||y||^2} ,得 (x−x0,y)=0(x-x_0,y)=0 ,即证。

综合上面两点就意味着,对于希尔伯特空间 MMHH 中的任何点 xx ,都有 MM 中的唯一点x0x_0 ,使得 x−x0x-x_0 垂直于 MM ,这正是 x0x_0xx的投影的定义,这就证明了投影定理。

我们看上面的投影极值定理,也就知道 x0x_0xx 的投影,那么 ||x−x0||||x-x_0|| 必是 xxMM 的距离。如果 MM 是希尔伯特空间,那么 xx 在这个空间必有投影。

(3) 最优逼近函数的计算

如果 MM 是一个函数族构成的希尔伯特空间,那么 HH 中任何函数必然在 MM 中总能找到最优逼近,当然了不同的MM可以找到不同的最优逼近函数,因此最优逼近函数都是针对一个具体的希尔伯特空间而言的。因为定义的内积不同,导致的希尔伯特空间不同,因此关键是内积的定义决定了最优函数的形式。

那么怎么计算这个最优函数呢?这个就是老生常谈的问题了,寻找 MM中一组标准正交基,然后计算待逼近函数在各个正交基上的投影,最后进行线性组合就可以获得最优逼近函数了。这主要因为如果要(x−x0)⊥M(x-x_0) \bot M ,必须确保 x−x0x-x_0 垂直 MM 中的每一个元素,而 MM中的元素有无数个,但是都可以用一组正交基线性表达出来,只要x−x0x-x_0 和每一个基元素正交,则必然和 MM 正交,要保证和每一个基元素正交,那么只要 x0x_0xx与每一个基元素投影的线性组合即可。

如果选取MM中的一组基不是正交基,而是一组最大线性无关组,这时候一样可以计算xxMM上的投影 x0x_0 ,而 x0x_0 写成这组线性无关组的线性组合时,需要计算对应的系数,而系数的计算则不是很方便了,需要求解线性方程组。假如 MMnn 维的, x1,x2,…,xnx_1,x_2,\dots,x_n 是线性无关的,那么投影元素可以写成 x0=a1x1+a2x2+⋯+anxnx_0=a_1x_1+a_2x_2+\dots+a_nx_n ,则有下式成立 (x−x0,xi)=0(i=1,2,…,n)(x-x_0,x_i) =0 (i=1,2,\dots,n) ,将内积展开成线性方程组,即可求出 aia_i

很显然,如果不是希尔伯特空间,那么是否存在最优逼近?如果最优逼近存在怎样计算,这样的问题需要具体问题具体分析了。

4. Chebyshev逼近(最佳一致逼近)

上面讨论的最佳逼近非常完美,只要是希尔伯特空间就可以寻找到最佳逼近函数,那么如果不是希尔伯特空间怎么办?怎样寻找最优逼近函数?不是希尔伯特空间的最大原因就是范数不满足平行四边形公式,例如Chebyshe范数就不满足,因此无法通过投影定理来寻找最优逼近。这个时候就要具体问题具体分析了,对于不同的范数,不同的空间是否存在最优逼近函数,这包括两个角度,第一个就是同一种范数定义,但是空间的元素不同;另外一种就是同一类元素组成的集合,但是定义的范数不同。就这两种类型的逼近问题,需要考虑的就是最优逼近函数的存在性和唯一性,如果存在且唯一,那么怎么计算呢?这就是一般函数逼近要解决的问题。

最常见的函数逼近问题就是在 nn次多项式空间,寻求一个连续函数在Chebyshev范数的定义下的最优逼近多项式函数问题。这个问题称为连续函数的最佳一致逼近多项式问题,或者是最佳多项式Chebyshev逼近问题。根据上面第2节的最优逼近的定义立刻就能得出最佳多项式Chebyshev逼近问题,就是寻找nn 个系数使得 nn次多项式函数和被逼近函数f(x)f(x)的Chebyshev范数最小,这是Weierstrass逼近定理研究的内容,具体计算最优逼近多项式的方法多种多样,其中Remes逐次逼近就是寻找这种最优逼近多项式函数的一种方法。这些方法繁琐麻烦,没有希尔伯特空间逼近函数那样求解方便了。

二、函数逼近和函数插值的比较

通过上面的函数逼近,我们很容易发现,函数逼近一定要有一个逼近误差,任何一个函数只要小于这个逼近误差,就可以认为他就是一个函数的逼近函数。逼近误差一般使用度量空间的距离来表示,而在赋范线性空间中又使用两个函数差的范数来表示。

在逼近误差下,有没有一个最优的逼近函数呢,如果有,怎样计算这个逼近函数呢?希尔伯特空间就将二维空间的点到直线的距离最短,三维空间中点到面的距离最短推广开来了,就是一个函数在一个空间中最优逼近函数是该函数在该空间的投影。于是到了希尔伯特空间就是一个函数在一个子空间的投影就是最优函数,计算该函数的方法就是该子空间就范直角系中各个元素的投影的线性组合。也就是最优逼近函数通常通过就范直角系来求得。

当然最优逼近函数不一定要求空间一定是希尔伯特空间,也不一定必须使用投影定理求得,但是这个方法最简单,如果是一般空间,要求的最优逼近函数可能是困难的,或者没有通用性。

函数插值就是给定一个插值节点组,只要求得一个函数通过这些节点就可以了。这和函数逼近有什么关系呢?如果这样看:对于一个函数 f(x)f(x) ,在定义域取一些值,比如 nn 个点 x1,x2,…,xnx_1,x_2,\dots,x_n ,于是对应的有 nn 个函数值: f(xi),i=1,2,…,nf(x_i),i=1,2,\dots,n。只要寻找一个函数g(x)g(x) 使得 g(xi)=f(xi)g(x_i)=f(x_i) 即可。我们很容易发现,在定义域中,除了这个 nn 个点,两个函数值相等,其它点不考虑。

从上面的插值思想可以看出,函数逼近是在给定一个误差下的两个函数近似,而函数插值要求在插值节点相等,其它点不考虑,这个就比较明显的看出差别出来。函数逼近有希尔伯特空间的投影定理作指导,很容易找出一个函数的逼近函数,也就是该函数在希尔伯特空间的投影即是最优逼近函数。那么插值函数怎样寻找呢?对于一元插值来说,太简单了,无论什么插值节点,都有现成的直接算法,比如Newton插值,Lagrange插值,Thiele型连分式插值。一定能计算出来插值函数,这得益于多项式或者有理函数有非常好的性质,比如无限光滑,nn次多项式函数的导数为0,因此常常用来作为插值函数。现在的问题是插值函数很容易找到,而且有无数个,那么有没有最优的插值函数,或者怎样评判一个插值函数的好坏呢?这涉及到插值的目的是什么?

其实很多情况下,函数插值也是一种函数逼近的形式。既然这样,为什么专门将函数插值提出来讲呢?这就是因为当不清楚被逼近函数的解析形式,但是知道它在一些点所取的函数值的时候,我们可以使用插值函数来逼近这个函数。既然是逼近,那么当然就希望不仅仅在插值节点相等,也希望整体和被插值函数近似。这就出现一个矛盾:不知道被插值函数是什么样子,我们如何知道一个插值函数和这个被插值函数是否近似呢?

上面这个问题只能通过一个假设实现,就是假设被插值函数曲线和插值节点连接的曲线大体保持一样的趋势,比如在两个相邻的插值节点之间插值函数曲线不能出现连续的振荡,因为我们不知道被插值函数是什么样子,仅仅知道一些节点以及节点处取的函数值,我们没有理由给出额外的信息,因此就有了插值的时候需要保形,也就是保持节点组连接的折线大体的趋势。或者说插值函数需要最优逼近节点组连接的折线函数。这样一来Newton插值,Lagrange插值等由于局部出现lagrange振荡,就不是好的插值函数,因此出现了样条插值,正交多项式插值等等。这些插值思想,我们就可以看作寻找通过节点组同时逼近节点组生成的折线函数的最优逼近函数。这样一来也有插值空间的概念,也有插值误差的概念等等。

现在还有一种可能就是知道被插值函数的解析形式或者知道这个函数的各阶导函数的最大值,但是这个函数解析形式太复杂了,因此只能选取一些插值节点,构造插值函数逼近这个函数,显然插值节点选的越多,节点间隔越小,插值函数越是逼近被插函数,但是也不能太多,否则计算量太大,也没必要,因此这种情况的插值问题,获得插值函数以后,往往还能估计插值误差,如果误差太大的话,可以加密插值节点,或者寻求新的插值函数。这类问题在微积分的数值求解的时候,应用的很普遍。

上面的说明可以看出,插值也是一种特殊的函数逼近,只不过这种逼近要求插值函数精确的通过插值节点组而已,而一般的函数逼近并不要求如此,只寻求给定逼近误差标准的最优逼近函数即可。

上面讨论的函数逼近和函数插值,在离散正交多项式作为逼近函数或者插值函数时获得了统一。也就是说给定一个函数,可以将其投影到离散正交多项式扩展形成的空间,进而获得该函数的最优逼近,而这种逼近恰恰又可以看作投影函数插值这些离散点。这的确是一个很特殊的问题。究其原因就是离散正交多项式空间的内积定义就是基于离散点的向量相乘,获得逼近函数经过这些离散点,因此就变成函数插值问题了。这个问题带来了一个有意思的事情就是函数插值居然也有了最优函数插值,这在一般函数插值问题中,很难有找一个插值函数,它是最优的。

三、Chebyshev有理逼近

我们看到上面讨论的最优逼近是相对的,是确定一个希尔伯特空间以后,从这个空间中确定出一个函数,在这个空间定义的范数意义下,最优的表达被逼近函数。现在问题是如果这个空间中所有的函数性质本身不好,即使是最优逼近函数,也不能真正有效率的逼近给定函数。其实逼近一个函数是否高效,这需要结合具体应用目的,比如有的要求逼近函数的参数尽可能少,有的要求逼近函数简单等等,如果对一个不连续函数,在多项式函数空间中使用多项式函数逼近,由于多项式函数是连续函数,用它来逼近不连续函数,显然效率就低。正因为如此才出现了有理逼近问题。Pade逼近是有理逼近的一种,下面给出定义。

f(x)f(x)为由下述形式幂级数所定义的函数:f(x)=∑j=0∞ajxjf(x) = \sum_{j=0}^\infty a_jx^j ,如果存在有理分式函数 PL(x)/QM(x)(PL(x)P_L(x)/Q_M(x) (P_L(x)QM(x)Q_M(x) 是互质的多项式) 满足:

(1)f(x)−PL(x)/QM(x)=O(xL+M+1),QM(0)=1f(x)-P_L(x)/Q_M(x) = O(x^{L+M+1}), \quad Q_M(0)=1 \tag{1}

则称 PL(x)/QM(x)P_L(x)/Q_M(x)f(x)f(x) 的Pade逼近,记为 [L/M]f(x)[L/M]_f(x) 也可简记为 [L/M]f[L/M]_f 等。

从上面的Pade逼近定义,可以看出来 f(x),P(x),Q(x)f(x),P(x),Q(x) 都是一般的关于 xix^i 序列的多项式函数,现在将 xix^i 换为 φi(x)\varphi_i(x),则上面定义就变成了下面的定义了:

f(x)=∑i=0∞ciφi(x)f(x) = \sum_{i=0}^\infty c_i\varphi_i(x) ,如果存在广义有理函数 rm,n(x)=Pm(x)/Qn(x)r_{m,n}(x)=P_m(x)/Q_n(x) ,其中 Pm(x)=∑i=0maiφi(x),Qn(x)=∑i=0nbiφi(x)P_m(x) = \sum_{i=0}^m a_i \varphi_i(x), \quad Q_n(x)=\sum_{i=0}^nb_i\varphi_i(x) ,使得下式成立

(2)Qn(x)f(x)−Pm(x)=O(φm+n+1(x))Q_n(x)f(x)-P_m(x) = O(\varphi_{m+n+1}(x)) \tag{2}

则称 rm,n(x)r_{m,n}(x)f(z)f(z) 的广义Pade逼近。而满足下面公式就称为非线性化的推广形式

(3)f(x)−Pm(x)/Qn(x)=O(φm+n+1(x))f(x)-P_m(x)/Q_n(x) = O(\varphi_{m+n+1}(x)) \tag{3}

当然 O(φm+n+1(x))O(\varphi_{m+n+1}(x)) 是形如 ∑i=m+n+1∞eiφi(x)\sum_{i=m+n+1}^\infty e_i \varphi_i(x) 的形式展开。

可以看的出来,选定一个 φi(x)\varphi_i(x) 序列,就能得到一个广义Pade逼近,因此经典Pade逼近可以得到很多形式,我们前面几章讨论了Chebyshev多项式,显然如果φi(x)\varphi_i(x)Ti(x)T_i(x)就可以得到一个广义Pade逼近形式,这个形式就称为Chebyshev-Pade逼近。定义如下:

[−1,1][-1,1] 上的连续函数 f(x)f(x) 可以展开成Chebyshev级数 f(x)=∑i=0∞ciTi(x)f(x)=\sum_{i=0}^\infty c_iT_i(x) ,其中 Ti(x)=cos(iarccosx)T_i(x) = cos(iarccosx) 。若广义有理函数

(4)rm,n(x)=Um(x)Vn(x)=∑i=0maiTi(x)∑i=0nbiTi(x)r_{m,n}(x) = \frac{U_m(x)}{V_n(x)}=\frac{\sum_{i=0}^m a_iT_i(x)}{\sum_{i=0}^n b_iT_i(x)} \tag{4}

满足方程

(5)f(x)−rm,n(x)=∑k=m+n+1∞ekTk(x)f(x) -r_{m,n}(x) = \sum_{k=m+n+1}^ \infty e_k T_k(x) \tag{5}

则称 rm,n(x)r_{m,n}(x)f(x)f(x) 的Chebyshev-Pade逼近,简记为 [m,n]cp[m,n]_{cp}

上面 cic_i是已知的,可以利用式(2)线性化的形式求解ai,bia_i,b_i 。具体可以利用Chebyshev的性质 Tj(x)Tk(x)=12(Tj+k(x)+Tj−k(x)),j;k=0,1,…T_j(x)T_k(x)= \frac{1}{2} (T_{j+k}(x)+T_{j-k}(x)), j;k=0,1,\dots 求解出,给出了一般的公式是

(6)12∑k=0nbk(ci+k+c|i−k|)=0,i=m+1,…,m+n,\frac{1}{2} \sum_{k=0}^n b_k(c_{i+k}+c_{|i-k|}) =0 , \quad i=m+1,\dots, m+n , \tag{6}

(7)ai=12∑k=0nbk(ci+k+c|i−k|),i=1,…,m.a0=12∑k=0nbkcka_i=\frac{1}{2} \sum_{k=0}^n b_k(c_{i+k}+c_{|i-k|}) , \quad i=1,\dots, m. \quad \quad a_0=\frac{1}{2} \sum_{k=0}^n b_kc_k \tag{7}

上面第一个公式可以求出 bib_i ,代入第二个就可以求出 aia_i ,进而求出Chebyshev-pade逼近。当然这种逼近效率比经典的Pade逼近就高得多。

我们看出这种逼近没有给出最优逼近的概念,只是希望如何将一个函数使用有理函数给近似表示出来,这个有理函数分子分母分别是n,mn,m 次多项式,那么到底分子分母选用几次也没有依据,同时被逼近函数一定要泰勒级数展开或者一般按照 φi(x)\varphi_i(x)展开,否则无法计算有理函数。这种有理函数逼近我们看公式(3)还是能看出端倪的,因为它至少用到了n+mn+mf(x)f(x) 的参数,其实可以大体估计有理逼近精度。我们看式(6)(7)似乎发现使用了 n+mn+mcic_i 参数,由计算除了 ai,bia_i,b_i ,也是一共n+mn+m 个 参数,而且表达的结果是一样的,也就是 f(x)f(x) 还是精确到展开式的第 n+mn+m 项。其实不然,因为计算的ai,bia_i,b_i很多为0,因此减少了参数个数,提高了逼近效率,另外式(1)表明逼近是O(xL+M+1)O(x^{L+M+1}) ,事实上生成的有理函数可能远远超过这个精度。

四、有理Chebyshev逼近

现在到了我们要讨论最优有理函数的逼近问题了,很遗憾的是有理函数{rpq}\{r_{pq}\}组成的集合在通常定义的加法和数乘意义下,是不能构成线性空间的,因为{rpq}\{r_{pq}\}集合中任意两个有理函数相加可能不再是这个集合的元素,因此不构成加法的封闭性,故不能转换为希尔伯特空间讨论,甚至连线性空间都不是,这就意味着,无论是L2\mathcal L_2 范数还是其它范数,即使满足平行四边形法则也没用,原因是有理函数集合{rpq}\{r_{pq}\} 不是线性空间,因此更不可能是希尔伯特空间了,在集合{rpq}\{r_{pq}\}中寻找最优逼近,甚至连范数的定义都不存在。当然所有的有理函数集合在一般的加法和数乘意义下是一个线性空间,自然就可以定义范数了。

第一节介绍的最优多项式Chebyshev逼近的计算都很困难,因此最优有理Chebyshev逼近函数一定更困难了。这个有理Chebyshev逼近的含义就是在Chebyshev范数的意义下寻找最佳有理函数,和Chebyshev有理逼近不是一个意思了。下面讨论一下

有理分式函数,我们就称为有理函数如下:

(8)R(α,x)=Pm(x)Qn(x)=Rm,n(x),Qn(x)≠0R(\alpha,x) = \frac{P_m(x)}{Q_n(x)}=R_{m,n}(x), Q_n(x) \ne 0 \tag{8}

其中 Pm(x)=∑i=0maixi,Qn(x)=∑i=0nbixi,x∈[0,1]P_m(x) = \sum_{i=0}^m a_ix^i, \quad Q_n(x) = \sum_{i=0}^n b_ix^i, \quad x\in [0,1],这两个多项式互质,这样的有理函数的集合记为R(m,n)R(m,n) 。现在假设

(9)W={(a0,…,am;b0,…,bn)|∑i=0nbi2=1}W=\{(a_0,\dots,a_m;b_0,\dots,b_n)| \sum_{i=0}^nb_i^2=1\} \tag{9}

f(x)f(x) 是有界闭区间 [0,1][0,1] 上的连续函数,定义有理函数 R(α,x)R(\alpha,x)f(x)f(x) 的偏差为

(10)Eα=maxx∈[0,1]|f(x)−R(α,x)|=||f(x)−R(α,x)||E_\alpha= \underset{x\in [0,1]}{max} |f(x)-R(\alpha,x)| = ||f(x)-R(\alpha,x)|| \tag{10}

Chebyshev有理逼近就是寻求 α0∈W\alpha^0 \in W 使得

(11)Eα0=||f(x)−R(α0,x)||=infα∈W||f(x)−R(α,x)||E_\alpha^0 = ||f(x)-R(\alpha^0,x)|| = \underset{\alpha \in W}{inf}||f(x)-R(\alpha,x)|| \tag{11}

那么 R(α0,x)R(\alpha^0,x) 称为 f(x)f(x) 的最佳Chebyshev逼近有理(分式)函数,简称最佳逼近有理(分式)函数。

上面需要说明的是在 R(m,n)R(m,n)集合中寻找最佳逼近函数,由于它不是线性空间,因此更不可能是希尔伯特空间,故不能使用投影定理;式(10)定义的范数是在整个有理函数空间中定义的,并不是在R(m,n)R(m,n)集合中定义的,显然整个有理函数空间是线性空间,因此范数定义是有意义的;WW 是参数集合,当然可以看作向量空间。

现在的问题是对于给定函数 f(x)∈C[0,1]f(x) \in C[0,1] ,如何在 R(m,n)R(m,n)集合中寻找Chebyshev范数意义下的最佳逼近函数Rm,n(x)R_{m,n}(x) ? 于是有下面的定理:

f(x)∈C[0,1]f(x) \in C[0,1] ,则 R(α0,x)R(\alpha^0,x)f(x)f(x)的最佳有理逼近函数的充分必要条件是R(α0,x)R(\alpha^0,x)有一个点数不少于 m+n+1m+n+1 的交错点组,即误差曲线 f(x)−R(α0,x)f(x)-R(\alpha^0,x)[0,1][0,1] 上至少交错m+n+1m+n+1次。

该定理给出了最佳逼近函数的确定,完全是一种带有技巧性的证明,至于其它 Lp\mathcal L_p意义下的最佳有理函数逼近,都要分别研究,没有类似希尔伯特空间那样优美的解决方案了。

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com

标签:
微信

三青

当你还撑不起你的梦想时,就要去奋斗。如果缘分安排我们相遇,请不要让她擦肩而过。我们一起奋斗!

微信
阿里云