反函数定理证明-反函数定理证法
4人看过
例如,在优化理论中,它支撑着拉格朗日乘数法的严格基础;在动力系统研究中,它关乎平衡点附近流形的结构。掌握反函数定理的证明,不仅是为了理解一个数学结论,更是为了获得一种将非线性问题局部线性化并加以解决的关键思维方式。对于备考各类涉及高等数学深度内容的职考考生来说呢,深入理解这一定理,无疑能强化其数学功底,提升解决复杂模型问题的能力,这正是易搜职考网致力于帮助考生构建的坚实理论体系的一部分。 反函数定理的详细阐述与证明 一、 定理的经典表述 设 ( mathbf{F}: U subset mathbb{R}^n to mathbb{R}^n ) 是一个定义在开集 ( U ) 上的 ( C^r ) 类函数(( r geq 1 )),其中某一点 ( mathbf{a} in U )。如果函数 ( mathbf{F} ) 在点 ( mathbf{a} ) 处的导数 ( Dmathbf{F}(mathbf{a}) )(即雅可比矩阵)是可逆的,那么存在点 ( mathbf{a} ) 的一个开邻域 ( V subset U ) 和点 ( mathbf{b} = mathbf{F}(mathbf{a}) ) 的一个开邻域 ( W ),使得:
- 限制映射 ( mathbf{F}: V to W ) 是一个双射(一一对应且满射)。
- 其逆映射 ( mathbf{G} = mathbf{F}^{-1}: W to V ) 也是 ( C^r ) 类的。
- 对于任意 ( mathbf{y} in W ),逆映射的导数满足公式:( Dmathbf{G}(mathbf{y}) = [Dmathbf{F}(mathbf{G}(mathbf{y}))]^{-1} )。特别地,有 ( Dmathbf{G}(mathbf{b}) = [Dmathbf{F}(mathbf{a})]^{-1} )。
- 化简问题:通过坐标平移和线性变换,将一般情况化为一个在原点处、且导数为单位矩阵的简化情形。这极大地简化了后续的估计。
- 构造辅助函数与方程:对于给定的值 ( mathbf{y} )(靠近 ( mathbf{b} )),寻找原像 ( mathbf{x} ) 的问题转化为求解一个关于 ( mathbf{x} ) 的方程。通过巧妙地构造一个辅助函数,使得该方程的解等价于该辅助函数的不动点。
- 应用压缩映射原理:证明在合适的闭球(完备度量空间)上,上述辅助函数是一个压缩映射,从而存在唯一的不动点。这就证明了局部双射的存在性。
- 证明逆映射的连续性:由压缩映射原理得到的解对参数 ( mathbf{y} ) 具有某种连续性,这为证明逆映射 ( mathbf{G} ) 的连续性奠定了基础。
- 证明逆映射的可微性:利用导数定义和已知的导数信息,直接验证 ( mathbf{G} ) 在点 ( mathbf{b} ) 处可微,且导数公式成立。然后通过连续性论证,推广到整个邻域 ( W )。
- 提升光滑性至 ( C^r ) 类:利用导数公式和数学归纳法,证明若 ( mathbf{F} ) 是 ( C^r ) 类的,则 ( mathbf{G} ) 也是 ( C^r ) 类的。
也是因为这些,不失一般性,我们假设以下证明条件:
- ( mathbf{F}(mathbf{0}) = mathbf{0} )。
- ( Dmathbf{F}(mathbf{0}) = I )(单位矩阵)。
也是因为这些,将方程改写为: [ mathbf{x} = mathbf{x} - (mathbf{F}(mathbf{x}) - mathbf{y}) = mathbf{x} + mathbf{y} - mathbf{F}(mathbf{x}) ] 定义辅助函数 ( Phi_{mathbf{y}}(mathbf{x}) = mathbf{x} + mathbf{y} - mathbf{F}(mathbf{x}) )。那么,求解 ( mathbf{F}(mathbf{x}) = mathbf{y} ) 等价于寻找 ( Phi_{mathbf{y}} ) 的不动点:( Phi_{mathbf{y}}(mathbf{x}) = mathbf{x} )。 步骤三:应用压缩映射原理 我们需要找到一个闭球 ( overline{B}(0, r) ),使得对于所有满足 ( |mathbf{y}| leq delta ) 的 ( mathbf{y} ),映射 ( Phi_{mathbf{y}} ) 是该闭球到自身的压缩映射。
由于 ( mathbf{F} ) 是 ( C^1 ) 类且 ( Dmathbf{F}(0) = I ),根据导数的连续性,对于任意给定的 ( epsilon > 0 )(例如取 ( epsilon = frac{1}{2} )),存在 ( r > 0 ),使得当 ( |mathbf{x}| leq r ) 时,有 ( | Dmathbf{F}(mathbf{x}) - I | leq epsilon )。这里矩阵范数取为对应的算子范数。
现在,考察 ( Phi_{mathbf{y}} ) 的导数:( DPhi_{mathbf{y}}(mathbf{x}) = I - Dmathbf{F}(mathbf{x}) )。
也是因为这些,在闭球 ( overline{B}(0, r) ) 上,有 ( | DPhi_{mathbf{y}}(mathbf{x}) | leq epsilon = frac{1}{2} )。
根据中值不等式(对于向量值函数),对于球内任意两点 ( mathbf{x}_1, mathbf{x}_2 ),有: [ |Phi_{mathbf{y}}(mathbf{x}_1) - Phi_{mathbf{y}}(mathbf{x}_2)| leq left( sup_{mathbf{z} in [mathbf{x}_1, mathbf{x}_2]} | DPhi_{mathbf{y}}(mathbf{z}) | right) |mathbf{x}_1 - mathbf{x}_2| leq frac{1}{2} |mathbf{x}_1 - mathbf{x}_2| ] 这说明 ( Phi_{mathbf{y}} ) 在 ( overline{B}(0, r) ) 上是一个压缩系数为 ( 1/2 ) 的压缩映射。
接下来证明 ( Phi_{mathbf{y}} ) 将球映射到自身。注意 ( Phi_{mathbf{y}}(0) = mathbf{y} )。对于任意 ( mathbf{x} in overline{B}(0, r) ): [ |Phi_{mathbf{y}}(mathbf{x})| leq |Phi_{mathbf{y}}(mathbf{x}) - Phi_{mathbf{y}}(0)| + |Phi_{mathbf{y}}(0)| leq frac{1}{2}|mathbf{x}| + |mathbf{y}| leq frac{1}{2}r + |mathbf{y}| ] 取 ( delta = frac{r}{2} ),则当 ( |mathbf{y}| leq delta ) 时,有 ( |Phi_{mathbf{y}}(mathbf{x})| leq r )。
也是因为这些,对于每个满足 ( |mathbf{y}| leq delta ) 的 ( mathbf{y} ),( Phi_{mathbf{y}} ) 是闭球 ( overline{B}(0, r) ) 到自身的压缩映射。
根据压缩映射原理,对于每个这样的 ( mathbf{y} ),存在唯一的 ( mathbf{x} in overline{B}(0, r) ),使得 ( Phi_{mathbf{y}}(mathbf{x}) = mathbf{x} ),即 ( mathbf{F}(mathbf{x}) = mathbf{y} )。记这个唯一的 ( mathbf{x} ) 为 ( mathbf{G}(mathbf{y}) )。这就定义了一个映射 ( mathbf{G}: overline{B}(0, delta) to overline{B}(0, r) ),并且满足 ( mathbf{F}(mathbf{G}(mathbf{y})) = mathbf{y} )。通过限制,我们可以得到从开集 ( W = B(0, delta) ) 到开集 ( V = mathbf{G}(W) subset B(0, r) ) 的双射(可以证明 ( V ) 是开集,且 ( mathbf{G} ) 是 ( mathbf{F} ) 的逆)。至此,我们证明了局部双射的存在性和唯一性。
步骤四:逆映射 ( mathbf{G} ) 的连续性 由压缩映射原理的证明可知,不动点 ( mathbf{G}(mathbf{y}) ) 可以通过迭代 ( mathbf{x}_{n+1} = Phi_{mathbf{y}}(mathbf{x}_n) ) 从任意起点(例如 ( 0 ))得到,且收敛速度由压缩系数控制。更直接地,我们可以估计 ( mathbf{G} ) 的 Lipschitz 连续性。设 ( mathbf{y}_1, mathbf{y}_2 in W ),记 ( mathbf{x}_1 = mathbf{G}(mathbf{y}_1), mathbf{x}_2 = mathbf{G}(mathbf{y}_2) )。则有: [ mathbf{x}_1 - mathbf{x}_2 = Phi_{mathbf{y}_1}(mathbf{x}_1) - Phi_{mathbf{y}_2}(mathbf{x}_2) = [mathbf{x}_1 + mathbf{y}_1 - mathbf{F}(mathbf{x}_1)] - [mathbf{x}_2 + mathbf{y}_2 - mathbf{F}(mathbf{x}_2)] ] 整理得: [ mathbf{F}(mathbf{x}_1) - mathbf{F}(mathbf{x}_2) = mathbf{y}_1 - mathbf{y}_2 + (mathbf{x}_1 - mathbf{x}_2) ] 或者 [ mathbf{x}_1 - mathbf{x}_2 = [mathbf{F}(mathbf{x}_1) - mathbf{F}(mathbf{x}_2)] - (mathbf{y}_1 - mathbf{y}_2) ] 利用 ( mathbf{F} ) 在球上的导数性质,有 ( mathbf{F}(mathbf{x}_1) - mathbf{F}(mathbf{x}_2) = Dmathbf{F}(mathbf{x}_2)(mathbf{x}_1 - mathbf{x}_2) + o(|mathbf{x}_1 - mathbf{x}_2|) )。更精确地,由 ( |Dmathbf{F}(mathbf{x}) - I| leq 1/2 ),可以推出: [ |mathbf{F}(mathbf{x}_1) - mathbf{F}(mathbf{x}_2) - (mathbf{x}_1 - mathbf{x}_2)| leq frac{1}{2} |mathbf{x}_1 - mathbf{x}_2| ] 代入上面的等式: [ |mathbf{x}_1 - mathbf{x}_2| leq |mathbf{F}(mathbf{x}_1) - mathbf{F}(mathbf{x}_2) - (mathbf{x}_1 - mathbf{x}_2)| + |mathbf{y}_1 - mathbf{y}_2| leq frac{1}{2}|mathbf{x}_1 - mathbf{x}_2| + |mathbf{y}_1 - mathbf{y}_2| ] 解得 ( |mathbf{x}_1 - mathbf{x}_2| leq 2 |mathbf{y}_1 - mathbf{y}_2| )。这表明 ( mathbf{G} ) 是 Lipschitz 连续的,从而连续。
步骤五:逆映射 ( mathbf{G} ) 的可微性 我们现在证明 ( mathbf{G} ) 在 ( mathbf{0} ) 处可微,且 ( Dmathbf{G}(0) = I )(因为 ( Dmathbf{F}(0)=I ),其逆也是 ( I ))。我们需要证明: [ lim_{mathbf{y} to mathbf{0}} frac{|mathbf{G}(mathbf{y}) - mathbf{G}(0) - I cdot mathbf{y}|}{|mathbf{y}|} = lim_{mathbf{y} to mathbf{0}} frac{|mathbf{G}(mathbf{y}) - mathbf{y}|}{|mathbf{y}|} = 0 ] 记 ( mathbf{x} = mathbf{G}(mathbf{y}) ),则 ( mathbf{F}(mathbf{x}) = mathbf{y} )。由 ( mathbf{F} ) 在 ( 0 ) 处的可微性: [ mathbf{y} = mathbf{F}(mathbf{x}) = mathbf{F}(0) + Dmathbf{F}(0)mathbf{x} + mathbf{R}(mathbf{x}) = mathbf{x} + mathbf{R}(mathbf{x}) ] 其中余项 ( mathbf{R}(mathbf{x}) ) 满足 ( lim_{mathbf{x} to 0} frac{|mathbf{R}(mathbf{x})|}{|mathbf{x}|} = 0 )。
也是因为这些,( mathbf{G}(mathbf{y}) - mathbf{y} = mathbf{x} - (mathbf{x} + mathbf{R}(mathbf{x})) = -mathbf{R}(mathbf{x}) )。所以: [ frac{|mathbf{G}(mathbf{y}) - mathbf{y}|}{|mathbf{y}|} = frac{|mathbf{R}(mathbf{x})|}{|mathbf{y}|} ] 由步骤四的连续性,当 ( mathbf{y} to 0 ) 时,( mathbf{x} = mathbf{G}(mathbf{y}) to 0 )。并且由 ( |mathbf{y}| = |mathbf{x} + mathbf{R}(mathbf{x})| geq |mathbf{x}| - |mathbf{R}(mathbf{x})| ),以及 ( frac{|mathbf{R}(mathbf{x})|}{|mathbf{x}|} to 0 ),可知对于充分小的 ( mathbf{x} ),有 ( |mathbf{y}| geq frac{1}{2} |mathbf{x}| )。于是: [ frac{|mathbf{R}(mathbf{x})|}{|mathbf{y}|} leq 2 frac{|mathbf{R}(mathbf{x})|}{|mathbf{x}|} to 0 quad (text{当 } mathbf{y} to 0 text{ 从而 } mathbf{x} to 0 text{ 时}) ] 这就证明了 ( mathbf{G} ) 在 ( 0 ) 处可微,且 ( Dmathbf{G}(0) = I )。
对于一般的点 ( mathbf{y}_0 in W ),记 ( mathbf{x}_0 = mathbf{G}(mathbf{y}_0) )。由 ( mathbf{F} ) 在 ( mathbf{x}_0 ) 处可微且 ( Dmathbf{F}(mathbf{x}_0) ) 可逆(因为 ( mathbf{x}_0 ) 靠近 ( 0 ),( Dmathbf{F}(mathbf{x}_0) ) 接近 ( I ),故可逆),我们可以对函数 ( tilde{mathbf{F}}(mathbf{x}) = mathbf{F}(mathbf{x} + mathbf{x}_0) - mathbf{y}_0 ) 在原点应用刚才的结论,从而得到 ( mathbf{G} ) 在 ( mathbf{y}_0 ) 处也可微,并且由链式法则,对 ( mathbf{F}(mathbf{G}(mathbf{y})) = mathbf{y} ) 两边求导,得: [ Dmathbf{F}(mathbf{G}(mathbf{y})) cdot Dmathbf{G}(mathbf{y}) = I ] 也是因为这些, [ Dmathbf{G}(mathbf{y}) = [Dmathbf{F}(mathbf{G}(mathbf{y}))]^{-1} ] 这个公式不仅给出了导数的计算方式,而且由于等式右边是 ( mathbf{G} ) (连续)和 ( Dmathbf{F} ) (连续)以及矩阵求逆运算(连续)的复合,它表明 ( Dmathbf{G} ) 是连续的。
也是因为这些,若 ( mathbf{F} ) 是 ( C^1 ) 类,则 ( mathbf{G} ) 也是 ( C^1 ) 类。
我们已经完成了 ( r=1 ) 的基础步骤。假设定理对 ( C^{r-1} ) 类函数成立(即若 ( mathbf{F} ) 是 ( C^{r-1} ) 的且导数可逆,则其局部逆也是 ( C^{r-1} ) 的)。现在设 ( mathbf{F} ) 是 ( C^r ) 类的。
由步骤五的结论,( mathbf{G} ) 是 ( C^1 ) 类的,并且其导数公式为 ( Dmathbf{G}(mathbf{y}) = [Dmathbf{F}(mathbf{G}(mathbf{y}))]^{-1} )。观察这个等式的右边:
- ( Dmathbf{F} ) 是 ( C^{r-1} ) 类的(因为 ( mathbf{F} ) 是 ( C^r ) 类)。
- ( mathbf{G} ) 根据归纳假设?这里需要小心。我们不能直接使用归纳假设,因为我们现在正在证明 ( C^r ) 的情况。更标准的方法是:我们已经知道 ( mathbf{G} ) 是 ( C^1 ) 的。那么等式右边是 ( C^1 ) 映射 ( mathbf{G} ) 与 ( C^{r-1} ) 映射 ( Dmathbf{F} ) 的复合,再经过矩阵求逆。矩阵求逆是解析运算,是无限次可微的。
也是因为这些,如果 ( mathbf{G} ) 是 ( C^k ) 的,且 ( Dmathbf{F} ) 是 ( C^{r-1} ) 的,那么右边作为复合映射是 ( C^{min(k, r-1)} ) 类的。这意味着 ( Dmathbf{G} ) 至少具有与 ( mathbf{G} ) 和 ( Dmathbf{F} ) 中光滑性较低者同样的光滑度。
一个清晰的论证是:由于 ( mathbf{F} ) 是 ( C^r ) 类,( Dmathbf{F} ) 是 ( C^{r-1} ) 类。我们已经证明了 ( mathbf{G} ) 是 ( C^1 ) 类。那么由导数公式,( Dmathbf{G} ) 是 ( mathbf{G} ) (( C^1 ))和 ( Dmathbf{F} ) (( C^{r-1} ))的复合的逆矩阵,因此 ( Dmathbf{G} ) 是 ( C^0 ) 类(连续),这我们已经知道。但为了得到更高阶的光滑性,我们可以对导数公式两边反复求导(在分布意义下或直接利用复合函数求导法则)。关键点在于,导数公式本身给出了 ( Dmathbf{G} ) 的一个表达式,这个表达式只涉及 ( mathbf{G} ) 本身和 ( mathbf{F} ) 的已知阶数的导数。通过数学归纳法:假设我们已经证明 ( mathbf{G} ) 是 ( C^k ) 类的,其中 ( 1 leq k < r )。那么,在导数公式中,右边是 ( C^{min(k, r-1)} ) 类的函数(因为 ( mathbf{G} ) 是 ( C^k ),( Dmathbf{F} ) 是 ( C^{r-1} ),复合后是 ( C^{min(k, r-1)} ),再求逆仍是该光滑类)。由于 ( k < r ),有 ( min(k, r-1) geq k )。实际上,如果 ( k leq r-1 ),那么右边是 ( C^k ) 类,这意味着 ( Dmathbf{G} ) 是 ( C^k ) 类,从而 ( mathbf{G} ) 是 ( C^{k+1} ) 类。我们可以从 ( k=1 ) 开始,逐次递增,直到 ( k = r-1 )。当 ( k = r-1 ) 时,右边是 ( C^{r-1} ) 类(因为 ( min(r-1, r-1) = r-1 )),所以 ( Dmathbf{G} ) 是 ( C^{r-1} ) 类,这意味着 ( mathbf{G} ) 是 ( C^r ) 类。这样就完成了归纳,证明了若 ( mathbf{F} in C^r ),则 ( mathbf{G} in C^r )。
四、 定理的几何意义与拓展 反函数定理的几何图像非常清晰:一个光滑映射在非临界点(即雅可比矩阵可逆的点)附近,其行为完全由它的线性化部分主导。它像一个局部微分同胚,将一个小开集光滑地、一对一地映射到另一个小开集,并且保持拓扑结构。这好比在地球表面的一个小区域(忽略曲率),我们可以用平面地图来精确表示,坐标之间存在着光滑可逆的变换关系。 该定理有若干重要的拓展和关联结果:- 隐函数定理:可以视为反函数定理的直接推论。它处理的是由方程 ( mathbf{F}(mathbf{x}, mathbf{y}) = mathbf{0} ) 所确定的隐函数 ( mathbf{y} = mathbf{f}(mathbf{x}) ) 的存在性与光滑性问题。证明的关键是将问题嵌入到一个更高维的空间中,构造一个辅助函数并应用反函数定理。
- 秩定理:这是反函数定理和隐函数定理的更一般形式,描述了在映射的常数秩点附近的局部标准形。当秩等于满秩时,即退化为反函数定理;当秩小于满秩但恒
113 人看过
32 人看过
31 人看过
30 人看过



