• 文件浏览器
  • 000 数学 (Mathematics)的知识框架 001 《逻辑与集合论:基础、理论与前沿》 002 《数论基础:原理与方法 (Foundations of Number Theory: Principles and Methods)》 003 《初等代数:系统精讲与深度应用 (Elementary Algebra: Systematic Elucidation and In-depth Applications)》 004 《线性代数:理论、方法与应用深度解析 (Linear Algebra: In-depth Analysis of Theory, Methods, and Applications)》 005 《抽象代数:全面解析与深度探索》 006 《数论:从基础到前沿的全面解析》 007 《代数几何:全面解析与前沿探索》 008 《欧几里得几何学:原理、证明与应用全面解析》 009 《非欧几何:从基础到前沿》 010 《微分几何:理论、方法与应用 (Differential Geometry: Theory, Methods, and Applications)》 011 《拓扑学:基础、理论与应用 (Topology: Foundations, Theory, and Applications)》 012 《分形几何:原理、分析与应用》 013 《数学分析:原理、方法与应用 (Mathematical Analysis: Principles, Methods, and Applications)》 014 《实分析之美:从基础到前沿 (The Beauty of Real Analysis: From Foundations to Frontiers)》 015 《复分析:理论、方法与应用 (Complex Analysis: Theory, Methods, and Applications)》 016 《现代泛函分析:理论、方法与应用》 017 《微分方程:理论、方法与应用 (Differential Equations: Theory, Methods, and Applications)》 018 《数值分析:原理、方法与实践 (Numerical Analysis: Principles, Methods, and Practice)》 019 《组合数学:原理、方法与应用 (Combinatorics: Principles, Methods, and Applications)》 020 《图论:系统性深度解析 (Graph Theory: A Systematic and In-depth Analysis)》 021 《计算机科学逻辑:原理、技术与应用》 022 《离散概率:原理、方法与应用 (Discrete Probability: Principles, Methods, and Applications)》 023 《概率论:全面深度解析 (Probability Theory: A Comprehensive and In-depth Analysis)》 024 《数理统计:原理、方法与应用 (Mathematical Statistics: Principles, Methods, and Applications)》 025 《随机过程:理论、方法与应用》 026 《数学物理方程:原理、方法与应用 (Mathematical Physics Equations: Principles, Methods, and Applications)》 027 《优化理论:全面与深度解析 (Optimization Theory: A Comprehensive and In-depth Analysis)》 028 《控制理论:原理、分析与设计 (Control Theory: Principles, Analysis, and Design)》 029 《运筹学:理论、方法与应用 (Operations Research: Theory, Methodology and Applications)》 030 《计算数学:原理、方法与应用 (Computational Mathematics: Principles, Methods, and Applications)》 031 《生物数学:理论、模型与应用 (Biomathematics: Theory, Models, and Applications)》 032 《金融数学:原理、模型与应用 (Financial Mathematics: Principles, Models, and Applications)》 033 《现代密码学原理与实践 (Modern Cryptography: Principles and Practice)》 034 《数学思想与方法全面深度解析》

    016 《现代泛函分析:理论、方法与应用》


    作者Lou Xiao, gemini创建时间2025-04-19 16:22:16更新时间2025-04-19 16:22:16

    🌟🌟🌟本文案由Gemini 2.0 Flash Thinking Experimental 01-21创作,用来辅助学习知识。🌟🌟🌟

    书籍大纲

    ▮▮▮▮ 1. chapter 1: 预备知识
    ▮▮▮▮▮▮▮ 1.1 线性代数基础回顾 (Linear Algebra Review)
    ▮▮▮▮▮▮▮ 1.2 拓扑学基础回顾 (Topology Review)
    ▮▮▮▮▮▮▮ 1.3 度量空间 (Metric Space)
    ▮▮▮▮ 2. chapter 2: 赋范线性空间与 Banach 空间 (Normed Linear Spaces and Banach Spaces)
    ▮▮▮▮▮▮▮ 2.1 线性空间 (Linear Space)
    ▮▮▮▮▮▮▮ 2.2 赋范线性空间 (Normed Linear Space)
    ▮▮▮▮▮▮▮ 2.3 Banach 空间 (Banach Space)
    ▮▮▮▮▮▮▮ 2.4 例子与应用 (Examples and Applications)
    ▮▮▮▮ 3. chapter 3: 内积空间与 Hilbert 空间 (Inner Product Spaces and Hilbert Spaces)
    ▮▮▮▮▮▮▮ 3.1 内积空间 (Inner Product Space)
    ▮▮▮▮▮▮▮ 3.2 Hilbert 空间 (Hilbert Space)
    ▮▮▮▮▮▮▮ 3.3 正交性与最佳逼近 (Orthogonality and Best Approximation)
    ▮▮▮▮▮▮▮ 3.4 Hilbert 空间的例子 (Examples of Hilbert Spaces)
    ▮▮▮▮ 4. chapter 4: 有界线性算子 (Bounded Linear Operators)
    ▮▮▮▮▮▮▮ 4.1 线性算子 (Linear Operator)
    ▮▮▮▮▮▮▮ 4.2 有界线性算子 (Bounded Linear Operator)
    ▮▮▮▮▮▮▮ 4.3 算子范数 (Operator Norm)
    ▮▮▮▮▮▮▮ 4.4 有界线性算子的空间 (Space of Bounded Linear Operators)
    ▮▮▮▮ 5. chapter 5: Hahn-Banach 定理及其应用 (Hahn-Banach Theorem and its Applications)
    ▮▮▮▮▮▮▮ 5.1 Hahn-Banach 延拓定理 (Hahn-Banach Extension Theorem)
    ▮▮▮▮▮▮▮ 5.2 Hahn-Banach 分离定理 (Hahn-Banach Separation Theorem)
    ▮▮▮▮▮▮▮ 5.3 Hahn-Banach 定理的应用 (Applications of Hahn-Banach Theorem)
    ▮▮▮▮ 6. chapter 6: 一致有界原理、开映射定理、闭图像定理 (Uniform Boundedness Principle, Open Mapping Theorem, Closed Graph Theorem)
    ▮▮▮▮▮▮▮ 6.1 一致有界原理 (Uniform Boundedness Principle)
    ▮▮▮▮▮▮▮ 6.2 开映射定理 (Open Mapping Theorem)
    ▮▮▮▮▮▮▮ 6.3 闭图像定理 (Closed Graph Theorem)
    ▮▮▮▮▮▮▮ 6.4 应用与推论 (Applications and Corollaries)
    ▮▮▮▮ 7. chapter 7: 对偶空间与共轭算子 (Dual Spaces and Adjoint Operators)
    ▮▮▮▮▮▮▮ 7.1 对偶空间 (Dual Space)
    ▮▮▮▮▮▮▮ 7.2 共轭算子 (Adjoint Operator)
    ▮▮▮▮▮▮▮ 7.3 自反空间 (Reflexive Space)
    ▮▮▮▮▮▮▮ 7.4 弱收敛与弱收敛 (Weak Convergence and Weak Convergence)
    ▮▮▮▮ 8. chapter 8: Banach 空间上的谱理论 (Spectral Theory on Banach Spaces)
    ▮▮▮▮▮▮▮ 8.1 谱集与预解集 (Spectrum and Resolvent Set)
    ▮▮▮▮▮▮▮ 8.2 谱半径公式 (Spectral Radius Formula)
    ▮▮▮▮▮▮▮ 8.3 Banach 代数初步 (Introduction to Banach Algebras)
    ▮▮▮▮ 9. chapter 9: Hilbert 空间上的谱理论 (Spectral Theory on Hilbert Spaces)
    ▮▮▮▮▮▮▮ 9.1 Hilbert 空间上的谱定理 (Spectral Theorem on Hilbert Spaces)
    ▮▮▮▮▮▮▮ 9.2 正常算子、自伴算子与酉算子 (Normal Operators, Self-Adjoint Operators and Unitary Operators)
    ▮▮▮▮▮▮▮ 9.3 谱分解 (Spectral Decomposition)
    ▮▮▮▮ 10. chapter 10: 紧算子理论 (Theory of Compact Operators)
    ▮▮▮▮▮▮▮ 10.1 紧算子的基本性质 (Basic Properties of Compact Operators)
    ▮▮▮▮▮▮▮ 10.2 紧算子的谱理论 (Spectral Theory of Compact Operators)
    ▮▮▮▮▮▮▮ 10.3 Fredholm 算子简介 (Introduction to Fredholm Operators)
    ▮▮▮▮ 11. chapter 11: 无界线性算子初步 (Introduction to Unbounded Linear Operators)
    ▮▮▮▮▮▮▮ 11.1 无界算子的定义与例子 (Definition and Examples of Unbounded Operators)
    ▮▮▮▮▮▮▮ 11.2 稠定算子与伴随算子 (Densely Defined Operators and Adjoint Operators)
    ▮▮▮▮▮▮▮ 11.3 对称算子与自伴算子 (Symmetric Operators and Self-Adjoint Operators)
    ▮▮▮▮ 12. chapter 12: 泛函分析的应用 (Applications of Functional Analysis)
    ▮▮▮▮▮▮▮ 12.1 Sobolev 空间简介 (Introduction to Sobolev Spaces)
    ▮▮▮▮▮▮▮ 12.2 椭圆型偏微分方程的变分方法 (Variational Methods for Elliptic PDEs)
    ▮▮▮▮▮▮▮ 12.3 泛函分析在量子力学中的应用 (Applications in Quantum Mechanics)
    ▮▮▮▮▮▮▮ 附录 A:集合论基础 (Basic Set Theory)
    ▮▮▮▮▮▮▮ 附录 B:度量空间中的基本定理 (Basic Theorems in Metric Spaces)


    1. chapter 1: 预备知识

    1.1 线性代数基础回顾 (Linear Algebra Review)

    线性代数 (Linear Algebra) 是泛函分析 (Functional Analysis) 的基石。本节旨在回顾一些核心的线性代数概念,这些概念对于理解和掌握泛函分析至关重要。我们假设读者已经具备一定的线性代数基础,因此本节将重点提炼和总结关键知识点,并为后续章节的学习做好铺垫。

    1.1.1 向量空间 (Vector Space)

    向量空间 (Vector Space),也称为线性空间 (Linear Space),是线性代数研究的核心对象。它是一个集合,在这个集合上定义了向量加法和标量乘法两种运算,并且这两种运算满足一定的公理。

    定义 1.1.1 (向量空间)
    设 \(V\) 是一个非空集合,\( \mathbb{K} \) 是一个数域 (通常为实数域 \( \mathbb{R} \) 或复数域 \( \mathbb{C} \))。如果在 \(V\) 上定义了加法运算 \(+\) 和标量乘法运算 \( \cdot \),满足以下公理,则称 \(V\) 为数域 \( \mathbb{K} \) 上的向量空间。对于任意 \( \mathbf{u}, \mathbf{v}, \mathbf{w} \in V \) 和 \( a, b \in \mathbb{K} \):

    ① 加法交换律 (Commutativity of Addition):\( \mathbf{u} + \mathbf{v} = \mathbf{v} + \mathbf{u} \)
    ② 加法结合律 (Associativity of Addition):\( (\mathbf{u} + \mathbf{v}) + \mathbf{w} = \mathbf{u} + (\mathbf{v} + \mathbf{w}) \)
    ③ 零向量 (Zero Vector):存在零向量 \( \mathbf{0} \in V \),使得对于任意 \( \mathbf{u} \in V \),有 \( \mathbf{u} + \mathbf{0} = \mathbf{u} \)
    ④ 负向量 (Negative Vector):对于任意 \( \mathbf{u} \in V \),存在 \( -\mathbf{u} \in V \),使得 \( \mathbf{u} + (-\mathbf{u}) = \mathbf{0} \)
    ⑤ 标量乘法结合律 (Associativity of Scalar Multiplication):\( a(b\mathbf{u}) = (ab)\mathbf{u} \)
    ⑥ 标量乘法分配律 (Distributivity of Scalar Multiplication over Vector Addition):\( a(\mathbf{u} + \mathbf{v}) = a\mathbf{u} + a\mathbf{v} \)
    ⑦ 标量乘法分配律 (Distributivity of Scalar Multiplication over Scalar Addition):\( (a + b)\mathbf{u} = a\mathbf{u} + b\mathbf{u} \)
    ⑧ 单位元 (Identity Element of Scalar Multiplication):\( 1\mathbf{u} = \mathbf{u} \),其中 \( 1 \) 是数域 \( \mathbb{K} \) 的乘法单位元。

    常见的向量空间例子包括:
    ① \( \mathbb{R}^n \) 或 \( \mathbb{C}^n \):\(n\) 维实向量空间和复向量空间。
    ② \( P[x] \):所有实系数多项式的集合。
    ③ \( C[a, b] \):在闭区间 \( [a, b] \) 上连续的实值函数全体。

    1.1.2 线性子空间 (Linear Subspace)

    线性子空间 (Linear Subspace) 是向量空间的一个重要组成部分,它本身也是一个向量空间。

    定义 1.1.2 (线性子空间)
    设 \(V\) 是数域 \( \mathbb{K} \) 上的向量空间,\(W\) 是 \(V\) 的非空子集。如果 \(W\) 关于 \(V\) 的加法和标量乘法运算封闭,即满足:
    ① 对于任意 \( \mathbf{u}, \mathbf{v} \in W \),有 \( \mathbf{u} + \mathbf{v} \in W \) (加法封闭性)。
    ② 对于任意 \( \mathbf{u} \in W \) 和 \( a \in \mathbb{K} \),有 \( a\mathbf{u} \in W \) (标量乘法封闭性)。
    则称 \(W\) 是 \(V\) 的线性子空间。

    判断一个子集是否为线性子空间,只需验证上述两条封闭性即可。例如,在 \( \mathbb{R}^2 \) 中,过原点的直线是 \( \mathbb{R}^2 \) 的线性子空间,而不过原点的直线则不是。

    1.1.3 线性无关与基 (Linear Independence and Basis)

    线性无关 (Linear Independence) 和基 (Basis) 是描述向量空间结构的关键概念。

    定义 1.1.3 (线性无关)
    设 \(S = \{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\}\) 是向量空间 \(V\) 中的一组向量。如果对于任意标量 \(c_1, c_2, \ldots, c_n \in \mathbb{K}\),方程
    \[ c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \cdots + c_n\mathbf{v}_n = \mathbf{0} \]
    只有零解 \(c_1 = c_2 = \cdots = c_n = 0\),则称向量组 \(S\) 是线性无关的 (linearly independent)。否则,称向量组 \(S\) 是线性相关的 (linearly dependent)。

    定义 1.1.4 (基)
    设 \(V\) 是向量空间。向量组 \( \mathcal{B} = \{\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n\} \subseteq V \) 称为 \(V\) 的一组基 (basis),如果 \( \mathcal{B} \) 满足:
    ① \( \mathcal{B} \) 是线性无关的。
    ② \( \mathcal{B} \) 可以生成 \(V\),即 \( \text{span}(\mathcal{B}) = V \)。换句话说,对于任意 \( \mathbf{v} \in V \),都存在标量 \(c_1, c_2, \ldots, c_n \in \mathbb{K}\),使得 \( \mathbf{v} = c_1\mathbf{e}_1 + c_2\mathbf{e}_2 + \cdots + c_n\mathbf{e}_n \)。

    如果一个向量空间存在有限基,则称其为有限维向量空间 (finite-dimensional vector space),否则称为无限维向量空间 (infinite-dimensional vector space)。基所包含的向量个数称为向量空间的维数 (dimension)。例如,\( \mathbb{R}^n \) 的标准基是 \( \{\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n\} \),其中 \( \mathbf{e}_i \) 是第 \(i\) 个分量为 1,其余分量为 0 的向量,\( \mathbb{R}^n \) 的维数是 \(n\)。

    1.1.4 线性变换 (Linear Transformation)

    线性变换 (Linear Transformation) 是向量空间之间的保持线性结构的映射。

    定义 1.1.5 (线性变换)
    设 \(V\) 和 \(W\) 是数域 \( \mathbb{K} \) 上的向量空间。映射 \(T: V \to W\) 称为线性变换,如果对于任意 \( \mathbf{u}, \mathbf{v} \in V \) 和 \( a \in \mathbb{K} \),满足:
    ① \( T(\mathbf{u} + \mathbf{v}) = T(\mathbf{u}) + T(\mathbf{v}) \) (可加性)。
    ② \( T(a\mathbf{u}) = aT(\mathbf{u}) \) (齐次性)。

    线性变换保持向量空间的线性运算,是研究向量空间结构的重要工具。

    1.1.5 矩阵表示 (Matrix Representation)

    对于有限维向量空间之间的线性变换,我们可以用矩阵 (Matrix) 来表示。

    设 \(V\) 和 \(W\) 是有限维向量空间,分别具有基 \( \mathcal{B}_V = \{\mathbf{v}_1, \ldots, \mathbf{v}_n\} \) 和 \( \mathcal{B}_W = \{\mathbf{w}_1, \ldots, \mathbf{w}_m\} \)。对于线性变换 \(T: V \to W\),\(T(\mathbf{v}_j)\) 可以表示为 \( \mathcal{B}_W \) 的线性组合:
    \[ T(\mathbf{v}_j) = \sum_{i=1}^{m} a_{ij} \mathbf{w}_i, \quad j = 1, 2, \ldots, n \]
    系数 \( (a_{ij})_{m \times n} \) 构成的矩阵 \( A = [a_{ij}] \) 称为线性变换 \(T\) 在基 \( \mathcal{B}_V \) 和 \( \mathcal{B}_W \) 下的表示矩阵。

    1.1.6 特征值与特征向量 (Eigenvalues and Eigenvectors)

    特征值 (Eigenvalues) 和特征向量 (Eigenvectors) 是线性变换的重要特征,它们在很多数学和物理问题中都有重要应用。

    定义 1.1.6 (特征值与特征向量)
    设 \(T: V \to V\) 是向量空间 \(V\) 上的线性变换。如果存在非零向量 \( \mathbf{v} \in V \) 和标量 \( \lambda \in \mathbb{K} \),使得
    \[ T(\mathbf{v}) = \lambda \mathbf{v} \]
    则称 \( \lambda \) 是 \(T\) 的一个特征值,\( \mathbf{v} \) 是对应于特征值 \( \lambda \) 的特征向量。

    对于有限维向量空间上的线性变换,特征值可以通过求解特征方程 \( \det(A - \lambda I) = 0 \) 得到,其中 \(A\) 是线性变换的表示矩阵,\(I\) 是单位矩阵。

    总结

    本节回顾了向量空间、线性子空间、线性无关与基、线性变换、矩阵表示、特征值与特征向量等线性代数的基本概念。这些概念是学习泛函分析的必要准备。在后续章节中,我们将看到这些线性代数概念在更抽象和更广阔的框架下的推广和应用。


    1.2 拓扑学基础回顾 (Topology Review)

    拓扑学 (Topology) 为泛函分析提供了研究“连续性”、“邻近性”和“极限”等概念的抽象框架。本节回顾一些基本的拓扑学概念,为后续在更一般的空间中讨论这些概念奠定基础。

    1.2.1 集合与映射 (Sets and Mappings)

    集合 (Set) 是数学的基本语言。我们首先回顾一些基本的集合概念和运算。

    集合的基本概念:集合、元素、子集、空集 \( \emptyset \)、全集、集合的相等。
    集合的运算:并集 \( \cup \)、交集 \( \cap \)、差集 \( \setminus \)、补集 \( ^c \)、笛卡尔积 \( \times \)。
    映射 (Mapping/Function):定义域、值域、像、原像、单射、满射、双射、复合映射、逆映射。

    1.2.2 拓扑空间 (Topological Space)

    拓扑空间 (Topological Space) 是定义拓扑结构的基本框架。拓扑结构通过指定哪些子集是“开集”来抽象地定义“邻近”和“连续”的概念。

    定义 1.2.1 (拓扑空间)
    设 \(X\) 是一个集合,\( \mathcal{T} \) 是 \(X\) 的子集族。如果 \( \mathcal{T} \) 满足以下条件:
    ① 空集 \( \emptyset \) 和全集 \( X \) 属于 \( \mathcal{T} \),即 \( \emptyset \in \mathcal{T}, X \in \mathcal{T} \)。
    ② \( \mathcal{T} \) 中任意多个集合的并集仍在 \( \mathcal{T} \) 中,即若 \( \{U_\alpha\}_{\alpha \in A} \subseteq \mathcal{T} \),则 \( \bigcup_{\alpha \in A} U_\alpha \in \mathcal{T} \)。
    ③ \( \mathcal{T} \) 中有限个集合的交集仍在 \( \mathcal{T} \) 中,即若 \( U_1, U_2, \ldots, U_n \in \mathcal{T} \),则 \( \bigcap_{i=1}^{n} U_i \in \mathcal{T} \)。
    则称 \( \mathcal{T} \) 为 \(X\) 上的一个拓扑 (topology),称 \( (X, \mathcal{T}) \) 为拓扑空间。\( \mathcal{T} \) 中的集合称为开集 (open set)。

    例子 1.2.1 (拓扑空间的例子)
    实数集上的标准拓扑:实数集 \( \mathbb{R} \) 上的标准拓扑 \( \mathcal{T}_s \) 由所有开区间 \( (a, b) \) 的并集构成。
    离散拓扑:设 \(X\) 是任意集合,\( \mathcal{T}_d = \mathcal{P}(X) \) ( \(X\) 的幂集,即所有子集的集合)。\( \mathcal{T}_d \) 是 \(X\) 上的一个拓扑,称为离散拓扑 (discrete topology)。在离散拓扑中,\(X\) 的任何子集都是开集。
    平凡拓扑 (或称不可分拓扑):设 \(X\) 是任意集合,\( \mathcal{T}_i = \{\emptyset, X\} \)。\( \mathcal{T}_i \) 是 \(X\) 上的一个拓扑,称为平凡拓扑 (indiscrete topology)。在平凡拓扑中,只有空集和全集是开集。

    1.2.3 闭集、邻域、内部、闭包、边界 (Closed Sets, Neighborhoods, Interior, Closure, Boundary)

    基于开集的概念,我们可以定义闭集 (closed set)、邻域 (neighborhood)、内部 (interior)、闭包 (closure) 和边界 (boundary) 等重要拓扑概念。

    闭集:在拓扑空间 \( (X, \mathcal{T}) \) 中,如果集合 \(C \subseteq X\) 的补集 \( X \setminus C \) 是开集,则称 \(C\) 为闭集。
    邻域:设 \( (X, \mathcal{T}) \) 是拓扑空间,\( x \in X \)。\(x\) 的邻域是指包含 \(x\) 的一个开集 \(U \in \mathcal{T}\)。更广义的邻域可以是不一定是开集的集合 \(V\),只要存在开集 \(U \subseteq V\) 且 \(x \in U\)。
    内部:设 \(A \subseteq X\)。\(A\) 的内部 \( \text{int}(A) \) 定义为 \(A\) 的所有开子集的并集。\( \text{int}(A) \) 是包含在 \(A\) 内的最大开集。
    闭包:设 \(A \subseteq X\)。\(A\) 的闭包 \( \overline{A} \) 定义为包含 \(A\) 的所有闭集的交集。\( \overline{A} \) 是包含 \(A\) 的最小闭集。
    边界:设 \(A \subseteq X\)。\(A\) 的边界 \( \partial A \) 定义为 \( \partial A = \overline{A} \setminus \text{int}(A) = \overline{A} \cap \overline{(X \setminus A)} \)。

    1.2.4 收敛与连续 (Convergence and Continuity)

    拓扑空间中的收敛 (convergence) 和连续 (continuity) 概念是基于开集和邻域定义的。

    收敛:设 \( (X, \mathcal{T}) \) 是拓扑空间,\( \{x_n\}_{n=1}^\infty \) 是 \(X\) 中的序列,\( x \in X \)。如果对于 \(x\) 的任意邻域 \(U\),都存在正整数 \(N\),使得当 \(n > N\) 时,\(x_n \in U\),则称序列 \( \{x_n\} \) 收敛于 \(x\),记作 \( \lim_{n \to \infty} x_n = x \) 或 \( x_n \to x \)。
    连续映射:设 \( (X, \mathcal{T}_X) \) 和 \( (Y, \mathcal{T}_Y) \) 是拓扑空间,\( f: X \to Y \) 是映射。\(f\) 在点 \(x \in X\) 处连续,是指对于 \(f(x)\) 的任意邻域 \(V \subseteq Y\),都存在 \(x\) 的邻域 \(U \subseteq X\),使得 \( f(U) \subseteq V \)。映射 \(f: X \to Y\) 是连续的,是指 \(f\) 在 \(X\) 上每一点都连续。等价地,\(f: X \to Y\) 连续当且仅当对于 \(Y\) 中的任意开集 \(V \in \mathcal{T}_Y\),其原像 \( f^{-1}(V) \) 是 \(X\) 中的开集,即 \( f^{-1}(V) \in \mathcal{T}_X \)。

    1.2.5 紧致性与连通性 (Compactness and Connectedness)

    紧致性 (Compactness) 和连通性 (Connectedness) 是拓扑空间中重要的全局性质。

    紧致性:拓扑空间 \( (X, \mathcal{T}) \) 是紧致的 (compact),如果 \(X\) 的每一个开覆盖都存在有限子覆盖。即,若 \( X \subseteq \bigcup_{\alpha \in A} U_\alpha \),其中 \( U_\alpha \in \mathcal{T} \),则存在有限子集 \( A_0 \subseteq A \),使得 \( X \subseteq \bigcup_{\alpha \in A_0} U_\alpha \)。在度量空间中,紧致性等价于序列紧致性 (每个序列都有收敛子序列) 和完备有界性 (完备且全有界)。
    连通性:拓扑空间 \( (X, \mathcal{T}) \) 是连通的 (connected),如果 \(X\) 不能表示为两个非空开集的不交并。即,如果 \( X = U \cup V \),其中 \( U, V \in \mathcal{T} \),\( U \cap V = \emptyset \),则 \(U = \emptyset\) 或 \(V = \emptyset\)。

    总结

    本节回顾了拓扑空间的基本概念,包括拓扑、开集、闭集、邻域、收敛、连续、紧致性和连通性。这些概念为在更抽象的框架下研究分析问题提供了必要的工具。在泛函分析中,我们经常在赋范线性空间和更一般的线性空间上引入拓扑结构,并利用拓扑学的理论来研究线性算子的性质。


    1.3 度量空间 (Metric Space)

    度量空间 (Metric Space) 是一种特殊的拓扑空间,它通过度量 (metric) 来定义点与点之间的距离,从而可以更具体地讨论收敛、连续等概念。度量空间是连接拓扑学和泛函分析的重要桥梁。

    1.3.1 度量的定义与例子 (Definition and Examples of Metric)

    定义 1.3.1 (度量)
    设 \(X\) 是一个非空集合。度量 (metric) 是指一个函数 \(d: X \times X \to \mathbb{R}\),满足以下条件:
    ① 非负性 (Non-negativity):对于任意 \( x, y \in X \),\( d(x, y) \ge 0 \)。
    ② 同一性 (Identity of indiscernibles):对于任意 \( x, y \in X \),\( d(x, y) = 0 \) 当且仅当 \( x = y \)。
    ③ 对称性 (Symmetry):对于任意 \( x, y \in X \),\( d(x, y) = d(y, x) \)。
    ④ 三角不等式 (Triangle inequality):对于任意 \( x, y, z \in X \),\( d(x, z) \le d(x, y) + d(y, z) \)。
    称 \( (X, d) \) 为度量空间。

    例子 1.3.1 (度量空间的例子)
    实数集 \( \mathbb{R} \) 上的标准度量:\( d(x, y) = |x - y| \)。
    \(n\) 维欧几里得空间 \( \mathbb{R}^n \) 上的欧几里得度量:对于 \( \mathbf{x} = (x_1, \ldots, x_n), \mathbf{y} = (y_1, \ldots, y_n) \in \mathbb{R}^n \),\( d(\mathbf{x}, \mathbf{y}) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} \) (欧几里得范数导出的度量)。
    \( \mathbb{R}^n \) 上的 \(p\)-度量 ( \(1 \le p < \infty\)):\( d_p(\mathbf{x}, \mathbf{y}) = \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{1/p} \) ( \(l^p\) 范数导出的度量)。
    \( \mathbb{R}^n \) 上的 \( \infty \)-度量 (或一致度量):\( d_\infty(\mathbf{x}, \mathbf{y}) = \max_{1 \le i \le n} |x_i - y_i| \) ( \(l^\infty\) 范数导出的度量)。
    离散度量:设 \(X\) 是任意非空集合,定义 \( d(x, y) = \begin{cases} 0, & \text{if } x = y \\ 1, & \text{if } x \ne y \end{cases} \)。\( (X, d) \) 是度量空间,称为离散度量空间。

    1.3.2 度量空间中的拓扑 (Topology in Metric Space)

    度量空间自然地诱导一个拓扑结构。对于度量空间 \( (X, d) \),我们可以定义开集、闭集、收敛等拓扑概念。

    开球 (Open Ball):对于 \( x \in X \) 和 \( r > 0 \),以 \(x\) 为中心,\(r\) 为半径的开球定义为 \( B(x, r) = \{y \in X \mid d(x, y) < r\} \)。
    开集:集合 \(U \subseteq X\) 是开集,如果对于任意 \( x \in U \),都存在 \( r > 0 \),使得开球 \( B(x, r) \subseteq U \)。由度量空间 \( (X, d) \) 中所有开集构成的族 \( \mathcal{T}_d \) 构成 \(X\) 上的一个拓扑,称为由度量 \(d\) 诱导的拓扑。
    闭集:集合 \(C \subseteq X\) 是闭集,如果其补集 \( X \setminus C \) 是开集。
    收敛:序列 \( \{x_n\}_{n=1}^\infty \) 在度量空间 \( (X, d) \) 中收敛于 \( x \in X \),如果 \( \lim_{n \to \infty} d(x_n, x) = 0 \)。这与拓扑空间中邻域的定义是等价的。
    连续映射:设 \( (X, d_X) \) 和 \( (Y, d_Y) \) 是度量空间,\( f: X \to Y \) 是映射。\(f\) 在点 \(x \in X\) 处连续,是指对于任意 \( \epsilon > 0 \),存在 \( \delta > 0 \),使得当 \( d_X(x', x) < \delta \) 时,有 \( d_Y(f(x'), f(x)) < \epsilon \)。映射 \(f: X \to Y\) 是连续的,当且仅当对于 \(Y\) 中的任意开集 \(V\),其原像 \( f^{-1}(V) \) 是 \(X\) 中的开集。

    1.3.3 完备性 (Completeness)

    完备性 (Completeness) 是度量空间的一个重要性质,它保证了 Cauchy 序列的收敛性。

    定义 1.3.2 (Cauchy 序列)
    序列 \( \{x_n\}_{n=1}^\infty \) 在度量空间 \( (X, d) \) 中称为 Cauchy 序列,如果对于任意 \( \epsilon > 0 \),存在正整数 \(N\),使得当 \( m, n > N \) 时,有 \( d(x_m, x_n) < \epsilon \)。

    定义 1.3.3 (完备度量空间)
    度量空间 \( (X, d) \) 称为完备的 (complete),如果 \(X\) 中的每个 Cauchy 序列都收敛到 \(X\) 中的点。

    例子 1.3.2 (完备度量空间的例子)
    ① 实数集 \( \mathbb{R} \) 关于标准度量是完备的 (实数完备性公理)。
    ② \(n\) 维欧几里得空间 \( \mathbb{R}^n \) 关于欧几里得度量是完备的。
    ③ 闭区间 \( [a, b] \) 上的连续函数空间 \( C[a, b] \) 配备一致度量 \( d(f, g) = \max_{x \in [a, b]} |f(x) - g(x)| \) 是完备的 (一致收敛极限函数仍连续)。

    例子 1.3.3 (非完备度量空间的例子)
    ① 有理数集 \( \mathbb{Q} \) 关于标准度量不是完备的。例如,存在有理数 Cauchy 序列收敛到无理数 \( \sqrt{2} \)。
    ② 开区间 \( (0, 1) \) 关于标准度量不是完备的。例如,序列 \( \{1/n\}_{n=2}^\infty \) 是 Cauchy 序列,但不收敛于 \( (0, 1) \) 中的点。

    1.3.4 紧致性与完备有界性 (Compactness, Completeness and Boundedness)

    在度量空间中,紧致性、完备性和有界性之间存在紧密联系。

    有界集 (Bounded Set):度量空间 \( (X, d) \) 中的集合 \(A \subseteq X\) 称为有界的 (bounded),如果存在 \( x_0 \in X \) 和 \( M > 0 \),使得对于任意 \( x \in A \),有 \( d(x, x_0) \le M \)。等价地,\(A\) 可以被有限半径的球覆盖。
    全有界集 (Totally Bounded Set):度量空间 \( (X, d) \) 中的集合 \(A \subseteq X\) 称为全有界的 (totally bounded),如果对于任意 \( \epsilon > 0 \),存在有限个点 \( x_1, \ldots, x_n \in X \),使得 \( A \subseteq \bigcup_{i=1}^{n} B(x_i, \epsilon) \)。

    定理 1.3.1 (度量空间中的紧致性)
    在度量空间中,集合 \(K \subseteq X\) 是紧致的当且仅当它是完备且全有界的。对于 \( \mathbb{R}^n \) 中的子集,紧致性等价于闭且有界 (Heine-Borel 定理)。

    总结

    本节介绍了度量空间的基本概念,包括度量、度量诱导的拓扑、开集、闭集、收敛、连续、完备性、有界性和紧致性。度量空间是泛函分析中许多重要概念的自然背景,例如赋范线性空间和 Hilbert 空间都是特殊的度量空间。理解度量空间的性质,对于后续学习泛函分析至关重要。

    2. chapter 2: 赋范线性空间与 Banach 空间 (Normed Linear Spaces and Banach Spaces)

    2.1 线性空间 (Linear Space)

    线性空间,也称为向量空间 (Vector Space),是泛函分析的基石。它是在集合上定义了加法和标量乘法运算,并且满足一定公理的代数结构。线性空间的概念是对我们熟悉的二维、三维空间以及向量运算的抽象和推广,是后续讨论赋范线性空间、Banach 空间以及更复杂结构的基础。

    定义 2.1.1 线性空间 (Linear Space)

    设 \( \mathbb{K} \) 为数域,可以是实数域 \( \mathbb{R} \) 或复数域 \( \mathbb{C} \)。一个线性空间 \( X \) 是一个非空集合,并且定义了两种代数运算:

    加法 (Addition):对于任意 \( x, y \in X \),存在唯一的元素 \( x + y \in X \),称为 \( x \) 与 \( y \) 的和。
    标量乘法 (Scalar Multiplication):对于任意 \( \alpha \in \mathbb{K} \) 和 \( x \in X \),存在唯一的元素 \( \alpha x \in X \),称为 \( \alpha \) 与 \( x \) 的标量积。

    这两种运算需要满足以下公理:

    加法公理 (Axioms for Addition):

    (A1) 结合律 (Associativity):对于任意 \( x, y, z \in X \),有 \( (x + y) + z = x + (y + z) \)。
    (A2) 交换律 (Commutativity):对于任意 \( x, y \in X \),有 \( x + y = y + x \)。
    (A3) 零元素 (Zero Element):存在一个元素 \( \mathbf{0} \in X \),称为零元素,对于任意 \( x \in X \),有 \( x + \mathbf{0} = x \)。
    (A4) 负元素 (Negative Element):对于任意 \( x \in X \),存在一个元素 \( -x \in X \),称为 \( x \) 的负元素,使得 \( x + (-x) = \mathbf{0} \)。

    标量乘法公理 (Axioms for Scalar Multiplication):

    (M1) 结合律 (Associativity):对于任意 \( \alpha, \beta \in \mathbb{K} \) 和 \( x \in X \),有 \( (\alpha \beta) x = \alpha (\beta x) \)。
    (M2) 单位元素 (Unit Element):对于任意 \( x \in X \),有 \( 1 x = x \),其中 \( 1 \) 是数域 \( \mathbb{K} \) 中的单位元素。

    加法与标量乘法的混合公理 (Axioms for Compatibility of Addition and Scalar Multiplication):

    (D1) 分配律 (Distributivity):对于任意 \( \alpha \in \mathbb{K} \) 和 \( x, y \in X \),有 \( \alpha (x + y) = \alpha x + \alpha y \)。
    (D2) 分配律 (Distributivity):对于任意 \( \alpha, \beta \in \mathbb{K} \) 和 \( x \in X \),有 \( (\alpha + \beta) x = \alpha x + \beta x \)。

    如果数域 \( \mathbb{K} = \mathbb{R} \),则称 \( X \) 为实线性空间 (Real Linear Space);如果 \( \mathbb{K} = \mathbb{C} \),则称 \( X \) 为复线性空间 (Complex Linear Space)。在不特别声明的情况下,我们通常用 \( \mathbb{K} \) 表示实数域 \( \mathbb{R} \) 或复数域 \( \mathbb{C} \)。

    例子 2.1.2 线性空间的例子 (Examples of Linear Spaces)

    欧几里得空间 (Euclidean Space) \( \mathbb{R}^n \):对于任意正整数 \( n \),实数域 \( \mathbb{R} \) 上的 \( n \) 维向量空间 \( \mathbb{R}^n = \{ (x_1, x_2, \ldots, x_n) \mid x_i \in \mathbb{R}, i = 1, 2, \ldots, n \} \) 是一个实线性空间。加法和标量乘法定义为:
    \[ (x_1, \ldots, x_n) + (y_1, \ldots, y_n) = (x_1 + y_1, \ldots, x_n + y_n) \]
    \[ \alpha (x_1, \ldots, x_n) = (\alpha x_1, \ldots, \alpha x_n) \]
    其中 \( (x_1, \ldots, x_n), (y_1, \ldots, y_n) \in \mathbb{R}^n \) 和 \( \alpha \in \mathbb{R} \)。

    复数空间 (Complex Space) \( \mathbb{C}^n \):类似地,复数域 \( \mathbb{C} \) 上的 \( n \) 维向量空间 \( \mathbb{C}^n = \{ (z_1, z_2, \ldots, z_n) \mid z_i \in \mathbb{C}, i = 1, 2, \ldots, n \} \) 是一个复线性空间,加法和标量乘法的定义与 \( \mathbb{R}^n \) 类似,只是标量 \( \alpha \in \mathbb{C} \)。

    函数空间 (Function Space) \( C[a, b] \):定义在闭区间 \( [a, b] \) 上的全体连续函数构成的集合 \( C[a, b] = \{ f: [a, b] \to \mathbb{R} \mid f \text{ is continuous} \} \) 是一个实线性空间。函数加法和标量乘法定义为:
    \[ (f + g)(t) = f(t) + g(t) \]
    \[ (\alpha f)(t) = \alpha f(t) \]
    其中 \( f, g \in C[a, b] \) 和 \( \alpha \in \mathbb{R} \)。零元素是零函数 \( \mathbf{0}(t) = 0 \)。

    序列空间 (Sequence Space) \( \ell^p \) 空间 ( \( 1 \le p \le \infty \) ):对于 \( 1 \le p < \infty \),\( \ell^p \) 空间定义为
    \[ \ell^p = \{ x = (x_n)_{n=1}^\infty \mid x_n \in \mathbb{K}, \sum_{n=1}^\infty |x_n|^p < \infty \} \]
    对于 \( p = \infty \),\( \ell^\infty \) 空间定义为
    \[ \ell^\infty = \{ x = (x_n)_{n=1}^\infty \mid x_n \in \mathbb{K}, \sup_{n \ge 1} |x_n| < \infty \} \]
    这些都是线性空间,加法和标量乘法是逐分量定义的。例如,对于 \( \ell^p \),若 \( x = (x_n), y = (y_n) \in \ell^p \) 和 \( \alpha \in \mathbb{K} \),则 \( x + y = (x_n + y_n) \) 和 \( \alpha x = (\alpha x_n) \)。需要验证 \( x + y \) 和 \( \alpha x \) 仍然在 \( \ell^p \) 中,这可以通过 Minkowski 不等式和标量乘法的性质来证明。

    矩阵空间 (Matrix Space) \( M_{m \times n}(\mathbb{K}) \):全体 \( m \times n \) 矩阵,元素取自数域 \( \mathbb{K} \),构成一个线性空间。矩阵加法和标量乘法是按元素定义的。

    线性空间是泛函分析研究对象的基础,很多重要的空间都是线性空间,例如赋范线性空间、Banach 空间、内积空间、Hilbert 空间等,它们都是在线性空间的基础上添加了不同的结构而得到的。

    2.2 赋范线性空间 (Normed Linear Space)

    赋范线性空间是在线性空间的基础上引入了“范数 (Norm)”的概念,范数是对向量“长度”的推广。有了范数,我们就可以度量空间中元素的大小和距离,从而可以讨论收敛性、连续性等分析性质。

    定义 2.2.1 范数 (Norm)

    设 \( X \) 是数域 \( \mathbb{K} \) 上的线性空间。定义在 \( X \) 上的一个范数是一个函数 \( \| \cdot \| : X \to \mathbb{R} \),满足以下性质:

    (N1) 非负性 (Non-negativity):对于任意 \( x \in X \),\( \| x \| \ge 0 \),且 \( \| x \| = 0 \) 当且仅当 \( x = \mathbf{0} \)。
    (N2) 齐次性 (Homogeneity):对于任意 \( \alpha \in \mathbb{K} \) 和 \( x \in X \),\( \| \alpha x \| = |\alpha| \| x \| \),其中 \( |\alpha| \) 是 \( \alpha \) 的绝对值(若 \( \mathbb{K} = \mathbb{R} \))或模长(若 \( \mathbb{K} = \mathbb{C} \))。
    (N3) 三角不等式 (Triangle Inequality):对于任意 \( x, y \in X \),\( \| x + y \| \le \| x \| + \| y \| \)。

    定义了范数的线性空间称为赋范线性空间 (Normed Linear Space)。我们通常用 \( (X, \| \cdot \|) \) 或简记为 \( X \) 来表示赋范线性空间。

    例子 2.2.2 赋范线性空间的例子 (Examples of Normed Linear Spaces)

    欧几里得空间 \( (\mathbb{R}^n, \| \cdot \|_2) \) 和 复数空间 \( (\mathbb{C}^n, \| \cdot \|_2) \):在 \( \mathbb{R}^n \) 或 \( \mathbb{C}^n \) 上,可以定义 \( p \)-范数 ( \( p \)-norm) \( \| \cdot \|_p \) ( \( 1 \le p \le \infty \) ):
    \[ \| x \|_p = \left( \sum_{i=1}^n |x_i|^p \right)^{1/p}, \quad 1 \le p < \infty \]
    \[ \| x \|_\infty = \max_{1 \le i \le n} |x_i| \]
    其中 \( x = (x_1, \ldots, x_n) \)。当 \( p = 2 \) 时,\( \| \cdot \|_2 \) 是欧几里得范数 (Euclidean norm) 或 \( \ell^2 \)-范数,也称为通常的范数。例如,在 \( \mathbb{R}^2 \) 中,\( \| (x_1, x_2) \|_2 = \sqrt{x_1^2 + x_2^2} \)。可以验证 \( \| \cdot \|_p \) ( \( 1 \le p \le \infty \) ) 满足范数的三个性质。特别地,三角不等式对于 \( p \)-范数是 Minkowski 不等式。

    函数空间 \( (C[a, b], \| \cdot \|_\infty) \):在连续函数空间 \( C[a, b] \) 上,可以定义 一致范数 (Uniform Norm) 或 上确界范数 (Supremum Norm) \( \| \cdot \|_\infty \):
    \[ \| f \|_\infty = \sup_{t \in [a, b]} |f(t)| = \max_{t \in [a, b]} |f(t)| \]
    由于闭区间上的连续函数可以取到最大值,所以上确界等于最大值。可以验证 \( \| \cdot \|_\infty \) 是 \( C[a, b] \) 上的一个范数。

    序列空间 \( (\ell^p, \| \cdot \|_p) \) ( \( 1 \le p \le \infty \) ):在 \( \ell^p \) 空间上,可以定义 \( p \)-范数 \( \| \cdot \|_p \):
    \[ \| x \|_p = \left( \sum_{n=1}^\infty |x_n|^p \right)^{1/p}, \quad 1 \le p < \infty \]
    \[ \| x \|_\infty = \sup_{n \ge 1} |x_n| \]
    其中 \( x = (x_n)_{n=1}^\infty \)。对于 \( 1 \le p < \infty \),要验证 \( \| \cdot \|_p \) 是 \( \ell^p \) 上的范数,需要用到 Minkowski 不等式和 Hölder 不等式。对于 \( p = \infty \),验证比较直接。

    范数诱导的度量 (Metric Induced by Norm)

    在赋范线性空间 \( (X, \| \cdot \|) \) 中,可以自然地定义一个度量 (Metric) \( d \):
    \[ d(x, y) = \| x - y \|, \quad x, y \in X \]
    可以验证,这样定义的 \( d \) 满足度量的三个性质:

    (D1) 非负性 (Non-negativity):\( d(x, y) = \| x - y \| \ge 0 \),且 \( d(x, y) = 0 \) 当且仅当 \( \| x - y \| = 0 \),即 \( x - y = \mathbf{0} \),也即 \( x = y \)。
    (D2) 对称性 (Symmetry):\( d(x, y) = \| x - y \| = \| (-1)(y - x) \| = |-1| \| y - x \| = \| y - x \| = d(y, x) \)。
    (D3) 三角不等式 (Triangle Inequality):\( d(x, z) = \| x - z \| = \| (x - y) + (y - z) \| \le \| x - y \| + \| y - z \| = d(x, y) + d(y, z) \)。

    因此,每个赋范线性空间都是一个度量空间。反之不成立,不是所有的度量空间都可以由范数诱导而来。由范数诱导的度量具有一些特殊的性质,例如平移不变性 (translation invariance) 和齐次性 (homogeneity):

    平移不变性 (Translation Invariance):\( d(x + z, y + z) = \| (x + z) - (y + z) \| = \| x - y \| = d(x, y) \)。
    齐次性 (Homogeneity):\( d(\alpha x, \alpha y) = \| \alpha x - \alpha y \| = \| \alpha (x - y) \| = |\alpha| \| x - y \| = |\alpha| d(x, y) \)。

    2.3 Banach 空间 (Banach Space)

    Banach 空间是完备的赋范线性空间。“完备性 (Completeness)”是分析学中一个重要的概念,它保证了 Cauchy 序列的极限存在。在赋范线性空间中引入完备性,就得到了 Banach 空间,它是泛函分析中最核心的研究对象之一。

    定义 2.3.1 Cauchy 序列 (Cauchy Sequence)

    设 \( (X, d) \) 是一个度量空间。序列 \( (x_n)_{n=1}^\infty \subset X \) 称为 Cauchy 序列,如果对于任意 \( \epsilon > 0 \),存在正整数 \( N \),使得当 \( m, n > N \) 时,有 \( d(x_m, x_n) < \epsilon \)。

    在赋范线性空间 \( (X, \| \cdot \|) \) 中,度量由范数诱导 \( d(x, y) = \| x - y \| \),所以 Cauchy 序列的定义变为:对于任意 \( \epsilon > 0 \),存在正整数 \( N \),使得当 \( m, n > N \) 时,有 \( \| x_m - x_n \| < \epsilon \)。

    定义 2.3.2 完备性 (Completeness)

    度量空间 \( (X, d) \) 称为完备的 (Complete),如果 \( X \) 中的每个 Cauchy 序列都收敛到 \( X \) 中的某个点。即,对于任意 Cauchy 序列 \( (x_n)_{n=1}^\infty \subset X \),存在 \( x \in X \),使得 \( \lim_{n \to \infty} d(x_n, x) = 0 \)。

    定义 2.3.3 Banach 空间 (Banach Space)

    完备的赋范线性空间称为 Banach 空间 (Banach Space)。也就是说,Banach 空间是一个赋范线性空间 \( (X, \| \cdot \|) \),并且作为由范数诱导的度量空间是完备的。

    定理 2.3.4 完备性与子空间的完备性 (Completeness and Completeness of Subspaces)

    设 \( (X, \| \cdot \|) \) 是 Banach 空间,\( Y \) 是 \( X \) 的线性子空间。则 \( Y \) 是 Banach 空间当且仅当 \( Y \) 是 \( X \) 中的闭子集。

    证明:

    \( (\Rightarrow) \) 假设 \( Y \) 是 Banach 空间。要证明 \( Y \) 是闭子集,只需证明 \( Y \) 包含其所有极限点。设 \( (y_n)_{n=1}^\infty \) 是 \( Y \) 中的序列,且 \( y_n \to x \in X \)。由于 \( (y_n) \) 收敛,所以它是 Cauchy 序列。因为 \( Y \) 是 Banach 空间(完备的),所以 \( (y_n) \) 在 \( Y \) 中收敛。由于极限的唯一性,\( x \) 必须是 \( (y_n) \) 在 \( Y \) 中的极限,因此 \( x \in Y \)。所以 \( Y \) 是闭子集。

    \( (\Leftarrow) \) 假设 \( Y \) 是 \( X \) 的闭子空间。要证明 \( Y \) 是 Banach 空间,只需证明 \( Y \) 中的每个 Cauchy 序列都收敛到 \( Y \) 中的点。设 \( (y_n)_{n=1}^\infty \) 是 \( Y \) 中的 Cauchy 序列。由于 \( Y \subset X \),\( (y_n) \) 也是 \( X \) 中的 Cauchy 序列。因为 \( X \) 是 Banach 空间(完备的),所以 \( (y_n) \) 在 \( X \) 中收敛到某个点 \( x \in X \),即 \( y_n \to x \)。由于 \( Y \) 是闭子集,且 \( (y_n) \subset Y \) 收敛到 \( x \),所以极限点 \( x \) 必须属于 \( Y \),即 \( x \in Y \)。因此,\( (y_n) \) 在 \( Y \) 中收敛到 \( x \)。所以 \( Y \) 是 Banach 空间。

    例子 2.3.5 Banach 空间的例子 (Examples of Banach Spaces)

    欧几里得空间 \( (\mathbb{R}^n, \| \cdot \|_p) \) 和 复数空间 \( (\mathbb{C}^n, \| \cdot \|_p) \) ( \( 1 \le p \le \infty \) ):对于任意 \( 1 \le p \le \infty \),\( (\mathbb{R}^n, \| \cdot \|_p) \) 和 \( (\mathbb{C}^n, \| \cdot \|_p) \) 都是 Banach 空间。完备性可以归结为实数域 \( \mathbb{R} \) 和复数域 \( \mathbb{C} \) 的完备性。

    函数空间 \( (C[a, b], \| \cdot \|_\infty) \):连续函数空间 \( (C[a, b], \| \cdot \|_\infty) \) 是 Banach 空间。这个结论是分析学中的经典结果,一致收敛的连续函数序列的极限函数仍然是连续函数。

    序列空间 \( (\ell^p, \| \cdot \|_p) \) ( \( 1 \le p \le \infty \) ):对于任意 \( 1 \le p \le \infty \),\( (\ell^p, \| \cdot \|_p) \) 都是 Banach 空间。证明完备性需要用到 Minkowski 不等式和一些序列的性质。

    有界线性算子空间 \( \mathcal{B}(X, Y) \):如果 \( Y \) 是 Banach 空间,则从赋范线性空间 \( X \) 到 Banach 空间 \( Y \) 的有界线性算子空间 \( \mathcal{B}(X, Y) \) 在算子范数 (operator norm) 下构成 Banach 空间。这是一个非常重要的结论,在泛函分析中有着广泛的应用。

    不是所有的赋范线性空间都是 Banach 空间。例如,多项式空间 \( P[a, b] \) 在一致范数 \( \| \cdot \|_\infty \) 下不是 Banach 空间,因为一致收敛的多项式序列的极限函数不一定是多项式(可能是连续函数,但不一定是多项式)。但是,\( P[a, b] \) 可以看作是 Banach 空间 \( C[a, b] \) 的一个稠密子空间。

    2.4 例子与应用 (Examples and Applications)

    本节将进一步给出一些具体的例子,并简要介绍赋范线性空间和 Banach 空间在数学和其他领域中的应用。

    更多 Banach 空间例子 (More Examples of Banach Spaces)

    Lebesgue 空间 \( L^p(\Omega) \) ( \( 1 \le p \le \infty \) ):设 \( (\Omega, \Sigma, \mu) \) 是一个测度空间。对于 \( 1 \le p < \infty \),\( L^p(\Omega) \) 空间定义为所有 \( p \) 次方可积的函数构成的空间,配备范数
    \[ \| f \|_{L^p} = \left( \int_\Omega |f(x)|^p d\mu(x) \right)^{1/p} \]
    \( L^\infty(\Omega) \) 空间定义为本质有界函数构成的空间,配备本质上确界范数
    \[ \| f \|_{L^\infty} = \operatorname{ess\,sup}_{x \in \Omega} |f(x)| \]
    \( L^p(\Omega) \) 空间 ( \( 1 \le p \le \infty \) ) 都是 Banach 空间,它们在现代分析学、偏微分方程、概率论等领域中扮演着核心角色。

    Sobolev 空间 \( W^{k, p}(\Omega) \):Sobolev 空间是泛函分析在偏微分方程中的重要应用。对于区域 \( \Omega \subset \mathbb{R}^n \),整数 \( k \ge 0 \) 和 \( 1 \le p \le \infty \),Sobolev 空间 \( W^{k, p}(\Omega) \) 由函数 \( u \in L^p(\Omega) \) 组成,其直到 \( k \) 阶的弱导数都存在且属于 \( L^p(\Omega) \)。Sobolev 空间配备适当的范数后是 Banach 空间,例如
    \[ \| u \|_{W^{k, p}} = \left( \sum_{|\alpha| \le k} \| D^\alpha u \|_{L^p}^p \right)^{1/p} \]
    其中 \( \alpha = (\alpha_1, \ldots, \alpha_n) \) 是多重指标,\( |\alpha| = \sum_{i=1}^n \alpha_i \),\( D^\alpha u = \frac{\partial^{|\alpha|} u}{\partial x_1^{\alpha_1} \cdots \partial x_n^{\alpha_n}} \) 是弱导数。Sobolev 空间是研究偏微分方程解的存在性、唯一性和正则性的重要工具。

    应用 (Applications)

    赋范线性空间和 Banach 空间的概念和理论在数学的许多分支以及其他科学领域都有广泛的应用:

    泛函分析自身:赋范线性空间和 Banach 空间是泛函分析的基本研究对象,许多重要的定理和理论都是在 Banach 空间框架下建立的,例如 Hahn-Banach 定理、一致有界原理、开映射定理、闭图像定理等,这些定理是泛函分析的核心内容。

    微分方程:如前所述,Sobolev 空间是研究偏微分方程的重要工具。变分方法、有限元方法等求解偏微分方程的数值方法也大量使用了泛函分析的理论和方法。

    数值分析:数值分析中,很多问题可以在 Banach 空间框架下进行研究,例如数值解的收敛性分析、误差估计等。

    优化理论:优化问题,特别是无限维优化问题,常常在 Banach 空间中进行研究。例如,最优控制理论、变分不等式等。

    量子力学:量子力学的数学基础很大程度上建立在 Hilbert 空间理论之上,而 Hilbert 空间是特殊的 Banach 空间。量子力学中的状态空间、算符等概念都与 Hilbert 空间密切相关。

    信号处理与图像处理:函数空间理论,特别是 Fourier 分析和 wavelet 分析,在信号处理和图像处理中有着重要的应用。这些理论很多都是在 Banach 空间或 Hilbert 空间的框架下发展的。

    经济学与金融学:在经济学和金融学中,很多模型涉及到无限维空间,例如动态规划、随机控制、金融衍生品定价等,都需要用到泛函分析的工具。

    总而言之,赋范线性空间和 Banach 空间是现代数学和应用数学的重要基石,它们提供了一个统一的框架来研究各种函数空间和算子,为解决各种数学问题和实际问题提供了强有力的工具。深入理解和掌握赋范线性空间和 Banach 空间的理论,对于学习和研究泛函分析及其应用至关重要。

    3. chapter 3: 内积空间与 Hilbert 空间 (Inner Product Spaces and Hilbert Spaces)

    3.1 内积空间 (Inner Product Space)

    内积空间 (Inner Product Space) 是泛函分析中一个核心概念,它在线性空间 (Linear Space) 的基础上引入了“角度”和“长度”的概念,从而使得我们可以研究空间中的几何性质。内积空间是 Hilbert 空间 (Hilbert Space) 的基础,而 Hilbert 空间在量子力学、信号处理、优化理论等领域有着广泛的应用。

    定义 3.1.1 (内积的定义)
    设 \( X \) 是数域 \( \mathbb{K} \) (其中 \( \mathbb{K} \) 为实数域 \( \mathbb{R} \) 或复数域 \( \mathbb{C} \)) 上的线性空间。一个 内积 (inner product) 是指一个映射 \( \langle \cdot, \cdot \rangle : X \times X \rightarrow \mathbb{K} \),它满足以下性质:

    共轭对称性 (Conjugate symmetry):对于任意的 \( x, y \in X \),有 \( \langle x, y \rangle = \overline{\langle y, x \rangle} \)。当 \( \mathbb{K} = \mathbb{R} \) 时,共轭对称性退化为对称性,即 \( \langle x, y \rangle = \langle y, x \rangle \)。

    对第一个变量线性 (Linearity in the first argument):对于任意的 \( x, y, z \in X \) 和 \( \alpha, \beta \in \mathbb{K} \),有 \( \langle \alpha x + \beta y, z \rangle = \alpha \langle x, z \rangle + \beta \langle y, z \rangle \)。

    正定性 (Positive-definiteness):对于任意的 \( x \in X \),有 \( \langle x, x \rangle \geq 0 \),并且 \( \langle x, x \rangle = 0 \) 当且仅当 \( x = 0 \)。

    一个定义了内积的线性空间 \( X \) 称为 内积空间 (inner product space)。

    注意:
    ⚝ 从共轭对称性和对第一个变量线性可以推导出对第二个变量共轭线性 (conjugate linearity in the second argument):
    \[ \langle x, \alpha y + \beta z \rangle = \overline{\langle \alpha y + \beta z, x \rangle} = \overline{\alpha \langle y, x \rangle + \beta \langle z, x \rangle} = \overline{\alpha} \overline{\langle y, x \rangle} + \overline{\beta} \overline{\langle z, x \rangle} = \overline{\alpha} \langle x, y \rangle + \overline{\beta} \langle x, z \rangle \]
    当 \( \mathbb{K} = \mathbb{R} \) 时,内积关于两个变量都是线性的,此时称之为 双线性 (bilinear)。当 \( \mathbb{K} = \mathbb{C} \) 时,内积关于第一个变量是线性的,关于第二个变量是共轭线性的,此时称之为 半双线性 (sesquilinear)。

    ⚝ 正定性条件 \( \langle x, x \rangle \geq 0 \) 保证了我们可以定义“长度”的概念。

    例子 3.1.2 (常见的内积空间)

    欧几里得空间 \( \mathbb{R}^n \):对于 \( x = (x_1, x_2, \ldots, x_n), y = (y_1, y_2, \ldots, y_n) \in \mathbb{R}^n \),定义标准内积为:
    \[ \langle x, y \rangle = \sum_{i=1}^{n} x_i y_i \]
    容易验证,这个定义满足内积的三个性质。\( \mathbb{R}^n \) 配备标准内积后成为一个实内积空间,也称为 欧几里得空间 (Euclidean space)。

    酉空间 \( \mathbb{C}^n \):对于 \( x = (x_1, x_2, \ldots, x_n), y = (y_1, y_2, \ldots, y_n) \in \mathbb{C}^n \),定义标准内积为:
    \[ \langle x, y \rangle = \sum_{i=1}^{n} x_i \overline{y_i} \]
    同样可以验证,这个定义满足内积的三个性质。\( \mathbb{C}^n \) 配备标准内积后成为一个复内积空间,也称为 酉空间 (Unitary space)。

    \( l^2 \) 空间:考虑所有平方可和的复数序列构成的空间 \( l^2 = \{ (x_n)_{n=1}^{\infty} : \sum_{n=1}^{\infty} |x_n|^2 < \infty \} \)。对于 \( x = (x_n), y = (y_n) \in l^2 \),定义内积为:
    \[ \langle x, y \rangle = \sum_{n=1}^{\infty} x_n \overline{y_n} \]
    需要证明级数 \( \sum_{n=1}^{\infty} x_n \overline{y_n} \) 收敛,以及验证内积的性质。利用 柯西-施瓦茨不等式 (Cauchy-Schwarz inequality) 可以证明级数收敛性。内积性质的验证是直接的。

    \( L^2([a, b]) \) 空间:考虑区间 \( [a, b] \) 上所有平方可积的复值函数构成的空间 \( L^2([a, b]) \)。对于 \( f, g \in L^2([a, b]) \),定义内积为:
    \[ \langle f, g \rangle = \int_{a}^{b} f(t) \overline{g(t)} dt \]
    同样需要证明积分存在性以及验证内积性质。利用积分形式的柯西-施瓦茨不等式可以保证积分存在性。内积性质的验证也是直接的。

    定理 3.1.3 (柯西-施瓦茨不等式)
    在内积空间 \( X \) 中,对于任意的 \( x, y \in X \),有
    \[ |\langle x, y \rangle| \leq \sqrt{\langle x, x \rangle} \sqrt{\langle y, y \rangle} \]
    等号成立当且仅当 \( x \) 和 \( y \) 线性相关。

    证明:
    若 \( y = 0 \),则不等式显然成立。假设 \( y \neq 0 \)。对于任意的 \( \lambda \in \mathbb{K} \),考虑向量 \( x - \lambda y \)。根据内积的正定性,有
    \[ \langle x - \lambda y, x - \lambda y \rangle \geq 0 \]
    展开内积,得到
    \[ \langle x, x \rangle - \lambda \langle y, x \rangle - \overline{\lambda} \langle x, y \rangle + |\lambda|^2 \langle y, y \rangle \geq 0 \]
    取 \( \lambda = \frac{\langle x, y \rangle}{\langle y, y \rangle} \),代入上式,得到
    \[ \langle x, x \rangle - \frac{|\langle x, y \rangle|^2}{\langle y, y \rangle} - \frac{|\langle x, y \rangle|^2}{\langle y, y \rangle} + \frac{|\langle x, y \rangle|^2}{\langle y, y \rangle^2} \langle y, y \rangle \geq 0 \]
    化简得到
    \[ \langle x, x \rangle - \frac{|\langle x, y \rangle|^2}{\langle y, y \rangle} \geq 0 \]

    \[ |\langle x, y \rangle|^2 \leq \langle x, x \rangle \langle y, y \rangle \]
    两边开方即得柯西-施瓦茨不等式。等号成立的条件可以通过反推上述步骤得到,即当 \( x - \lambda y = 0 \) 时,等号成立,也就是 \( x \) 和 \( y \) 线性相关。

    定义 3.1.4 (内积诱导的范数)
    在内积空间 \( X \) 中,可以定义 范数 (norm) 如下:
    \[ \|x\| = \sqrt{\langle x, x \rangle} \]
    称之为由内积诱导的范数。

    定理 3.1.5 (内积诱导范数的性质)
    由内积诱导的范数 \( \| \cdot \| \) 满足范数的三个性质:

    非负性 (Non-negativity):\( \|x\| \geq 0 \),且 \( \|x\| = 0 \) 当且仅当 \( x = 0 \)。 (由内积的正定性直接得到)

    齐次性 (Homogeneity):\( \|\alpha x\| = |\alpha| \|x\| \) 对于任意 \( \alpha \in \mathbb{K} \) 和 \( x \in X \)。
    证明:\( \|\alpha x\| = \sqrt{\langle \alpha x, \alpha x \rangle} = \sqrt{\alpha \overline{\alpha} \langle x, x \rangle} = \sqrt{|\alpha|^2 \langle x, x \rangle} = |\alpha| \sqrt{\langle x, x \rangle} = |\alpha| \|x\| \)。

    三角不等式 (Triangle inequality):\( \|x + y\| \leq \|x\| + \|y\| \) 对于任意 \( x, y \in X \)。
    证明:
    \[ \|x + y\|^2 = \langle x + y, x + y \rangle = \langle x, x \rangle + \langle x, y \rangle + \langle y, x \rangle + \langle y, y \rangle = \|x\|^2 + \|y\|^2 + \langle x, y \rangle + \overline{\langle x, y \rangle} = \|x\|^2 + \|y\|^2 + 2 \text{Re} \langle x, y \rangle \]
    利用柯西-施瓦茨不等式,\( \text{Re} \langle x, y \rangle \leq |\langle x, y \rangle| \leq \|x\| \|y\| \),所以
    \[ \|x + y\|^2 \leq \|x\|^2 + \|y\|^2 + 2 \|x\| \|y\| = (\|x\| + \|y\|)^2 \]
    两边开方即得三角不等式。

    因此,每个内积空间都是 赋范线性空间 (Normed Linear Space)。但是,反之不成立,即不是所有的赋范线性空间都来自内积空间。

    定理 3.1.6 (平行四边形恒等式)
    在内积空间 \( X \) 中,对于任意的 \( x, y \in X \), 平行四边形恒等式 (parallelogram identity) 成立:
    \[ \|x + y\|^2 + \|x - y\|^2 = 2(\|x\|^2 + \|y\|^2) \]

    证明:
    \[ \|x + y\|^2 = \|x\|^2 + \|y\|^2 + \langle x, y \rangle + \langle y, x \rangle \]
    \[ \|x - y\|^2 = \|x\|^2 + \|y\|^2 - \langle x, y \rangle - \langle y, x \rangle \]
    两式相加,得到
    \[ \|x + y\|^2 + \|x - y\|^2 = 2(\|x\|^2 + \|y\|^2) \]

    平行四边形恒等式是判断一个赋范线性空间的范数是否由内积诱导的关键。如果一个赋范线性空间的范数满足平行四边形恒等式,那么这个范数就可以由一个内积诱导。

    定理 3.1.7 (内积的极化恒等式)
    在实内积空间中,内积可以通过范数表示:
    \[ \langle x, y \rangle = \frac{1}{4} (\|x + y\|^2 - \|x - y\|^2) \]
    在复内积空间中,内积可以通过范数表示:
    \[ \langle x, y \rangle = \frac{1}{4} (\|x + y\|^2 - \|x - y\|^2 + i\|x + iy\|^2 - i\|x - iy\|^2) \]
    或者另一种常用的形式:
    \[ \langle x, y \rangle = \frac{1}{4} \sum_{k=0}^{3} i^k \|x + i^k y\|^2 \]

    证明 (实内积空间):
    \[ \|x + y\|^2 = \|x\|^2 + \|y\|^2 + 2\langle x, y \rangle \]
    \[ \|x - y\|^2 = \|x\|^2 + \|y\|^2 - 2\langle x, y \rangle \]
    两式相减,得到
    \[ \|x + y\|^2 - \|x - y\|^2 = 4\langle x, y \rangle \]

    \[ \langle x, y \rangle = \frac{1}{4} (\|x + y\|^2 - \|x - y\|^2) \]
    复内积空间的极化恒等式证明类似,只需展开范数并利用内积的性质即可。

    极化恒等式表明,内积完全由范数决定。这意味着,如果两个内积空间作为赋范线性空间是等距同构的,那么它们作为内积空间也是等距同构的。

    3.2 Hilbert 空间 (Hilbert Space)

    定义 3.2.1 (Hilbert 空间)
    Hilbert 空间 (Hilbert Space) 是完备的内积空间。也就是说,一个 Hilbert 空间 \( H \) 首先是一个内积空间,其次,作为由内积诱导范数的赋范线性空间,它是完备的。

    回顾:完备性
    一个赋范线性空间 \( X \) 是完备的,如果 \( X \) 中的每一个 柯西序列 (Cauchy sequence) 都收敛到 \( X \) 中的一个点。

    由于内积空间一定是赋范线性空间,所以 Hilbert 空间一定是 Banach 空间 (Banach Space)。反之,Banach 空间不一定是 Hilbert 空间。只有当 Banach 空间的范数是由内积诱导的时候,且这个 Banach 空间是完备的,它才是 Hilbert 空间。而判断范数是否由内积诱导,可以通过平行四边形恒等式来检验。

    例子 3.2.2 (Hilbert 空间的例子)

    欧几里得空间 \( \mathbb{R}^n \) 和 酉空间 \( \mathbb{C}^n \):配备标准内积的 \( \mathbb{R}^n \) 和 \( \mathbb{C}^n \) 都是 Hilbert 空间。因为它们都是有限维赋范线性空间,而有限维赋范线性空间都是完备的。

    \( l^2 \) 空间:\( l^2 \) 空间是 Hilbert 空间。我们已经验证了 \( l^2 \) 是内积空间,还需要证明其完备性。设 \( (x^{(k)})_{k=1}^{\infty} \) 是 \( l^2 \) 中的柯西序列,其中 \( x^{(k)} = (x_n^{(k)})_{n=1}^{\infty} \)。对于任意 \( \epsilon > 0 \),存在 \( N \),当 \( k, m > N \) 时,\( \|x^{(k)} - x^{(m)}\|_{l^2} < \epsilon \)。对于固定的 \( n \),序列 \( (x_n^{(k)})_{k=1}^{\infty} \) 是数域 \( \mathbb{K} \) 中的柯西序列,由于 \( \mathbb{K} \) 是完备的,所以 \( (x_n^{(k)})_{k=1}^{\infty} \) 收敛,设极限为 \( x_n \)。令 \( x = (x_n)_{n=1}^{\infty} \)。我们需要证明 \( x \in l^2 \) 且 \( x^{(k)} \rightarrow x \) 在 \( l^2 \) 中。利用柯西序列的性质和极限的定义可以证明这两点。

    \( L^2([a, b]) \) 空间:\( L^2([a, b]) \) 空间也是 Hilbert 空间。证明 \( L^2([a, b]) \) 的完备性需要用到 Riesz-Fischer 定理,这个定理表明 \( L^p \) 空间 (包括 \( L^2 \)) 都是完备的。

    例子 3.2.3 (非 Hilbert 空间的例子)

    \( C([0, 1]) \) 空间配备 \( L^2 \) 内积:考虑连续函数空间 \( C([0, 1]) \),定义内积为 \( \langle f, g \rangle = \int_{0}^{1} f(t) \overline{g(t)} dt \)。这是一个内积空间,但是它不是 Hilbert 空间,因为 \( C([0, 1]) \) 关于由 \( L^2 \) 内积诱导的范数 不完备。\( C([0, 1]) \) 在 \( L^2 \) 范数下的完备化是 \( L^2([0, 1]) \)。

    \( l^p \) 空间 ( \( p \neq 2 \) ):\( l^p \) 空间 ( \( p \neq 2 \) 且 \( 1 \leq p < \infty \) ) 配备范数 \( \|x\|_p = (\sum_{n=1}^{\infty} |x_n|^p)^{1/p} \) 是 Banach 空间,但当 \( p \neq 2 \) 时,其范数不满足平行四边形恒等式,因此 \( l^p \) ( \( p \neq 2 \) ) 不是 Hilbert 空间。类似的,\( L^p([a, b]) \) 空间 ( \( p \neq 2 \) 且 \( 1 \leq p < \infty \) ) 也不是 Hilbert 空间。

    Hilbert 空间由于其完备性和内积结构,具有许多优良的性质,这使得它在泛函分析和应用数学中扮演着重要的角色。

    3.3 正交性与最佳逼近 (Orthogonality and Best Approximation)

    在 Hilbert 空间中,内积赋予了我们 正交性 (orthogonality) 的概念,这与欧几里得空间中的垂直概念相推广。正交性在 Hilbert 空间理论中非常重要,它引出了 最佳逼近 (best approximation) 和 正交投影 (orthogonal projection) 等重要概念。

    定义 3.3.1 (正交)
    在内积空间 \( X \) 中,如果 \( \langle x, y \rangle = 0 \),则称向量 \( x \) 和 \( y \) 正交 (orthogonal),记作 \( x \perp y \)。如果集合 \( A, B \subseteq X \),对于任意 \( x \in A \) 和 \( y \in B \),都有 \( x \perp y \),则称集合 \( A \) 和 \( B \) 正交,记作 \( A \perp B \)。

    定义 3.3.2 (正交补)
    设 \( M \) 是内积空间 \( X \) 的一个子集,定义 \( M \) 的 正交补 (orthogonal complement) 为:
    \[ M^{\perp} = \{ x \in X : \langle x, y \rangle = 0 \text{ for all } y \in M \} \]
    \( M^{\perp} \) 是 \( X \) 的一个线性子空间,且是 闭子空间 (closed subspace)。

    定理 3.3.3 (勾股定理)
    在内积空间 \( X \) 中,如果 \( x \perp y \),则 勾股定理 (Pythagorean theorem) 成立:
    \[ \|x + y\|^2 = \|x\|^2 + \|y\|^2 \]
    证明:
    \[ \|x + y\|^2 = \langle x + y, x + y \rangle = \langle x, x \rangle + \langle x, y \rangle + \langle y, x \rangle + \langle y, y \rangle \]
    由于 \( x \perp y \),即 \( \langle x, y \rangle = 0 \),所以 \( \langle y, x \rangle = \overline{\langle x, y \rangle} = 0 \)。因此,
    \[ \|x + y\|^2 = \|x\|^2 + \|y\|^2 \]

    定义 3.3.4 (标准正交集与标准正交基)
    在内积空间 \( X \) 中,一个向量集合 \( \{e_i\}_{i \in I} \) 称为 标准正交集 (orthonormal set),如果满足:
    ① \( \langle e_i, e_j \rangle = 0 \) 当 \( i \neq j \) 时 (正交性)。
    ② \( \|e_i\| = 1 \) 对于所有 \( i \in I \) (单位长度)。

    如果一个标准正交集 \( \{e_i\}_{i \in I} \) 还张成 \( X \) (即 \( \text{span}\{e_i\}_{i \in I} \) 在 \( X \) 中稠密),则称 \( \{e_i\}_{i \in I} \) 为 \( X \) 的 标准正交基 (orthonormal basis) 或 Hilbert 基 (Hilbert basis)。

    定理 3.3.5 (Bessel 不等式)
    设 \( \{e_1, e_2, \ldots, e_n\} \) 是内积空间 \( X \) 中的标准正交集,对于任意 \( x \in X \), Bessel 不等式 (Bessel's inequality) 成立:
    \[ \sum_{i=1}^{n} |\langle x, e_i \rangle|^2 \leq \|x\|^2 \]
    更一般地,如果 \( \{e_i\}_{i=1}^{\infty} \) 是可数标准正交集,则
    \[ \sum_{i=1}^{\infty} |\langle x, e_i \rangle|^2 \leq \|x\|^2 \]

    定理 3.3.6 (最佳逼近定理)
    设 \( M \) 是 Hilbert 空间 \( H \) 的 闭凸子集 (closed convex subset)。对于任意 \( x \in H \),存在唯一的 \( y_0 \in M \),使得
    \[ \|x - y_0\| = \inf_{y \in M} \|x - y\| \]
    称 \( y_0 \) 为 \( x \) 在 \( M \) 中的 最佳逼近元 (best approximation) 或 最佳逼近

    特别地,如果 \( M \) 是 Hilbert 空间 \( H \) 的 闭线性子空间 (closed linear subspace),则最佳逼近元 \( y_0 \) 存在且唯一,并且 \( y_0 \) 是 \( x \) 在 \( M \) 上的 正交投影 (orthogonal projection),即 \( x - y_0 \perp M \)。此时,可以得到 正交分解定理 (orthogonal decomposition theorem):
    \[ H = M \oplus M^{\perp} \]
    即对于任意 \( x \in H \),存在唯一的 \( y_0 \in M \) 和 \( z_0 \in M^{\perp} \),使得 \( x = y_0 + z_0 \),且 \( \|x\|^2 = \|y_0\|^2 + \|z_0\|^2 \)。\( y_0 \) 称为 \( x \) 在 \( M \) 上的正交投影,记作 \( P_M x = y_0 \)。

    定理 3.3.7 (Parseval 等式)
    设 \( \{e_i\}_{i=1}^{\infty} \) 是 Hilbert 空间 \( H \) 的可数标准正交基。对于任意 \( x \in H \), Parseval 等式 (Parseval's identity) 成立:
    \[ \|x\|^2 = \sum_{i=1}^{\infty} |\langle x, e_i \rangle|^2 \]
    并且
    \[ x = \sum_{i=1}^{\infty} \langle x, e_i \rangle e_i \]
    级数在 Hilbert 空间的范数意义下收敛。系数 \( \langle x, e_i \rangle \) 称为 \( x \) 关于标准正交基 \( \{e_i\}_{i=1}^{\infty} \) 的 Fourier 系数 (Fourier coefficients)。

    Gram-Schmidt 正交化过程
    Gram-Schmidt 正交化过程 (Gram-Schmidt orthogonalization process) 是一种构造标准正交集的方法。给定线性无关向量组 \( \{x_1, x_2, \ldots, x_n\} \),可以构造标准正交向量组 \( \{e_1, e_2, \ldots, e_n\} \) 使得 \( \text{span}\{x_1, x_2, \ldots, x_k\} = \text{span}\{e_1, e_2, \ldots, e_k\} \) 对于 \( k = 1, 2, \ldots, n \)。构造步骤如下:

    ① \( e_1 = \frac{x_1}{\|x_1\|} \)

    ② \( \tilde{e}_2 = x_2 - \langle x_2, e_1 \rangle e_1 \), \( e_2 = \frac{\tilde{e}_2}{\|\tilde{e}_2\|} \)

    ③ \( \tilde{e}_3 = x_3 - \langle x_3, e_1 \rangle e_1 - \langle x_3, e_2 \rangle e_2 \), \( e_3 = \frac{\tilde{e}_3}{\|\tilde{e}_3\|} \)

    ...

    ④ \( \tilde{e}_n = x_n - \sum_{i=1}^{n-1} \langle x_n, e_i \rangle e_i \), \( e_n = \frac{\tilde{e}_n}{\|\tilde{e}_n\|} \)

    通过 Gram-Schmidt 正交化过程,我们可以将任意可数线性无关向量组正交化为标准正交集。如果原始向量组张成一个可分的 Hilbert 空间,那么得到的标准正交集将是 Hilbert 基。

    3.4 Hilbert 空间的例子 (Examples of Hilbert Spaces)

    本节将给出更多 Hilbert 空间的例子,以加深对 Hilbert 空间概念的理解。

    例子 3.4.1 (序列空间 \( l^2(I) \))
    设 \( I \) 是任意指标集,定义序列空间 \( l^2(I) \) 为所有指标在 \( I \) 上的平方可和的复数函数 \( x: I \rightarrow \mathbb{C} \) 构成的空间,即
    \[ l^2(I) = \{ x: I \rightarrow \mathbb{C} : \sum_{i \in I} |x(i)|^2 < \infty \} \]
    其中求和是对指标集 \( I \) 中所有使得 \( x(i) \neq 0 \) 的 \( i \) 进行的 (事实上,至多可数个 \( i \) 使得 \( x(i) \neq 0 \))。定义内积为:
    \[ \langle x, y \rangle = \sum_{i \in I} x(i) \overline{y(i)} \]
    \( l^2(I) \) 是 Hilbert 空间。当 \( I = \{1, 2, \ldots, n\} \) 时,\( l^2(I) \) 就是 \( \mathbb{C}^n \)。当 \( I = \mathbb{N} \) 时,\( l^2(I) \) 就是 \( l^2 \)。

    例子 3.4.2 (加权 \( l^2 \) 空间 \( l^2_w \))
    设 \( w = (w_n)_{n=1}^{\infty} \) 是正权序列,定义加权 \( l^2 \) 空间 \( l^2_w \) 为
    \[ l^2_w = \{ x = (x_n)_{n=1}^{\infty} : \sum_{n=1}^{\infty} |x_n|^2 w_n < \infty \} \]
    定义内积为:
    \[ \langle x, y \rangle_w = \sum_{n=1}^{\infty} x_n \overline{y_n} w_n \]
    \( l^2_w \) 是 Hilbert 空间。当 \( w_n = 1 \) 时,\( l^2_w \) 就是 \( l^2 \)。

    例子 3.4.3 (\( L^2 \) 空间 \( L^2(\Omega, \mu) \))
    设 \( (\Omega, \Sigma, \mu) \) 是测度空间,定义 \( L^2(\Omega, \mu) \) 为所有在 \( \Omega \) 上平方可积的复值可测函数 \( f \) 的等价类构成的空间,即
    \[ L^2(\Omega, \mu) = \{ [f] : f \text{ is measurable and } \int_{\Omega} |f|^2 d\mu < \infty \} \]
    定义内积为:
    \[ \langle [f], [g] \rangle = \int_{\Omega} f(t) \overline{g(t)} d\mu(t) \]
    \( L^2(\Omega, \mu) \) 是 Hilbert 空间。当 \( \Omega = [a, b] \),\( \mu \) 是 Lebesgue 测度时,\( L^2(\Omega, \mu) \) 就是 \( L^2([a, b]) \)。

    例子 3.4.4 (Hardy 空间 \( H^2(\mathbb{D}) \))
    Hardy 空间 (Hardy space) \( H^2(\mathbb{D}) \) 是定义在单位圆盘 \( \mathbb{D} = \{z \in \mathbb{C} : |z| < 1\} \) 上的解析函数 \( f(z) = \sum_{n=0}^{\infty} a_n z^n \) 构成的空间,且满足
    \[ \|f\|_{H^2}^2 = \sup_{0 \leq r < 1} \frac{1}{2\pi} \int_{0}^{2\pi} |f(re^{i\theta})|^2 d\theta = \sum_{n=0}^{\infty} |a_n|^2 < \infty \]
    内积定义为:
    \[ \langle f, g \rangle_{H^2} = \sum_{n=0}^{\infty} a_n \overline{b_n} \]
    其中 \( g(z) = \sum_{n=0}^{\infty} b_n z^n \)。\( H^2(\mathbb{D}) \) 是 Hilbert 空间。标准正交基为 \( \{e_n(z) = z^n\}_{n=0}^{\infty} \)。

    这些例子展示了 Hilbert 空间的多样性,它们在数学的各个分支以及物理学、工程学等领域都有着重要的应用。对 Hilbert 空间的深入理解是学习泛函分析后续内容的基础。

    4. chapter 4: 有界线性算子 (Bounded Linear Operators)

    4.1 线性算子 (Linear Operator)

    在泛函分析中,算子 (operator) 是函数概念的推广。当函数的定义域和值域为 线性空间 (linear space) 时,我们称之为 线性算子 (linear operator)线性映射 (linear mapping)。线性算子是泛函分析研究的核心对象之一,它们在理论分析和实际应用中都扮演着至关重要的角色。

    定义 4.1.1 (线性算子)

    设 \(X\) 和 \(Y\) 是 线性空间 (linear space) (定义在相同的数域 \( \mathbb{K} \),其中 \( \mathbb{K} \) 通常为实数域 \( \mathbb{R} \) 或复数域 \( \mathbb{C} \))。一个从 \(X\) 到 \(Y\) 的 算子 \(T: X \to Y\) 被称为 线性算子 (linear operator),如果它满足以下两个条件:

    可加性 (Additivity): 对于任意 \(x_1, x_2 \in X\),有
    \[ T(x_1 + x_2) = T(x_1) + T(x_2) \]

    齐次性 (Homogeneity): 对于任意 \(x \in X\) 和任意标量 \( \alpha \in \mathbb{K} \),有
    \[ T(\alpha x) = \alpha T(x) \]

    简而言之,线性算子保持 线性运算 (linear operations)

    等价定义:一个算子 \(T: X \to Y\) 是线性的,当且仅当对于任意 \(x_1, x_2 \in X\) 和任意标量 \( \alpha, \beta \in \mathbb{K} \),有
    \[ T(\alpha x_1 + \beta x_2) = \alpha T(x_1) + \beta T(x_2) \]

    这个等价定义综合了可加性和齐次性,在实际应用中更加方便。

    例子 4.1.2 (线性算子的例子)

    零算子 (Zero Operator): 设 \(X\) 和 \(Y\) 是线性空间。零算子 \(0: X \to Y\) 定义为对于所有 \(x \in X\),\(0(x) = 0_Y\),其中 \(0_Y\) 是 \(Y\) 中的零向量。零算子显然是线性的。

    恒等算子 (Identity Operator): 设 \(X\) 是线性空间。恒等算子 \(I: X \to X\) 定义为对于所有 \(x \in X\),\(I(x) = x\)。恒等算子也是线性的。

    微分算子 (Differentiation Operator): 考虑 线性空间 \(C^1[a, b]\) (在 \([a, b]\) 上具有连续一阶导数的函数空间) 到 \(C[a, b]\) (在 \([a, b]\) 上连续的函数空间) 的算子 \(D\),定义为 \(D(f) = f'\),即对函数 \(f\) 求导。微分算子 \(D\) 是线性的,因为 \((f+g)' = f' + g'\) 且 \((\alpha f)' = \alpha f'\)。

    积分算子 (Integration Operator): 考虑 线性空间 \(C[a, b]\) 到自身 (或到其他函数空间) 的 积分算子 \(J\),例如定义为
    \[ (Jf)(x) = \int_a^x f(t) dt \]
    积分算子 \(J\) 也是线性的,因为积分运算满足线性性质:\( \int_a^x (f(t) + g(t)) dt = \int_a^x f(t) dt + \int_a^x g(t) dt \) 和 \( \int_a^x (\alpha f(t)) dt = \alpha \int_a^x f(t) dt \)。

    矩阵算子 (Matrix Operator): 在有限维空间中,线性算子可以用矩阵来表示。设 \(X = \mathbb{R}^n\) 和 \(Y = \mathbb{R}^m\),\(A\) 是一个 \(m \times n\) 的实矩阵。定义算子 \(T_A: \mathbb{R}^n \to \mathbb{R}^m\) 为 \(T_A(x) = Ax\),其中 \(x \in \mathbb{R}^n\) 被视为列向量。矩阵乘法满足线性性质,因此 \(T_A\) 是线性算子。

    平移算子 (Translation Operator): 考虑 函数空间 \(C(\mathbb{R})\) (在实数域上连续的函数空间)。定义 平移算子 \(S_a: C(\mathbb{R}) \to C(\mathbb{R})\) 为 \(S_a(f)(x) = f(x-a)\),其中 \(a\) 是一个固定的实数。平移算子 \(S_a\) 是线性的,因为 \(S_a(f+g)(x) = (f+g)(x-a) = f(x-a) + g(x-a) = S_a(f)(x) + S_a(g)(x)\) 和 \(S_a(\alpha f)(x) = (\alpha f)(x-a) = \alpha f(x-a) = \alpha S_a(f)(x)\)。

    线性算子的性质

    零向量的映射: 对于任何线性算子 \(T: X \to Y\),都有 \(T(0_X) = 0_Y\),其中 \(0_X\) 和 \(0_Y\) 分别是 \(X\) 和 \(Y\) 中的零向量。这是由齐次性取 \( \alpha = 0 \) 即可得到:\(T(0_X) = T(0 \cdot x) = 0 \cdot T(x) = 0_Y\)。

    线性组合的保持: 线性算子保持线性组合。对于任意 \(x_1, x_2, \dots, x_n \in X\) 和任意标量 \( \alpha_1, \alpha_2, \dots, \alpha_n \in \mathbb{K} \),有
    \[ T(\sum_{i=1}^n \alpha_i x_i) = \sum_{i=1}^n \alpha_i T(x_i) \]
    这可以由线性算子的定义通过归纳法证明。

    线性子空间的像与原像:
    ▮▮▮▮⚝ 如果 \(M\) 是 \(X\) 的 线性子空间 (linear subspace),则 \(T(M) = \{T(x) : x \in M\}\) 是 \(Y\) 的线性子空间。
    ▮▮▮▮⚝ 如果 \(N\) 是 \(Y\) 的线性子空间,则 \(T^{-1}(N) = \{x \in X : T(x) \in N\}\) 是 \(X\) 的线性子空间。特别地,核空间 (kernel)零空间 (null space) \( \text{Ker}(T) = T^{-1}(\{0_Y\}) = \{x \in X : T(x) = 0_Y\} \) 是 \(X\) 的线性子空间,值域 (range)像空间 (image space) \( \text{Ran}(T) = T(X) = \{T(x) : x \in X\} \) 是 \(Y\) 的线性子空间。

    线性算子是研究线性空间结构的重要工具,也是泛函分析后续内容的基础。

    4.2 有界线性算子 (Bounded Linear Operator)

    赋范线性空间 (normed linear space) 之间,我们不仅可以讨论线性算子,还可以进一步研究 有界线性算子 (bounded linear operator)。有界性是分析线性算子性质,特别是其连续性的关键概念。

    定义 4.2.1 (有界线性算子)

    设 \(X\) 和 \(Y\) 是 赋范线性空间 (normed linear space)。一个 线性算子 \(T: X \to Y\) 被称为 有界线性算子 (bounded linear operator),如果存在一个常数 \(M \ge 0\),使得对于所有 \(x \in X\),都有
    \[ \|T(x)\|_Y \le M \|x\|_X \]
    其中 \( \| \cdot \|_X \) 和 \( \| \cdot \|_Y \) 分别是 \(X\) 和 \(Y\) 上的 范数 (norm)。满足上述不等式的最小非负常数 \(M\) 称为算子 \(T\) 的 范数 (norm),记为 \( \|T\| \)。

    定理 4.2.2 (有界性与连续性)

    设 \(X\) 和 \(Y\) 是 赋范线性空间 (normed linear space),\(T: X \to Y\) 是 线性算子 (linear operator)。则以下命题等价:

    ① \(T\) 是 有界线性算子 (bounded linear operator)
    ② \(T\) 在 \(X\) 上 连续 (continuous)
    ③ \(T\) 在 \(X\) 的 零向量 (zero vector) 处连续,即在 \(x = 0\) 处连续。

    证明:

    ① \( \implies \) ②: 假设 \(T\) 是有界的,即存在 \(M \ge 0\) 使得 \( \|T(x)\|_Y \le M \|x\|_X \) 对所有 \(x \in X\) 成立。要证明 \(T\) 连续,只需证明对于任意 \(x_0 \in X\) 和任意 \( \epsilon > 0 \),存在 \( \delta > 0 \),使得当 \( \|x - x_0\|_X < \delta \) 时,有 \( \|T(x) - T(x_0)\|_Y < \epsilon \)。

    由于 \(T\) 是线性的,\(T(x) - T(x_0) = T(x - x_0)\)。因此,
    \[ \|T(x) - T(x_0)\|_Y = \|T(x - x_0)\|_Y \le M \|x - x_0\|_X \]
    给定 \( \epsilon > 0 \),取 \( \delta = \frac{\epsilon}{M} \) (如果 \(M = 0\),则 \(T\) 是零算子,显然连续,此时可取任意 \( \delta > 0 \))。当 \( \|x - x_0\|_X < \delta \) 时,
    \[ \|T(x) - T(x_0)\|_Y \le M \|x - x_0\|_X < M \delta = M \cdot \frac{\epsilon}{M} = \epsilon \]
    所以 \(T\) 在 \(x_0\) 处连续。由于 \(x_0\) 是任意选取的,因此 \(T\) 在 \(X\) 上连续。

    ② \( \implies \) ③: 如果 \(T\) 在 \(X\) 上连续,那么自然在 \(X\) 的零向量处也连续。

    ③ \( \implies \) ①: 假设 \(T\) 在 \(x = 0\) 处连续。根据连续性的定义,对于 \( \epsilon = 1 > 0 \),存在 \( \delta > 0 \),使得当 \( \|x - 0\|_X = \|x\|_X < \delta \) 时,有 \( \|T(x) - T(0)\|_Y < 1 \)。由于 \(T\) 是线性的,\(T(0) = 0_Y\),所以当 \( \|x\|_X < \delta \) 时,\( \|T(x)\|_Y < 1 \)。

    现在对于任意非零向量 \(x \in X\),令 \(y = \frac{\delta}{2\|x\|_X} x\)。则 \( \|y\|_X = \frac{\delta}{2\|x\|_X} \|x\|_X = \frac{\delta}{2} < \delta \)。因此,\( \|T(y)\|_Y < 1 \)。
    \[ \|T(y)\|_Y = \|T(\frac{\delta}{2\|x\|_X} x)\|_Y = \|\frac{\delta}{2\|x\|_X} T(x)\|_Y = \frac{\delta}{2\|x\|_X} \|T(x)\|_Y \]
    所以 \( \frac{\delta}{2\|x\|_X} \|T(x)\|_Y < 1 \),即 \( \|T(x)\|_Y < \frac{2}{\delta} \|x\|_X \)。
    令 \(M = \frac{2}{\delta}\),则对于所有 \(x \in X\) (包括 \(x = 0\),此时不等式显然成立),都有 \( \|T(x)\|_Y \le M \|x\|_X \)。因此 \(T\) 是有界线性算子。

    证毕

    这个定理揭示了线性算子的有界性和连续性是等价的,这是一个非常重要的结论。在泛函分析中,我们经常不加区分地使用 “有界线性算子” 和 “连续线性算子” 这两个术语。

    例子 4.2.3 (有界线性算子的例子)

    有限维空间上的线性算子: 如果 \(X\) 和 \(Y\) 都是 有限维赋范线性空间 (finite-dimensional normed linear space),则任何线性算子 \(T: X \to Y\) 都是有界的 (因此也是连续的)。这可以通过选择 \(X\) 的一组基,并将 \(T\) 表示为矩阵来证明。由于有限维空间上的所有范数都等价,我们可以选择合适的范数来简化证明。

    积分算子 (有界性): 考虑 积分算子 \(J: C[a, b] \to C[a, b]\) 定义为 \( (Jf)(x) = \int_a^x f(t) dt \),其中 \(C[a, b]\) 配备 上确界范数 (supremum norm) \( \|f\|_\infty = \max_{x \in [a, b]} |f(x)| \)。对于 \(x \in [a, b]\),
    \[ |(Jf)(x)| = |\int_a^x f(t) dt| \le \int_a^x |f(t)| dt \le \int_a^x \|f\|_\infty dt = (x-a) \|f\|_\infty \le (b-a) \|f\|_\infty \]
    因此,\( \|Jf\|_\infty = \max_{x \in [a, b]} |(Jf)(x)| \le (b-a) \|f\|_\infty \)。令 \(M = b-a\),则 \( \|Jf\|_\infty \le M \|f\|_\infty \)。所以积分算子 \(J\) 是有界线性算子。

    微分算子 (无界性): 考虑 微分算子 \(D: C^1[0, 1] \to C[0, 1]\) 定义为 \(D(f) = f'\),其中 \(C^1[0, 1]\) 和 \(C[0, 1]\) 都配备 上确界范数 (supremum norm)。微分算子 \(D\) 是 无界线性算子 (unbounded linear operator)。为了证明这一点,我们需要找到一列函数 \(f_n\) 使得 \( \frac{\|Df_n\|}{\|f_n\|} \) 趋于无穷大。考虑函数 \(f_n(x) = \sin(nx)\)。则 \(f_n \in C^1[0, 1]\),\(f_n'(x) = n \cos(nx)\)。
    \( \|f_n\|_\infty = \max_{x \in [0, 1]} |\sin(nx)| \le 1 \),\( \|Df_n\|_\infty = \|f_n'\|_\infty = \max_{x \in [0, 1]} |n \cos(nx)| \le n \)。
    实际上,我们可以取 \(x = \frac{\pi}{2n}\) (如果 \( \frac{\pi}{2n} \in [0, 1]\),当 \(n \ge \frac{\pi}{2} \) 时成立),此时 \(|\cos(nx)| = |\cos(\frac{\pi}{2})| = 0\)。但如果取 \(x = 0\),\(|\cos(nx)| = |\cos(0)| = 1\)。所以 \( \|Df_n\|_\infty = n \)。
    因此,\( \frac{\|Df_n\|_\infty}{\|f_n\|_\infty} = \frac{n}{\|\sin(nx)\|_\infty} \)。为了更精确地估计 \( \|f_n\|_\infty \),注意到 \(|\sin(nx)|\) 的最大值是 1。我们可以选择 \(f_n(x) = \frac{1}{n} \sin(n^2 x)\)。则 \( \|f_n\|_\infty = \frac{1}{n} \),\(f_n'(x) = n \cos(n^2 x)\),\( \|Df_n\|_\infty = n \)。所以 \( \frac{\|Df_n\|_\infty}{\|f_n\|_\infty} = \frac{n}{1/n} = n^2 \to \infty \) 当 \(n \to \infty\)。
    更简单地,考虑 \(f_n(x) = x^n\) 在 \([0, 1]\) 上。\(f_n'(x) = nx^{n-1}\)。\( \|f_n\|_\infty = 1 \),\( \|Df_n\|_\infty = \max_{x \in [0, 1]} |nx^{n-1}| = n \)。所以 \( \frac{\|Df_n\|_\infty}{\|f_n\|_\infty} = n \to \infty \) 当 \(n \to \infty\)。因此微分算子 \(D: C^1[0, 1] \to C[0, 1]\) 是无界的。

    有界性与算子的重要性质密切相关,例如算子的可逆性、谱理论等。

    4.3 算子范数 (Operator Norm)

    对于 有界线性算子 (bounded linear operator),我们可以定义 算子范数 (operator norm),它衡量了算子的 “大小”。算子范数在泛函分析中起着核心作用。

    定义 4.3.1 (算子范数)

    设 \(X\) 和 \(Y\) 是 赋范线性空间 (normed linear space),\(T: X \to Y\) 是 有界线性算子 (bounded linear operator)算子范数 (operator norm) \( \|T\| \) 定义为:
    \[ \|T\| = \sup_{\|x\|_X = 1} \|T(x)\|_Y \]
    或者等价地,
    \[ \|T\| = \sup_{\|x\|_X \le 1} \|T(x)\|_Y \]
    或者
    \[ \|T\| = \inf \{M \ge 0 : \|T(x)\|_Y \le M \|x\|_X, \forall x \in X \} \]

    定理 4.3.2 (算子范数的等价定义)

    上述三种定义是等价的。并且对于任意 \(x \in X\),有
    \[ \|T(x)\|_Y \le \|T\| \|x\|_X \]
    且 \( \|T\| \) 是满足此不等式的最小常数。

    证明:

    令 \( \|T\|_1 = \sup_{\|x\|_X = 1} \|T(x)\|_Y \),\( \|T\|_2 = \sup_{\|x\|_X \le 1} \|T(x)\|_Y \),\( \|T\|_3 = \inf \{M \ge 0 : \|T(x)\|_Y \le M \|x\|_X, \forall x \in X \} \)。

    显然 \( \|T\|_1 \le \|T\|_2 \),因为集合 \( \{x : \|x\|_X = 1\} \subseteq \{x : \|x\|_X \le 1\} \)。
    反过来,如果 \(x \ne 0\) 且 \( \|x\|_X \le 1 \),令 \(y = \frac{x}{\|x\|_X}\),则 \( \|y\|_X = 1 \)。由于 \(T\) 是线性的,\(T(x) = T(\|x\|_X y) = \|x\|_X T(y)\)。
    \[ \|T(x)\|_Y = \|\|x\|_X T(y)\|_Y = \|x\|_X \|T(y)\|_Y \le \|x\|_X \sup_{\|z\|_X = 1} \|T(z)\|_Y = \|x\|_X \|T\|_1 \]
    如果 \(x = 0\),则 \( \|T(x)\|_Y = 0 \le \|x\|_X \|T\|_1 \)。因此,对于所有 \( \|x\|_X \le 1 \),\( \|T(x)\|_Y \le \|T\|_1 \)。所以 \( \|T\|_2 = \sup_{\|x\|_X \le 1} \|T(x)\|_Y \le \|T\|_1 \)。
    故 \( \|T\|_1 = \|T\|_2 \)。

    接下来证明 \( \|T\|_2 = \|T\|_3 \)。令 \(M\) 满足 \( \|T(x)\|_Y \le M \|x\|_X \) 对所有 \(x \in X\) 成立。当 \( \|x\|_X \le 1 \) 时,\( \|T(x)\|_Y \le M \|x\|_X \le M \)。因此 \( \sup_{\|x\|_X \le 1} \|T(x)\|_Y \le M \)。所以 \( \|T\|_2 \le M \)。由于 \(M\) 是任意满足条件的常数,所以 \( \|T\|_2 \le \inf \{M\} = \|T\|_3 \)。

    另一方面,令 \(M_0 = \|T\|_2 = \sup_{\|x\|_X \le 1} \|T(x)\|_Y \)。对于任意 \(x \ne 0\),令 \(u = \frac{x}{\|x\|_X}\),则 \( \|u\|_X = 1 \le 1 \)。
    \[ \|T(u)\|_Y \le \sup_{\|z\|_X \le 1} \|T(z)\|_Y = \|T\|_2 = M_0 \]
    \[ \|T(u)\|_Y = \|T(\frac{x}{\|x\|_X})\|_Y = \|\frac{1}{\|x\|_X} T(x)\|_Y = \frac{1}{\|x\|_X} \|T(x)\|_Y \]
    所以 \( \frac{1}{\|x\|_X} \|T(x)\|_Y \le M_0 \),即 \( \|T(x)\|_Y \le M_0 \|x\|_X = \|T\|_2 \|x\|_X \)。当 \(x = 0\) 时,不等式显然成立。因此 \(M_0 = \|T\|_2 \) 是满足 \( \|T(x)\|_Y \le M \|x\|_X \) 的一个常数,所以 \( \|T\|_3 = \inf \{M\} \le \|T\|_2 \)。

    故 \( \|T\|_2 = \|T\|_3 \)。综上,\( \|T\|_1 = \|T\|_2 = \|T\|_3 = \|T\| \)。且我们已经证明了 \( \|T(x)\|_Y \le \|T\| \|x\|_X \)。如果存在更小的常数 \(M' < \|T\| \) 使得 \( \|T(x)\|_Y \le M' \|x\|_X \) 成立,则 \( \|T\| = \sup_{\|x\|_X = 1} \|T(x)\|_Y \le M' \sup_{\|x\|_X = 1} \|x\|_X = M' \),矛盾。因此 \( \|T\| \) 是最小的常数。

    证毕

    算子范数的性质

    设 \(X, Y, Z\) 是 赋范线性空间 (normed linear space),\(T, S \in B(X, Y)\) (表示从 \(X\) 到 \(Y\) 的有界线性算子全体),\(R \in B(Y, Z)\),\( \alpha \) 是标量。

    ① \( \|T\| \ge 0 \),且 \( \|T\| = 0 \) 当且仅当 \(T = 0\) (零算子)。
    ② \( \|\alpha T\| = |\alpha| \|T\| \)。
    ③ \( \|T + S\| \le \|T\| + \|S\| \) (三角不等式)。
    ④ \( \|R \circ T\| \le \|R\| \|T\| \),其中 \(R \circ T: X \to Z\) 是复合算子,\( (R \circ T)(x) = R(T(x)) \)。

    这些性质表明,\(B(X, Y)\) 在定义的算子范数下构成一个 赋范线性空间 (normed linear space)

    例子 4.3.3 (算子范数的计算)

    零算子: \( \|0\| = 0 \)。
    恒等算子: \( \|I: X \to X\| = \sup_{\|x\|_X = 1} \|I(x)\|_X = \sup_{\|x\|_X = 1} \|x\|_X = 1 \) (假设 \(X \ne \{0\}\))。
    矩阵算子: 设 \(T_A: \mathbb{R}^n \to \mathbb{R}^m\) 由矩阵 \(A\) 表示,配备 欧几里得范数 (Euclidean norm) (或 \(l^2\) 范数)。则算子范数 \( \|T_A\| \) 等于矩阵 \(A\) 的 谱范数 (spectral norm),即 \(A^*A\) 的最大特征值的平方根,其中 \(A^*\) 是 \(A\) 的共轭转置 (在实数情况下是转置)。
    如果使用 最大列和范数 (maximum column sum norm) (对应于 \(l^1\) 向量范数) 或 最大行和范数 (maximum row sum norm) (对应于 \(l^\infty\) 向量范数),算子范数的计算公式也会有所不同。例如,如果 \(X = \mathbb{R}^n\) 配备 \(l^\infty\) 范数,\(Y = \mathbb{R}^m\) 配备 \(l^\infty\) 范数,则 \( \|T_A\| = \max_{1 \le i \le m} \sum_{j=1}^n |a_{ij}| \) (最大行和范数)。

    积分算子: 对于积分算子 \(J: C[a, b] \to C[a, b]\),\( (Jf)(x) = \int_a^x f(t) dt \),配备 上确界范数 (supremum norm),我们之前证明了 \( \|Jf\|_\infty \le (b-a) \|f\|_\infty \)。实际上,\( \|J\| = b-a \)。考虑函数 \(f(x) = 1\),\( \|f\|_\infty = 1 \),\( (Jf)(x) = \int_a^x 1 dt = x-a \)。\( \|Jf\|_\infty = \max_{x \in [a, b]} |x-a| = b-a \)。因此 \( \|J\| \ge \frac{\|Jf\|_\infty}{\|f\|_\infty} = b-a \)。结合之前的上界估计,得到 \( \|J\| = b-a \)。

    算子范数是刻画有界线性算子性质的重要工具,它使得我们可以在算子空间上引入拓扑和度量,从而进行更深入的分析。

    4.4 有界线性算子的空间 (Space of Bounded Linear Operators)

    所有从 赋范线性空间 (normed linear space) \(X\) 到 赋范线性空间 (normed linear space) \(Y\) 的 有界线性算子 (bounded linear operator) 的集合,记为 \(B(X, Y)\) 或 \(L(X, Y)\)。我们已经知道,在逐点加法和标量乘法运算下,\(B(X, Y)\) 是一个 线性空间 (linear space)。此外,我们还在 \(B(X, Y)\) 上定义了 算子范数 (operator norm),使其成为一个 赋范线性空间 (normed linear space)。更重要的是,如果 \(Y\) 是一个 Banach 空间 (Banach space),那么 \(B(X, Y)\) 也是一个 Banach 空间。

    定理 4.4.1 ( \(B(X, Y)\) 的线性空间结构)

    设 \(X, Y\) 是 赋范线性空间 (normed linear space)。定义算子的加法和标量乘法如下:
    对于 \(T, S \in B(X, Y)\) 和标量 \( \alpha \),
    ⚝ \( (T + S)(x) = T(x) + S(x) \)
    ⚝ \( (\alpha T)(x) = \alpha (T(x)) \)
    则 \(B(X, Y)\) 在这些运算下构成一个 线性空间 (linear space)

    证明:

    我们需要验证线性空间的公理。对于 \(T, S \in B(X, Y)\) 和标量 \( \alpha \),我们需要证明 \(T+S\) 和 \( \alpha T \) 仍然是有界线性算子。

    线性性:
    ▮▮▮▮⚝ \( (T+S)(x_1 + x_2) = T(x_1 + x_2) + S(x_1 + x_2) = T(x_1) + T(x_2) + S(x_1) + S(x_2) = (T(x_1) + S(x_1)) + (T(x_2) + S(x_2)) = (T+S)(x_1) + (T+S)(x_2) \)
    ▮▮▮▮⚝ \( (T+S)(\alpha x) = T(\alpha x) + S(\alpha x) = \alpha T(x) + \alpha S(x) = \alpha (T(x) + S(x)) = \alpha (T+S)(x) \)
    ▮▮▮▮⚝ \( (\alpha T)(x_1 + x_2) = \alpha T(x_1 + x_2) = \alpha (T(x_1) + T(x_2)) = \alpha T(x_1) + \alpha T(x_2) = (\alpha T)(x_1) + (\alpha T)(x_2) \)
    ▮▮▮▮⚝ \( (\alpha T)(\beta x) = \alpha T(\beta x) = \alpha (\beta T(x)) = (\alpha \beta) T(x) = \beta (\alpha T(x)) = \beta ((\alpha T)(x)) \)

    有界性: 由于 \(T, S\) 是有界的,存在常数 \(M_T, M_S \ge 0\) 使得 \( \|T(x)\|_Y \le M_T \|x\|_X \) 和 \( \|S(x)\|_Y \le M_S \|x\|_X \)。
    ▮▮▮▮⚝ \( \|(T+S)(x)\|_Y = \|T(x) + S(x)\|_Y \le \|T(x)\|_Y + \|S(x)\|_Y \le M_T \|x\|_X + M_S \|x\|_X = (M_T + M_S) \|x\|_X \)。所以 \(T+S\) 是有界的。
    ▮▮▮▮⚝ \( \|(\alpha T)(x)\|_Y = \|\alpha T(x)\|_Y = |\alpha| \|T(x)\|_Y \le |\alpha| M_T \|x\|_X \)。所以 \( \alpha T \) 是有界的。

    其他线性空间公理的验证是直接的。因此 \(B(X, Y)\) 是一个线性空间。

    证毕

    定理 4.4.2 ( \(B(X, Y)\) 的赋范线性空间结构)

    \(B(X, Y)\) 在 算子范数 (operator norm) \( \| \cdot \| \) 下是一个 赋范线性空间 (normed linear space)

    证明:

    我们需要验证范数的三个公理:

    非负性: 对于 \(T \in B(X, Y)\),\( \|T\| = \sup_{\|x\|_X = 1} \|T(x)\|_Y \ge 0 \),且 \( \|T\| = 0 \) 当且仅当 \( \sup_{\|x\|_X = 1} \|T(x)\|_Y = 0 \),即对于所有 \( \|x\|_X = 1 \),\( \|T(x)\|_Y = 0 \),这意味着对于所有 \( \|x\|_X = 1 \),\(T(x) = 0_Y\)。对于任意 \(x \ne 0\),\(T(x) = T(\|x\|_X \frac{x}{\|x\|_X}) = \|x\|_X T(\frac{x}{\|x\|_X}) = \|x\|_X \cdot 0_Y = 0_Y\)。且 \(T(0_X) = 0_Y\)。所以 \(T = 0\) (零算子)。反之,如果 \(T = 0\),则 \( \|T(x)\|_Y = \|0(x)\|_Y = \|0_Y\|_Y = 0 \),所以 \( \|T\| = \sup_{\|x\|_X = 1} 0 = 0 \)。

    齐次性: \( \|\alpha T\| = \sup_{\|x\|_X = 1} \|(\alpha T)(x)\|_Y = \sup_{\|x\|_X = 1} \|\alpha T(x)\|_Y = \sup_{\|x\|_X = 1} |\alpha| \|T(x)\|_Y = |\alpha| \sup_{\|x\|_X = 1} \|T(x)\|_Y = |\alpha| \|T\| \)。

    三角不等式: \( \|T + S\| = \sup_{\|x\|_X = 1} \|(T + S)(x)\|_Y = \sup_{\|x\|_X = 1} \|T(x) + S(x)\|_Y \le \sup_{\|x\|_X = 1} (\|T(x)\|_Y + \|S(x)\|_Y) \le \sup_{\|x\|_X = 1} \|T(x)\|_Y + \sup_{\|x\|_X = 1} \|S(x)\|_Y = \|T\| + \|S\| \)。

    因此,\(B(X, Y)\) 是一个赋范线性空间。

    证毕

    定理 4.4.3 ( \(B(X, Y)\) 的完备性)

    如果 \(Y\) 是一个 Banach 空间 (Banach space),则对于任何 赋范线性空间 (normed linear space) \(X\),\(B(X, Y)\) 也是一个 Banach 空间 (Banach space)

    证明:

    我们需要证明 \(B(X, Y)\) 中的任何 柯西序列 (Cauchy sequence) 都是 收敛 (convergent) 的。设 \( \{T_n\}_{n=1}^\infty \) 是 \(B(X, Y)\) 中的一个柯西序列。这意味着对于任意 \( \epsilon > 0 \),存在 \(N\) 使得当 \(n, m > N\) 时,\( \|T_n - T_m\| < \epsilon \)。

    对于任意 \(x \in X\),\( \|T_n(x) - T_m(x)\|_Y = \|(T_n - T_m)(x)\|_Y \le \|T_n - T_m\| \|x\|_X < \epsilon \|x\|_X \) 当 \(n, m > N\)。因此,对于每个固定的 \(x \in X\),\( \{T_n(x)\}_{n=1}^\infty \) 是 \(Y\) 中的一个柯西序列。由于 \(Y\) 是 Banach 空间,\(Y\) 是完备的,所以 \( \{T_n(x)\}_{n=1}^\infty \) 在 \(Y\) 中收敛。设 \(T(x) = \lim_{n \to \infty} T_n(x)\)。这样定义了一个算子 \(T: X \to Y\)。

    我们需要证明:
    ① \(T\) 是线性算子。
    ② \(T\) 是有界线性算子 (即 \(T \in B(X, Y)\))。
    ③ \( \{T_n\} \) 在 \(B(X, Y)\) 中收敛到 \(T\),即 \( \lim_{n \to \infty} \|T_n - T\| = 0 \)。

    线性性:
    ▮▮▮▮⚝ \(T(x_1 + x_2) = \lim_{n \to \infty} T_n(x_1 + x_2) = \lim_{n \to \infty} (T_n(x_1) + T_n(x_2)) = \lim_{n \to \infty} T_n(x_1) + \lim_{n \to \infty} T_n(x_2) = T(x_1) + T(x_2)\)。
    ▮▮▮▮⚝ \(T(\alpha x) = \lim_{n \to \infty} T_n(\alpha x) = \lim_{n \to \infty} \alpha T_n(x) = \alpha \lim_{n \to \infty} T_n(x) = \alpha T(x)\)。
    所以 \(T\) 是线性算子。

    有界性: 由于 \( \{T_n\} \) 是柯西序列,所以它是 有界序列 (bounded sequence),即存在 \(M \ge 0\) 使得 \( \|T_n\| \le M \) 对所有 \(n\) 成立。因此 \( \|T_n(x)\|_Y \le \|T_n\| \|x\|_X \le M \|x\|_X \)。取极限 \(n \to \infty\),得到 \( \|T(x)\|_Y = \|\lim_{n \to \infty} T_n(x)\|_Y = \lim_{n \to \infty} \|T_n(x)\|_Y \le M \|x\|_X \)。所以 \(T\) 是有界的,\(T \in B(X, Y)\)。

    收敛性: 对于 \( \epsilon > 0 \),存在 \(N\) 使得当 \(n, m > N\) 时,\( \|T_n - T_m\| < \epsilon \)。对于任意 \(x \in X\) 且 \( \|x\|_X \le 1 \),\( \|T_n(x) - T_m(x)\|_Y = \|(T_n - T_m)(x)\|_Y \le \|T_n - T_m\| \|x\|_X < \epsilon \|x\|_X \le \epsilon \)。固定 \(n > N\),令 \(m \to \infty\),则 \(T_m(x) \to T(x)\)。由于范数是连续的,
    \[ \|T_n(x) - T(x)\|_Y = \|T_n(x) - \lim_{m \to \infty} T_m(x)\|_Y = \lim_{m \to \infty} \|T_n(x) - T_m(x)\|_Y \le \epsilon \]
    这对于所有 \( \|x\|_X \le 1 \) 和 \(n > N\) 成立。因此,对于 \(n > N\),
    \[ \|T_n - T\| = \sup_{\|x\|_X \le 1} \|(T_n - T)(x)\|_Y = \sup_{\|x\|_X \le 1} \|T_n(x) - T(x)\|_Y \le \epsilon \]
    所以 \( \lim_{n \to \infty} \|T_n - T\| = 0 \),即 \( \{T_n\} \) 在 \(B(X, Y)\) 中收敛到 \(T\)。

    因此,\(B(X, Y)\) 是完备的,即 \(B(X, Y)\) 是 Banach 空间。

    证毕

    这个定理非常重要,它说明了有界线性算子空间的完备性,为泛函分析中许多重要定理的建立提供了基础。例如,当 \(Y = X\) 时,\(B(X, X)\) 记为 \(B(X)\),它不仅是 Banach 空间,还是一个 Banach 代数 (Banach algebra) (因为可以定义算子的乘法,即复合运算,且满足 \( \|S \circ T\| \le \|S\| \|T\| \))。Banach 代数是泛函分析中重要的研究对象,谱理论就是研究 Banach 代数上的元素的性质。

    5. chapter 5: Hahn-Banach 定理及其应用 (Hahn-Banach Theorem and its Applications)

    5.1 Hahn-Banach 延拓定理 (Hahn-Banach Extension Theorem)

    Hahn-Banach 延拓定理 (Hahn-Banach Extension Theorem) 是泛函分析中最 фундаментальных 定理之一。它描述了如何将定义在向量子空间上的有界线性泛函延拓到整个向量空间,并保持其范数不变或受控增长。这个定理在泛函分析的许多分支中都有着广泛的应用,例如对偶空间 (dual space) 的研究、凸分析 (convex analysis)、最优化理论 (optimization theory) 等。

    5.1.1 次线性泛函 (Sublinear Functional)

    为了理解 Hahn-Banach 延拓定理,我们首先需要引入次线性泛函 (sublinear functional) 的概念。

    定义 5.1.1 (次线性泛函):设 \(X\) 是实线性空间。称泛函 \(p: X \rightarrow \mathbb{R}\) 为次线性泛函,如果它满足以下两个条件:

    次可加性 (Subadditivity):对于任意 \(x, y \in X\),有
    \[ p(x + y) \leq p(x) + p(y). \]

    正齐次性 (Positive Homogeneity):对于任意 \(x \in X\) 和 \(\lambda \geq 0\),有
    \[ p(\lambda x) = \lambda p(x). \]

    例子 5.1.1

    ⚝ 设 \(X\) 是赋范线性空间 (normed linear space),范数为 \(\|\cdot\|\)。则范数 \(p(x) = \|x\|\) 是 \(X\) 上的次线性泛函。
    ① 次可加性:由范数的三角不等式 (triangle inequality) 可知,\(\|x + y\| \leq \|x\| + \|y\|\)。
    ② 正齐次性:对于 \(\lambda \geq 0\),有 \(\|\lambda x\| = |\lambda| \|x\| = \lambda \|x\|\)。

    ⚝ 设 \(f\) 是线性空间 \(X\) 上的线性泛函。则 \(p(x) = |f(x)|\) 是 \(X\) 上的次线性泛函。
    ① 次可加性:由三角不等式可知,\(|f(x + y)| = |f(x) + f(y)| \leq |f(x)| + |f(y)|\)。
    ② 正齐次性:对于 \(\lambda \geq 0\),有 \(|f(\lambda x)| = |\lambda f(x)| = |\lambda| |f(x)| = \lambda |f(x)|\)。

    ⚝ 设 \(g\) 是线性空间 \(X\) 上的线性泛函。则 \(p(x) = g(x)\) 不是次线性泛函,除非 \(g(x) \geq 0\) 对所有 \(x \in X\) 成立(这通常是不成立的)。但如果限制在 \(g(x)\) 的值域为实数的情况下,我们可以考虑 \(p(x) = \max\{g(x), 0\}\) 或 \(p(x) = \max\{g(x), -g(x)\} = |g(x)|\),其中 \(|g(x)|\) 是次线性泛函。

    5.1.2 Hahn-Banach 延拓定理 (实线性空间) (Hahn-Banach Extension Theorem for Real Linear Spaces)

    定理 5.1.2 (Hahn-Banach 延拓定理,实线性空间):设 \(X\) 是实线性空间,\(p: X \rightarrow \mathbb{R}\) 是 \(X\) 上的次线性泛函。设 \(M\) 是 \(X\) 的线性子空间,\(f: M \rightarrow \mathbb{R}\) 是 \(M\) 上的线性泛函,且满足对于所有 \(x \in M\),有
    \[ f(x) \leq p(x). \]
    则存在线性泛函 \(F: X \rightarrow \mathbb{R}\),使得

    延拓性 (Extension):对于所有 \(x \in M\),有 \(F(x) = f(x)\)。
    控制性 (Domination):对于所有 \(x \in X\),有 \(F(x) \leq p(x)\)。

    证明思路

    证明 Hahn-Banach 延拓定理的关键思想是使用 Zorn 引理 (Zorn's Lemma)。我们需要构造一个包含 \(f\) 的线性泛函的集合,并在该集合上定义一个偏序关系。然后,利用 Zorn 引理找到一个极大元,证明这个极大元就是我们所需要的延拓 \(F\)。

    证明步骤

    1. 构造集合 \( \mathcal{F} \):考虑所有线性泛函 \(g: D(g) \rightarrow \mathbb{R}\),其中 \(M \subseteq D(g) \subseteq X\),\(D(g)\) 是线性子空间,且满足:
      ▮▮▮▮ⓐ \(g\) 是 \(f\) 的延拓,即 \(g(x) = f(x)\) 对所有 \(x \in M\) 成立。
      ▮▮▮▮ⓑ \(g(x) \leq p(x)\) 对所有 \(x \in D(g)\) 成立。

      集合 \( \mathcal{F} \) 非空,因为 \(f \in \mathcal{F}\)(定义域为 \(M\))。

    2. 定义偏序关系:在 \( \mathcal{F} \) 上定义偏序关系 " \( \preceq \) " 如下:对于 \(g_1, g_2 \in \mathcal{F}\),称 \(g_1 \preceq g_2\) 如果 \(D(g_1) \subseteq D(g_2)\) 且 \(g_2|_{D(g_1)} = g_1\)。 这意味着 \(g_2\) 是 \(g_1\) 的延拓。

    3. 应用 Zorn 引理:考虑 \( \mathcal{F} \) 的任意全序子集 \( \mathcal{C} = \{g_\alpha\}_{\alpha \in A} \)。令 \(D = \bigcup_{\alpha \in A} D(g_\alpha)\)。显然,\(D\) 是 \(X\) 的线性子空间,且 \(M \subseteq D \subseteq X\)。定义泛函 \(G: D \rightarrow \mathbb{R}\) 如下:对于任意 \(x \in D\),存在某个 \(g_\alpha \in \mathcal{C}\) 使得 \(x \in D(g_\alpha)\)。定义 \(G(x) = g_\alpha(x)\)。由于 \( \mathcal{C} \) 是全序集,如果 \(x \in D(g_\alpha) \cap D(g_\beta)\),不妨设 \(g_\alpha \preceq g_\beta\),则 \(g_\beta|_{D(g_\alpha)} = g_\alpha\),所以 \(g_\alpha(x) = g_\beta(x)\)。因此,\(G\) 的定义是良定的。

      容易验证 \(G\) 是线性泛函,且 \(G\) 是所有 \(g_\alpha \in \mathcal{C}\) 的延拓,并且 \(G(x) \leq p(x)\) 对所有 \(x \in D\) 成立。因此,\(G \in \mathcal{F}\) 是 \( \mathcal{C} \) 的上界。

      根据 Zorn 引理,\( \mathcal{F} \) 中存在极大元,设为 \(F\)。

    4. 证明极大元 \(F\) 的定义域为 \(X\):假设 \(D(F) \neq X\)。则存在 \(x_0 \in X \setminus D(F)\)。考虑子空间 \(D' = D(F) + \text{span}\{x_0\} = \{x + \lambda x_0 : x \in D(F), \lambda \in \mathbb{R}\}\)。我们需要找到 \(F\) 在 \(D'\) 上的延拓 \(F'\),使得 \(F' \in \mathcal{F}\),这将与 \(F\) 的极大性矛盾。

      对于任意 \(y, z \in D(F)\),有
      \[ F(y) + F(z) = F(y + z) \leq p(y + z) = p((y - x_0) + (x_0 + z)) \leq p(y - x_0) + p(x_0 + z). \]
      因此,
      \[ F(z) - p(x_0 + z) \leq p(y - x_0) - F(y). \]

      \[ a = \sup_{z \in D(F)} \{F(z) - p(x_0 + z)\}, \quad b = \inf_{y \in D(F)} \{p(y - x_0) - F(y)\}. \]
      则 \(a \leq b\)。选取任意 \(c \in [a, b]\)。定义 \(F': D' \rightarrow \mathbb{R}\) 如下:对于 \(x' = x + \lambda x_0 \in D'\),其中 \(x \in D(F), \lambda \in \mathbb{R}\),定义
      \[ F'(x') = F'(x + \lambda x_0) = F(x) + \lambda c. \]
      容易验证 \(F'\) 是线性泛函,且 \(F'|_{D(F)} = F\)。我们需要验证 \(F'(x') \leq p(x')\) 对所有 \(x' \in D'\) 成立。

      只需验证 \(F'(x + x_0) \leq p(x + x_0)\) 和 \(F'(x - x_0) \leq p(x - x_0)\) 以及 \(F'(x + \lambda x_0) \leq p(x + \lambda x_0)\) 对于任意 \(\lambda \in \mathbb{R}\) 成立。

      当 \(\lambda = 1\) 时,对于任意 \(z \in D(F)\),有 \(F(z) - p(x_0 + z) \leq a \leq c\),即 \(F(z) - c \leq p(x_0 + z)\)。令 \(z = x\),则 \(F(x) - c \leq p(x_0 + x)\),即 \(F(x) + c \leq p(x + x_0)\),也就是 \(F'(x + x_0) \leq p(x + x_0)\)。

      当 \(\lambda = -1\) 时,对于任意 \(y \in D(F)\),有 \(c \leq b \leq p(y - x_0) - F(y)\),即 \(c + F(y) \leq p(y - x_0)\)。令 \(y = x\),则 \(c + F(x) \leq p(x - x_0)\),也就是 \(F(x) + (-1)(-c) \leq p(x - x_0)\),即 \(F'(x - x_0) \leq p(x - x_0)\)。

      对于 \(\lambda > 0\),
      \[ F'(x + \lambda x_0) = F(x) + \lambda c = \lambda \left( F\left(\frac{x}{\lambda}\right) + c \right) \leq \lambda p\left(\frac{x}{\lambda} + x_0\right) = p(x + \lambda x_0). \]
      对于 \(\lambda < 0\),令 \(\mu = -\lambda > 0\),
      \[ F'(x + \lambda x_0) = F'(x - \mu x_0) = F(x) - \mu c = \mu \left( F\left(\frac{x}{-\mu}\right) + c \right) \leq \mu p\left(\frac{x}{-\mu} + x_0\right) = p(x - \mu x_0) = p(x + \lambda x_0). \]
      对于 \(\lambda = 0\),\(F'(x) = F(x) \leq p(x)\)。

      因此,\(F'(x') \leq p(x')\) 对所有 \(x' \in D'\) 成立。所以 \(F' \in \mathcal{F}\) 是 \(F\) 的真延拓,这与 \(F\) 是极大元矛盾。因此,必须有 \(D(F) = X\)。

      综上所述,存在线性泛函 \(F: X \rightarrow \mathbb{R}\) 满足延拓性和控制性。

    5.1.3 Hahn-Banach 延拓定理 (复线性空间) (Hahn-Banach Extension Theorem for Complex Linear Spaces)

    对于复线性空间,Hahn-Banach 延拓定理也有相应的形式。我们需要将复线性泛函分解为实部和虚部来处理。

    定理 5.1.3 (Hahn-Banach 延拓定理,复线性空间):设 \(X\) 是复线性空间,\(p: X \rightarrow \mathbb{R}\) 是 \(X\) 上的实值次线性泛函。设 \(M\) 是 \(X\) 的线性子空间(复子空间),\(f: M \rightarrow \mathbb{C}\) 是 \(M\) 上的复线性泛函,且满足对于所有 \(x \in M\),有
    \[ |f(x)| \leq p(x). \]
    则存在复线性泛函 \(F: X \rightarrow \mathbb{C}\),使得

    延拓性 (Extension):对于所有 \(x \in M\),有 \(F(x) = f(x)\)。
    控制性 (Domination):对于所有 \(x \in X\),有 \(|F(x)| \leq p(x)\)。

    证明思路

    将复线性泛函分解为实部和虚部,利用实线性空间的 Hahn-Banach 延拓定理进行延拓,然后再组合成复线性泛函。

    证明步骤

    1. 分解实部和虚部:设 \(f(x) = \text{Re} f(x) + i \text{Im} f(x)\)。由于 \(f\) 是复线性的,所以 \(\text{Re} f\) 和 \(\text{Im} f\) 都是实线性的。并且,对于 \(x \in M\) 和实数 \(\lambda\),有 \(\text{Re} f(ix) = \text{Re} (i f(x)) = \text{Re} (i (\text{Re} f(x) + i \text{Im} f(x))) = -\text{Im} f(x)\)。因此,\(\text{Im} f(x) = -\text{Re} f(ix)\)。所以,\(f(x) = \text{Re} f(x) - i \text{Re} f(ix)\)。

    2. 应用实 Hahn-Banach 延拓定理:考虑实线性空间 \(X_r\)(将复线性空间 \(X\) 视为实线性空间)。\(\text{Re} f: M \rightarrow \mathbb{R}\) 是实线性泛函,且 \(|\text{Re} f(x)| \leq |f(x)| \leq p(x)\),所以 \(\text{Re} f(x) \leq p(x)\) 对所有 \(x \in M\) 成立。根据实 Hahn-Banach 延拓定理,存在实线性泛函 \(G: X \rightarrow \mathbb{R}\),使得 \(G(x) = \text{Re} f(x)\) 对所有 \(x \in M\) 成立,且 \(G(x) \leq p(x)\) 对所有 \(x \in X\) 成立。

    3. 构造复线性延拓 \(F\):定义 \(F: X \rightarrow \mathbb{C}\) 为 \(F(x) = G(x) - i G(ix)\)。

    ▮▮▮▮ⓐ 验证 \(F\) 是复线性的
    对于实数 \(\lambda\),\(F(\lambda x) = G(\lambda x) - i G(i \lambda x) = \lambda G(x) - i \lambda G(ix) = \lambda F(x)\)。
    对于虚数 \(i\),\(F(ix) = G(ix) - i G(i(ix)) = G(ix) - i G(-x) = G(ix) + i G(x) = i (G(x) - i G(ix)) = i F(x)\)。
    对于 \(x, y \in X\),\(F(x + y) = G(x + y) - i G(i(x + y)) = (G(x) + G(y)) - i (G(ix) + G(iy)) = (G(x) - i G(ix)) + (G(y) - i G(iy)) = F(x) + F(y)\)。
    因此,\(F\) 是复线性的。

    ▮▮▮▮ⓑ 验证 \(F\) 是 \(f\) 的延拓:对于 \(x \in M\),\(F(x) = G(x) - i G(ix) = \text{Re} f(x) - i \text{Re} f(ix) = \text{Re} f(x) - i (-\text{Im} f(x)) = \text{Re} f(x) + i \text{Im} f(x) = f(x)\)。

    ▮▮▮▮ⓒ 验证 \(|F(x)| \leq p(x)\):对于任意 \(x \in X\),设 \(F(x) = r e^{i \theta}\),其中 \(r = |F(x)|\) 且 \(\theta \in \mathbb{R}\)。则 \(|F(x)| = r = e^{-i \theta} F(x) = F(e^{-i \theta} x) = G(e^{-i \theta} x) - i G(i e^{-i \theta} x) = G(e^{-i \theta} x)\) (因为 \(|F(x)|\) 是实数,所以虚部为 0)。由于 \(G(y) \leq p(y)\) 对所有 \(y \in X\) 成立,所以 \(|F(x)| = G(e^{-i \theta} x) \leq p(e^{-i \theta} x) = |e^{-i \theta}| p(x) = p(x)\) (因为 \(p\) 是正齐次的,且 \(|e^{-i \theta}| = 1\))。

    1.双击鼠标左键复制此行;2.单击复制所有代码。
                                    
                                        
    1 综上所述,存在复线性泛函 \(F: X \rightarrow \mathbb{C}\) 满足延拓性和控制性。

    5.1.4 几何解释 (Geometric Interpretation)

    Hahn-Banach 延拓定理可以从几何角度理解。在实线性空间中,次线性泛函 \(p(x)\) 可以看作是原点上方的一个凸锥 (convex cone) 的边界。条件 \(f(x) \leq p(x)\) 表示线性泛函 \(f\) 的图像位于这个凸锥的下方。Hahn-Banach 延拓定理保证我们可以将 \(f\) 延拓到整个空间,使得延拓后的泛函 \(F\) 的图像仍然位于这个凸锥的下方。

    在赋范线性空间中,如果 \(p(x) = \|x\|\),则条件 \(|f(x)| \leq p(x)\) 等价于 \(|f(x)| \leq \|x\|\),即 \(\|f\| \leq 1\)。Hahn-Banach 延拓定理表明,我们可以将定义在子空间上的有界线性泛函延拓到整个空间,并保持其范数不变。

    5.1.5 应用举例 (Examples and Applications)

    例子 5.1.2 (延拓到整个空间并保持范数):设 \(M\) 是赋范线性空间 \(X\) 的子空间,\(f \in M^*\)(\(M\) 上的有界线性泛函)。我们需要证明存在 \(F \in X^*\)(\(X\) 上的有界线性泛函),使得 \(F|_M = f\) 且 \(\|F\| = \|f\|\)。

    证明:定义 \(p(x) = \|f\| \|x\|\)。则 \(p\) 是 \(X\) 上的次线性泛函。对于 \(x \in M\),有 \(|f(x)| \leq \|f\| \|x\| = p(x)\)。根据 Hahn-Banach 延拓定理(复线性空间形式),存在 \(F: X \rightarrow \mathbb{C}\) 使得 \(F|_M = f\) 且 \(|F(x)| \leq p(x) = \|f\| \|x\|\) 对所有 \(x \in X\) 成立。这意味着 \(F \in X^*\) 且 \(\|F\| \leq \|f\|\)。另一方面,由于 \(F\) 是 \(f\) 的延拓,所以 \(\|F\| \geq \|f\|\)。因此,\(\|F\| = \|f\|\)。

    例子 5.1.3 (存在非零线性泛函):设 \(X\) 是赋范线性空间,\(x_0 \in X\) 且 \(x_0 \neq 0\)。我们需要证明存在 \(f \in X^*\),使得 \(f(x_0) = \|x_0\|\) 且 \(\|f\| = 1\)。

    证明:考虑 \(M = \text{span}\{x_0\} = \{\lambda x_0 : \lambda \in \mathbb{C}\}\)。定义 \(f_0: M \rightarrow \mathbb{C}\) 为 \(f_0(\lambda x_0) = \lambda \|x_0\|\)。则 \(f_0\) 是 \(M\) 上的线性泛函。对于 \(x = \lambda x_0 \in M\),有 \(|f_0(x)| = |\lambda| \|x_0\| = \|\lambda x_0\| = \|x\|\)。因此,\(f_0\) 在 \(M\) 上有界,且 \(\|f_0\| = 1\)。根据 Hahn-Banach 延拓定理,存在 \(f \in X^*\),使得 \(f|_M = f_0\) 且 \(\|f\| = \|f_0\| = 1\)。特别地,\(f(x_0) = f_0(x_0) = \|x_0\|\)。

    例子 5.1.4 (点分离性):设 \(X\) 是赋范线性空间,\(x \neq y\) 是 \(X\) 中两个不同的点。我们需要证明存在 \(f \in X^*\),使得 \(f(x) \neq f(y)\)。

    证明:考虑向量 \(x - y \neq 0\)。根据例子 5.1.3,存在 \(f \in X^*\),使得 \(f(x - y) = \|x - y\| \neq 0\)。因此,\(f(x) - f(y) = f(x - y) \neq 0\),即 \(f(x) \neq f(y)\)。这表明 \(X^*\) 可以分离 \(X\) 中的点。

    5.2 Hahn-Banach 分离定理 (Hahn-Banach Separation Theorem)

    Hahn-Banach 分离定理 (Hahn-Banach Separation Theorem) 是 Hahn-Banach 延拓定理的另一个重要推论,它描述了如何用超平面 (hyperplane) 分离凸集 (convex set)。分离定理在凸分析、优化理论、对偶理论等领域有着重要的应用。

    5.2.1 超平面 (Hyperplane)

    定义 5.2.1 (超平面):设 \(X\) 是实线性空间。称集合 \(H \subseteq X\) 为超平面,如果存在非零线性泛函 \(f: X \rightarrow \mathbb{R}\) 和常数 \(c \in \mathbb{R}\),使得
    \[ H = \{x \in X : f(x) = c\}. \]
    超平面 \(H\) 将空间 \(X\) 分成两个半空间 (half-space):
    \[ H_+ = \{x \in X : f(x) \geq c\}, \quad H_- = \{x \in X : f(x) \leq c\}. \]
    \(H_+\) 和 \(H_-\) 都是凸集。

    5.2.2 Hahn-Banach 分离定理 (几何形式) (Hahn-Banach Separation Theorem, Geometric Form)

    定理 5.2.2 (Hahn-Banach 分离定理,几何形式):设 \(X\) 是局部凸拓扑线性空间 (locally convex topological linear space)。设 \(A, B \subseteq X\) 是非空凸集,且 \(A \cap B = \emptyset\)。

    ① 如果 \(A\) 是开集,则存在闭超平面 \(H\) 严格分离 (strictly separate) \(A\) 和 \(B\),即存在 \(f \in X^* \setminus \{0\}\) 和 \(c \in \mathbb{R}\),使得
    \[ f(x) > c, \quad \forall x \in A, \quad f(y) < c, \quad \forall y \in B. \]
    ② 如果 \(A\) 是紧集,\(B\) 是闭集,则存在闭超平面 \(H\) 严格分离 (strictly separate) \(A\) 和 \(B\),即存在 \(f \in X^* \setminus \{0\}\) 和 \(c \in \mathbb{R}\),使得
    \[ f(x) > c, \quad \forall x \in A, \quad f(y) < c, \quad \forall y \in B. \]
    ③ 如果 \(A\) 和 \(B\) 都是闭凸集,且至少有一个是局部紧的 (locally compact),则存在闭超平面 \(H\) 分离 (separate) \(A\) 和 \(B\),即存在 \(f \in X^* \setminus \{0\}\) 和 \(c \in \mathbb{R}\),使得
    \[ f(x) \geq c, \quad \forall x \in A, \quad f(y) \leq c, \quad \forall y \in B. \]

    证明思路 (针对情况 ①)

    利用 Minkowski 泛函 (Minkowski functional) 和 Hahn-Banach 延拓定理。

    证明步骤 (针对情况 ①)

    1. 平移和缩放:不妨假设 \(0 \in A\)。由于 \(A\) 是开凸集且 \(A \cap B = \emptyset\),所以 \(0 \notin B\)。

    2. Minkowski 泛函:定义 \(A\) 的 Minkowski 泛函 \(p_A(x) = \inf\{\lambda > 0 : x \in \lambda A\}\)。由于 \(A\) 是包含原点的开凸集,所以 \(p_A\) 是次线性泛函,且 \(A = \{x \in X : p_A(x) < 1\}\)。

    3. 选取点和子空间:选取 \(y_0 \in B\)。由于 \(A \cap B = \emptyset\),所以 \(y_0 \notin A\),即 \(p_A(y_0) \geq 1\)。考虑子空间 \(M = \text{span}\{y_0\} = \{\lambda y_0 : \lambda \in \mathbb{R}\}\)。定义线性泛函 \(f_0: M \rightarrow \mathbb{R}\) 为 \(f_0(\lambda y_0) = \lambda p_A(y_0)\)。对于 \(x = \lambda y_0 \in M\),如果 \(\lambda \geq 0\),则 \(f_0(x) = \lambda p_A(y_0) = p_A(\lambda y_0) = p_A(x)\)。如果 \(\lambda < 0\),则 \(f_0(x) = \lambda p_A(y_0) \leq 0 \leq p_A(x)\)(因为 \(p_A(x) \geq 0\))。因此,对于所有 \(x \in M\),有 \(f_0(x) \leq p_A(x)\)。

    4. 应用 Hahn-Banach 延拓定理:根据 Hahn-Banach 延拓定理,存在线性泛函 \(f: X \rightarrow \mathbb{R}\),使得 \(f|_M = f_0\) 且 \(f(x) \leq p_A(x)\) 对所有 \(x \in X\) 成立。

    5. 分离超平面的构造:由于 \(A = \{x \in X : p_A(x) < 1\}\) 且 \(f(x) \leq p_A(x)\),所以对于 \(x \in A\),有 \(f(x) \leq p_A(x) < 1\),即 \(f(x) < 1\)。对于 \(y_0 \in B\),\(f(y_0) = f_0(y_0) = p_A(y_0) \geq 1\)。因此,对于 \(y \in B\),我们希望证明 \(f(y) \geq 1\) 或 \(f(y) > c\) for some \(c < 1\)。

      实际上,对于 \(x \in A\),\(f(x) < 1\)。对于 \(y_0 \in B\),\(f(y_0) = p_A(y_0) \geq 1\)。我们可以选取 \(c = 1\)。则 \(f(x) < 1\) 对所有 \(x \in A\) 成立。我们需要证明存在 \(c\) 使得 \(f(x) > c\) 对所有 \(x \in A\) 成立,以及 \(f(y) < c\) 对所有 \(y \in B\) 成立。

      由于 \(A\) 是开集,对于 \(x \in A\),存在邻域 \(U_x \subseteq A\)。由于 \(f\) 是连续的(因为 \(f(x) \leq p_A(x)\) 且 \(p_A\) 在 \(A\) 上有界),所以 \(f\) 是有界线性泛函,即 \(f \in X^*\)。

      对于 \(x \in A\),\(f(x) < 1\)。由于 \(A\) 是开集,我们可以找到 \(c < 1\) 使得 \(f(x) > c\) 对所有 \(x \in A\) 成立吗? 这需要更精细的分析。

      修正证明思路:考虑集合 \(A - B = \{x - y : x \in A, y \in B\}\)。如果 \(A\) 是开集,则 \(A - B\) 是开集。由于 \(A \cap B = \emptyset\),所以 \(0 \notin A - B\)。由于 \(A\) 和 \(B\) 是凸集,所以 \(A - B\) 是凸集。

      情况 ① 的证明 (修正):设 \(A\) 是开凸集,\(B\) 是非空凸集,\(A \cap B = \emptyset\)。则 \(A - B\) 是开凸集,且 \(0 \notin A - B\)。根据 Hahn-Banach 延拓定理的推论(存在支撑超平面),存在非零线性泛函 \(f \in X^*\) 和 \(c \in \mathbb{R}\),使得 \(\text{Re} f(z) \geq c\) 对所有 \(z \in \overline{A - B}\) 成立,且 \(\inf_{z \in A - B} \text{Re} f(z) = c\)。由于 \(0 \notin \overline{A - B}\)(因为 \(A - B\) 是开集且 \(0 \notin A - B\),所以 \(0\) 不在 \(A - B\) 的闭包中? 实际上,如果 \(0 \in \overline{A-B}\),则对于任意 \(A-B\) 的邻域 \(U\),\(0 \in U\)。由于 \(A-B\) 是开集,如果 \(0 \in \overline{A-B}\),则 \(0\) 必须在 \(A-B\) 中,矛盾。所以 \(0 \notin \overline{A-B}\)。),所以 \(c < 0\)。因此,\(\text{Re} f(z) \geq c > 0\) 对所有 \(z \in \overline{A - B}\) 成立。

      对于 \(x \in A\) 和 \(y \in B\),\(x - y \in A - B\)。所以 \(\text{Re} f(x - y) \geq c\),即 \(\text{Re} f(x) - \text{Re} f(y) \geq c\),或者 \(\text{Re} f(x) \geq \text{Re} f(y) + c\)。令 \(c' = \sup_{y \in B} \text{Re} f(y)\)。则 \(\text{Re} f(x) \geq c' + c > c'\) 对所有 \(x \in A\) 成立。且 \(\text{Re} f(y) \leq c'\) 对所有 \(y \in B\) 成立。选取 \(c'' = c'\)。则 \(\text{Re} f(x) > c''\) 对所有 \(x \in A\) 成立,且 \(\text{Re} f(y) \leq c''\) 对所有 \(y \in B\) 成立。如果 \(B\) 也是开集,则可以得到 \(\text{Re} f(y) < c''\) 对所有 \(y \in B\) 成立。

      对于实线性空间,我们可以直接得到 \(f(x) > c\) 和 \(f(y) < c\)。对于复线性空间,我们需要考虑实部。

      最终结论 (情况 ①):存在实线性泛函 \(f\) 和常数 \(c\) 使得 \(f(x) > c\) 对所有 \(x \in A\) 成立,且 \(f(y) < c\) 对所有 \(y \in B\) 成立。超平面 \(H = \{x : f(x) = c\}\) 严格分离 \(A\) 和 \(B\)。

    5.2.3 Hahn-Banach 分离定理的应用 (Applications of Hahn-Banach Separation Theorem)

    应用 5.2.1 (闭凸包):设 \(C \subseteq X\) 是任意集合,\(\overline{\text{conv}}(C)\) 表示 \(C\) 的闭凸包 (closed convex hull)。则
    \[ \overline{\text{conv}}(C) = \bigcap \{H_+ : H_+ \text{ 是包含 } C \text{ 的闭半空间}\}. \]
    即闭凸包是所有包含它的闭半空间的交集。

    应用 5.2.2 (极点定理):Krein-Milman 定理 (Krein-Milman Theorem) 指出,局部凸拓扑线性空间中的非空紧凸集是其极点 (extreme point) 的闭凸包。极点定理是凸集理论中的重要结果,在积分表示理论 (integral representation theory) 和凸优化 (convex optimization) 中有应用。

    应用 5.2.3 (对偶极锥):在凸分析中,对偶极锥 (polar cone) 的概念与分离定理密切相关。设 \(K \subseteq X\) 是锥 (cone)。其对偶极锥 \(K^\circ \subseteq X^*\) 定义为
    \[ K^\circ = \{f \in X^* : f(x) \geq 0, \forall x \in K\}. \]
    分离定理可以用来研究锥的性质及其对偶极锥之间的关系。

    5.3 Hahn-Banach 定理的应用 (Applications of Hahn-Banach Theorem)

    Hahn-Banach 定理是泛函分析的基石之一,其应用非常广泛。除了前面提到的分离定理,还有许多其他重要的应用。

    5.3.1 存在性定理 (Existence Theorems)

    Hahn-Banach 定理可以用来证明许多存在性定理,例如:

    存在非零有界线性泛函:对于非零向量 \(x_0 \in X\),存在 \(f \in X^*\) 使得 \(f(x_0) \neq 0\)。实际上,可以找到 \(f\) 使得 \(f(x_0) = \|x_0\|\) 且 \(\|f\| = 1\)。

    稠密子空间的唯一延拓:设 \(M\) 是赋范线性空间 \(X\) 的稠密子空间,\(f \in M^*\) 是有界线性泛函。则 \(f\) 可以唯一延拓到 \(X\) 上,得到 \(F \in X^*\),且 \(\|F\| = \|f\|\)。唯一性是因为稠密子集上的值唯一确定了连续函数在整个空间上的值。

    Banach 极限 (Banach Limit):存在定义在所有有界实数列空间 \(l^\infty\) 上的线性泛函 \(L\),称为 Banach 极限,满足以下性质:
    ① 如果 \(x = (x_n)\) 且 \(x_n \geq 0\) 对所有 \(n\) 成立,则 \(L(x) \geq 0\)。
    ② 如果 \(x = (x_n)\) 收敛到 \(c\),则 \(L(x) = c\)。
    ③ \(L(x)\) 是平移不变的,即 \(L((x_{n+1})) = L((x_n))\)。
    Banach 极限的存在性可以用 Hahn-Banach 延拓定理证明,但不是唯一的。

    5.3.2 对偶空间理论 (Dual Space Theory)

    Hahn-Banach 定理在对偶空间理论中起着核心作用。

    赋范线性空间与其对偶空间的等距嵌入:对于赋范线性空间 \(X\),存在到其二次对偶空间 \(X^{**} = (X^*)^*\) 的等距嵌入 (isometric embedding) \(J: X \rightarrow X^{**}\),定义为 \((J x)(f) = f(x)\) 对所有 \(x \in X\) 和 \(f \in X^*\) 成立。Hahn-Banach 定理保证了 \(J\) 是等距的,即 \(\|Jx\| = \|x\|\)。

    自反空间 (Reflexive Space):如果等距嵌入 \(J: X \rightarrow X^{**}\) 是满射 (surjective),则称 \(X\) 是自反空间。自反空间在泛函分析中具有重要的地位。

    5.3.3 最优化理论 (Optimization Theory)

    Hahn-Banach 定理及其分离定理在最优化理论中有着广泛的应用,特别是在凸优化问题中。

    Lagrange 乘子定理 (Lagrange Multiplier Theorem):在约束优化问题中,Lagrange 乘子定理是求解最优解的重要工具。Hahn-Banach 分离定理可以用来证明广义 Lagrange 乘子定理,用于处理无限维空间中的约束优化问题。

    对偶问题 (Dual Problem):在凸优化中,每个原始优化问题都有一个对偶问题。通过研究对偶问题,可以获得关于原始问题的信息,例如最优值的下界、最优解的存在性等。Hahn-Banach 分离定理在建立对偶理论中起着关键作用。

    5.3.4 其他应用 (Other Applications)

    测度论 (Measure Theory):Riesz 表示定理 (Riesz Representation Theorem) 将 \(C(K)^*\) (紧 Hausdorff 空间 \(K\) 上连续函数空间 \(C(K)\) 的对偶空间)与 \(K\) 上的 Radon 测度空间等同起来。Hahn-Banach 延拓定理是证明 Riesz 表示定理的关键步骤之一。

    算子理论 (Operator Theory):在算子理论中,Hahn-Banach 定理可以用来研究算子的性质,例如算子的伴随算子 (adjoint operator)、谱理论 (spectral theory) 等。

    逼近理论 (Approximation Theory):Hahn-Banach 定理可以用来证明最佳逼近的存在性,例如在 Hilbert 空间中,闭凸子集上存在最佳逼近点。

    总而言之,Hahn-Banach 定理是泛函分析中一个极其重要的工具,它不仅提供了线性泛函延拓的可能性,而且在几何分离、对偶空间理论、最优化理论等多个领域都有着深刻的应用,是理解和解决泛函分析问题的关键理论基础。

    6. chapter 6: 一致有界原理、开映射定理、闭图像定理 (Uniform Boundedness Principle, Open Mapping Theorem, Closed Graph Theorem)

    6.1 一致有界原理 (Uniform Boundedness Principle)

    一致有界原理 (Uniform Boundedness Principle),又称为 Banach-Steinhaus 定理 (Banach-Steinhaus Theorem),是泛函分析中一个 фундаментальный (fundamental) 定理。它描述了 Banach 空间上算子族有界性的一种深刻性质。这个定理在证明其他重要结果以及在应用中都扮演着关键角色。

    定理 6.1.1 (一致有界原理 - Uniform Boundedness Principle)

    设 \( X \) 是 Banach 空间,\( Y \) 是赋范线性空间。令 \( \mathcal{F} \subseteq \mathcal{B}(X, Y) \) 是 \( X \) 到 \( Y \) 的有界线性算子 (bounded linear operator) 族。如果对于每个 \( x \in X \),集合 \( \{ \|T(x)\| : T \in \mathcal{F} \} \) 是有界的,则族 \( \mathcal{F} \) 是一致有界的,即存在一个常数 \( M < \infty \),使得对于所有 \( T \in \mathcal{F} \) 和所有 \( x \in X \),有 \( \|T\| \leq M \)。

    换句话说,如果对于每个点 \( x \),算子族在 \( x \) 处的值是有界的,那么整个算子族作为整体是有界的。

    证明:

    我们使用反证法 (proof by contradiction) 和 Baire 纲定理 (Baire Category Theorem) 来证明这个定理。

    假设 \( \mathcal{F} \) 不是一致有界的。这意味着对于任何 \( n \in \mathbb{N} \),都存在 \( T_n \in \mathcal{F} \) 使得 \( \|T_n\| > n \)。

    对于每个 \( k \in \mathbb{N} \),定义集合 \( A_k = \{ x \in X : \|T(x)\| \leq k, \forall T \in \mathcal{F} \} \)。根据假设,对于每个 \( x \in X \),集合 \( \{ \|T(x)\| : T \in \mathcal{F} \} \) 是有界的,因此对于每个 \( x \in X \),存在 \( k_x \in \mathbb{N} \) 使得 \( \|T(x)\| \leq k_x \) 对所有 \( T \in \mathcal{F} \) 成立。这意味着 \( x \in A_{k_x} \)。因此,\( X = \bigcup_{k=1}^{\infty} A_k \)。

    现在,我们证明每个 \( A_k \) 是闭集 (closed set)。设 \( (x_n) \) 是 \( A_k \) 中的序列,且 \( x_n \to x \) 在 \( X \) 中收敛。对于任何 \( T \in \mathcal{F} \),由于 \( T \) 是连续的,所以 \( T(x_n) \to T(x) \)。因为 \( x_n \in A_k \),所以 \( \|T(x_n)\| \leq k \) 对所有 \( n \) 和所有 \( T \in \mathcal{F} \) 成立。由于范数是连续的,取极限得到 \( \|T(x)\| = \lim_{n \to \infty} \|T(x_n)\| \leq k \)。这对于所有 \( T \in \mathcal{F} \) 成立,因此 \( x \in A_k \)。所以 \( A_k \) 是闭集。

    由于 \( X \) 是 Banach 空间,根据 Baire 纲定理,Banach 空间不是第一纲集 (first category set)。因为 \( X = \bigcup_{k=1}^{\infty} A_k \),所以至少存在一个 \( A_{k_0} \) 不是稀疏集 (nowhere dense set)。由于 \( A_{k_0} \) 是闭集,如果它不是稀疏集,那么它的内部 \( \text{int}(A_{k_0}) \) 非空。

    设 \( x_0 \in \text{int}(A_{k_0}) \),则存在 \( r > 0 \) 使得球 \( B(x_0, r) = \{ x \in X : \|x - x_0\| < r \} \subseteq A_{k_0} \)。这意味着对于所有 \( x \in B(x_0, r) \) 和所有 \( T \in \mathcal{F} \),有 \( \|T(x)\| \leq k_0 \)。

    对于任何 \( v \in X \) 且 \( \|v\| = 1 \),考虑点 \( x = x_0 + \frac{r}{2} v \)。则 \( \|x - x_0\| = \frac{r}{2} < r \),所以 \( x \in B(x_0, r) \subseteq A_{k_0} \)。因此,对于所有 \( T \in \mathcal{F} \),有 \( \|T(x)\| \leq k_0 \)。

    现在,考虑 \( T(x) = T(x_0 + \frac{r}{2} v) = T(x_0) + \frac{r}{2} T(v) \)。因此,\( \frac{r}{2} T(v) = T(x) - T(x_0) \)。
    所以,\( \frac{r}{2} \|T(v)\| = \| \frac{r}{2} T(v) \| = \| T(x) - T(x_0) \| \leq \|T(x)\| + \|T(x_0)\| \)。
    由于 \( x, x_0 \in B(x_0, r) \subseteq A_{k_0} \),所以 \( \|T(x)\| \leq k_0 \) 且 \( \|T(x_0)\| \leq k_0 \)。
    因此,\( \frac{r}{2} \|T(v)\| \leq k_0 + k_0 = 2k_0 \)。
    从而,\( \|T(v)\| \leq \frac{4k_0}{r} \) 对于所有 \( T \in \mathcal{F} \) 和所有 \( v \in X \) 且 \( \|v\| = 1 \) 成立。

    令 \( M = \frac{4k_0}{r} \)。则对于所有 \( T \in \mathcal{F} \),\( \sup_{\|v\|=1} \|T(v)\| \leq M \),即 \( \|T\| \leq M \)。这表明 \( \mathcal{F} \) 是一致有界的,与假设矛盾。

    因此,假设不成立,即 \( \mathcal{F} \) 必须是一致有界的。

    证毕。

    例子与应用:

    点点收敛与一致有界性: 一致有界原理表明,如果 Banach 空间 \( X \) 上的有界线性算子族 \( \{T_n\}_{n=1}^\infty \) 在每个点 \( x \in X \) 处是点点有界的 (pointwise bounded),即 \( \sup_n \|T_n(x)\| < \infty \) 对于每个 \( x \in X \),那么这个算子族是一致有界的,即 \( \sup_n \|T_n\| < \infty \)。

    Fourier 级数: 考虑 \( C[0, 2\pi] \) 空间,配备 supremum 范数,这不是 Banach 空间。考虑 Fourier 级数的部分和算子 \( S_n : C[0, 2\pi] \to C[0, 2\pi] \)。对于某些连续函数 \( f \in C[0, 2\pi] \),\( \sup_n \|S_n(f)\| = \infty \),这意味着 \( \{S_n\} \) 不是点点有界的。因此,一致有界原理不适用。但是,如果我们将空间改为 \( L^p[0, 2\pi] \) (Banach 空间) \( 1 < p < \infty \),则可以应用一致有界原理来研究 Fourier 级数部分和算子的有界性。

    数值分析中的稳定性: 在数值分析中,当用数值方法逼近微分方程或其他问题时,我们通常得到一系列近似解。一致有界原理可以用来分析这些数值方法的稳定性。如果一系列数值算子 \( \{T_h\} \) (其中 \( h \) 是步长) 是一致有界的,并且数值解对于某些初始数据是收敛的,那么我们可能可以推断出对于更广泛的初始数据,数值解也是稳定的。

    6.2 开映射定理 (Open Mapping Theorem)

    开映射定理 (Open Mapping Theorem) 是泛函分析中的另一个 фундаментальный (fundamental) 定理,它描述了 Banach 空间之间满射有界线性算子的一个重要性质。

    定理 6.2.1 (开映射定理 - Open Mapping Theorem)

    设 \( X \) 和 \( Y \) 都是 Banach 空间。如果 \( T : X \to Y \) 是一个有界线性算子,并且 \( T \) 是满射 (surjective),即 \( \text{Range}(T) = Y \),则 \( T \) 是开映射 (open mapping)。也就是说,对于 \( X \) 中的任何开集 \( U \),\( T(U) \) 是 \( Y \) 中的开集。

    证明概要:

    开映射定理的证明通常分为几个步骤,核心思想是利用 Baire 纲定理和 Banach 空间的完备性。

    证明存在 \( c > 0 \) 使得 \( B_Y(0, 1) \subseteq \overline{T(B_X(0, c))} \): 利用 \( T \) 的满射性和 Baire 纲定理,可以证明存在一个常数 \( c > 0 \) 使得 \( Y \) 中的单位球 \( B_Y(0, 1) \) 包含在 \( X \) 中某个小球 \( B_X(0, c) \) 在 \( T \) 下的像的闭包 \( \overline{T(B_X(0, c))} \) 中。

    证明存在 \( \delta > 0 \) 使得 \( B_Y(0, \delta) \subseteq T(B_X(0, 1)) \): 利用步骤 ① 的结果和迭代方法,可以进一步证明存在一个 \( \delta > 0 \) 使得 \( Y \) 中的小球 \( B_Y(0, \delta) \) 包含在 \( X \) 中单位球 \( B_X(0, 1) \) 在 \( T \) 下的像 \( T(B_X(0, 1)) \) 中,注意这里不是闭包。

    推广到任意开集: 利用步骤 ② 的结果,可以证明对于 \( X \) 中的任何开集 \( U \),\( T(U) \) 是 \( Y \) 中的开集。这是通过平移和缩放开球,并利用线性算子的性质来实现的。

    详细证明 (步骤 ② 的关键部分):

    假设我们已经证明了存在 \( c > 0 \) 使得 \( B_Y(0, 1) \subseteq \overline{T(B_X(0, c))} \)。为了简化,不妨假设 \( B_Y(0, 1) \subseteq \overline{T(B_X(0, 1/2))} \) (可以通过调整 \( c \) 的值来实现)。我们需要证明存在 \( \delta > 0 \) 使得 \( B_Y(0, \delta) \subseteq T(B_X(0, 1)) \)。

    设 \( y \in B_Y(0, 1) \)。由于 \( y \in \overline{T(B_X(0, 1/2))} \),存在 \( x_1 \in B_X(0, 1/2) \) 使得 \( \|y - T(x_1)\| < \frac{1}{2} \)。
    令 \( y_1 = y - T(x_1) \)。则 \( \|y_1\| < \frac{1}{2} \)。由于 \( y_1 \in B_Y(0, 1/2) \subseteq \overline{T(B_X(0, 1/4))} \),存在 \( x_2 \in B_X(0, 1/4) \) 使得 \( \|y_1 - T(x_2)\| < \frac{1}{4} \)。
    令 \( y_2 = y_1 - T(x_2) = y - T(x_1) - T(x_2) \)。则 \( \|y_2\| < \frac{1}{4} \)。
    继续这个过程,我们可以找到序列 \( (x_n) \) 使得 \( x_n \in B_X(0, 2^{-n}) \) 且 \( \|y - \sum_{i=1}^n T(x_i) \| < 2^{-n} \)。

    令 \( x = \sum_{i=1}^\infty x_i \)。由于 \( \|x_i\| < 2^{-i} \),级数 \( \sum_{i=1}^\infty x_i \) 在 Banach 空间 \( X \) 中绝对收敛,因此收敛。并且 \( \|x\| \leq \sum_{i=1}^\infty \|x_i\| < \sum_{i=1}^\infty 2^{-i} = 1 \)。所以 \( x \in B_X(0, 1) \)。

    由于 \( T \) 是连续线性算子,\( T(x) = T(\sum_{i=1}^\infty x_i) = \sum_{i=1}^\infty T(x_i) \)。
    另一方面,\( \|y - \sum_{i=1}^n T(x_i) \| < 2^{-n} \to 0 \) as \( n \to \infty \)。
    因此,\( y = \sum_{i=1}^\infty T(x_i) = T(\sum_{i=1}^\infty x_i) = T(x) \)。
    我们证明了对于任何 \( y \in B_Y(0, 1) \),都存在 \( x \in B_X(0, 1) \) 使得 \( T(x) = y \)。
    所以 \( B_Y(0, 1) \subseteq T(B_X(0, 1)) \)。实际上,我们可以取 \( \delta = 1 \)。更精确的分析可以得到更具体的 \( \delta \) 值。

    证毕。

    开映射定理的推论:

    逆算子定理 (Inverse Mapping Theorem):设 \( X \) 和 \( Y \) 是 Banach 空间,\( T : X \to Y \) 是有界线性算子。如果 \( T \) 是双射 (bijective) (既是单射又是满射),则逆算子 \( T^{-1} : Y \to X \) 也是有界的。

    证明: 因为 \( T \) 是双射且是开映射 (由开映射定理,因为 \( T \) 满射),所以对于 \( X \) 中的开集 \( U \),\( T(U) \) 是 \( Y \) 中的开集。这意味着对于 \( Y \) 中的开集 \( V \),\( T^{-1}(V) \) 是 \( X \) 中的开集。因此,\( T^{-1} \) 是连续的。由于 \( T^{-1} \) 是线性算子且连续,所以 \( T^{-1} \) 是有界的。

    同构定理 (Isomorphism Theorem):设 \( X \) 和 \( Y \) 是 Banach 空间,\( T : X \to Y \) 是有界线性双射。则 \( X \) 与 \( Y \) 作为拓扑向量空间是同构的。

    闭图像定理 (Closed Graph Theorem):将在下一节讨论。

    例子与应用:

    微分算子的有界性: 在偏微分方程理论中,开映射定理和逆算子定理被用来证明某些微分算子的有界性和解的存在唯一性。例如,在研究椭圆型偏微分方程时,可以构造适当的 Banach 空间和算子,然后应用开映射定理来分析解的性质。

    泛函方程的解的存在性: 开映射定理可以用来证明某些泛函方程解的存在性。如果可以将泛函方程转化为 Banach 空间之间的线性算子方程 \( T(x) = y \),并且证明 \( T \) 是满射的,那么对于任何 \( y \),方程都有解 \( x \)。

    6.3 闭图像定理 (Closed Graph Theorem)

    闭图像定理 (Closed Graph Theorem) 提供了判断一个线性算子是否连续 (有界) 的一个非常有用的准则,特别是当算子的定义域和值域都是 Banach 空间时。

    定义 6.3.1 (算子的图像 - Graph of an Operator)

    设 \( T : X \to Y \) 是从线性空间 \( X \) 到线性空间 \( Y \) 的线性算子。\( T \) 的图像 \( G(T) \) 定义为 \( X \times Y \) 的子集:
    \[ G(T) = \{ (x, T(x)) : x \in X \} \subseteq X \times Y \]
    其中 \( X \times Y \) 是乘积空间,配备乘积拓扑 (如果 \( X, Y \) 是赋范线性空间,则 \( X \times Y \) 也是赋范线性空间,范数例如 \( \|(x, y)\|_{X \times Y} = \sqrt{\|x\|_X^2 + \|y\|_Y^2} \) 或 \( \|(x, y)\|_{X \times Y} = \|x\|_X + \|y\|_Y \) 或 \( \|(x, y)\|_{X \times Y} = \max\{\|x\|_X, \|y\|_Y\} \),这些范数都是等价的)。

    定理 6.3.2 (闭图像定理 - Closed Graph Theorem)

    设 \( X \) 和 \( Y \) 都是 Banach 空间。设 \( T : X \to Y \) 是线性算子。则 \( T \) 是有界线性算子 (即连续) 当且仅当 \( T \) 的图像 \( G(T) \) 是 \( X \times Y \) 中的闭集。

    证明:

    \( (\Rightarrow) \) 假设 \( T \) 是有界线性算子 (连续)。我们需要证明 \( G(T) \) 是闭集。
    设 \( ((x_n, y_n)) \) 是 \( G(T) \) 中的序列,且 \( (x_n, y_n) \to (x, y) \) 在 \( X \times Y \) 中收敛。由于 \( (x_n, y_n) \in G(T) \),所以 \( y_n = T(x_n) \)。
    \( (x_n, y_n) \to (x, y) \) 在 \( X \times Y \) 中收敛意味着 \( x_n \to x \) 在 \( X \) 中收敛且 \( y_n \to y \) 在 \( Y \) 中收敛。
    由于 \( T \) 是连续的,\( T(x_n) \to T(x) \)。因为 \( y_n = T(x_n) \),所以 \( y_n \to T(x) \)。
    又因为 \( y_n \to y \),根据极限的唯一性,\( y = T(x) \)。
    因此,\( (x, y) = (x, T(x)) \in G(T) \)。所以 \( G(T) \) 是闭集。

    \( (\Leftarrow) \) 假设 \( G(T) \) 是 \( X \times Y \) 中的闭集。我们需要证明 \( T \) 是有界线性算子 (连续)。
    由于 \( X \) 和 \( Y \) 是 Banach 空间,\( X \times Y \) 配备乘积范数也是 Banach 空间,因为闭子空间 \( G(T) \) 是 \( X \times Y \) 的闭子集,所以 \( G(T) \) 也是 Banach 空间。

    考虑投影算子 \( P : G(T) \to X \) 定义为 \( P(x, T(x)) = x \)。
    \( P \) 是线性的,且是有界的,因为 \( \|P(x, T(x))\|_X = \|x\|_X \leq \sqrt{\|x\|_X^2 + \|T(x)\|_Y^2} = \|(x, T(x))\|_{X \times Y} \)。所以 \( \|P\| \leq 1 \)。
    我们需要证明 \( P \) 是双射。
    单射性 (injective):如果 \( P(x, T(x)) = 0 \),则 \( x = 0 \)。因此 \( (x, T(x)) = (0, T(0)) = (0, 0) \)。所以 \( P \) 是单射。
    满射性 (surjective):对于任何 \( x \in X \),存在 \( (x, T(x)) \in G(T) \) 使得 \( P(x, T(x)) = x \)。所以 \( P \) 是满射。

    因此,\( P : G(T) \to X \) 是 Banach 空间之间的有界线性双射。根据逆算子定理 (Inverse Mapping Theorem),逆算子 \( P^{-1} : X \to G(T) \) 也是有界的。

    现在考虑另一个投影算子 \( Q : G(T) \to Y \) 定义为 \( Q(x, T(x)) = T(x) \)。
    \( Q \) 也是线性的,且是有界的,因为 \( \|Q(x, T(x))\|_Y = \|T(x)\|_Y \leq \sqrt{\|x\|_X^2 + \|T(x)\|_Y^2} = \|(x, T(x))\|_{X \times Y} \)。所以 \( \|Q\| \leq 1 \)。

    我们可以将 \( T \) 表示为复合算子 \( T = Q \circ P^{-1} \)。
    \[ X \xrightarrow{P^{-1}} G(T) \xrightarrow{Q} Y \]
    由于 \( P^{-1} : X \to G(T) \) 和 \( Q : G(T) \to Y \) 都是有界线性算子,它们的复合 \( T = Q \circ P^{-1} : X \to Y \) 也是有界线性算子。

    证毕。

    闭图像定理的应用:

    验证算子的有界性: 当直接证明一个算子的有界性比较困难时,可以尝试证明其图像是闭集。如果能证明图像是闭的,并且定义域和值域都是 Banach 空间,则可以立即得到算子是有界的。

    微分算子的有界性: 在偏微分方程理论中,闭图像定理经常被用来证明某些微分算子在适当的 Sobolev 空间之间的有界性。例如,考虑微分算子 \( D : W^{k+1, p}(\Omega) \to W^{k, p}(\Omega) \),其中 \( W^{k, p}(\Omega) \) 是 Sobolev 空间。通过验证 \( D \) 的图像是闭的,可以证明 \( D \) 是有界的。

    乘法算子的有界性: 设 \( \phi \in L^\infty(\mu) \),定义乘法算子 \( M_\phi : L^p(\mu) \to L^p(\mu) \) 为 \( (M_\phi f)(x) = \phi(x) f(x) \)。可以使用闭图像定理证明 \( M_\phi \) 是有界的。

    6.4 应用与推论 (Applications and Corollaries)

    推论 6.4.1 (Hellinger-Toeplitz 定理)

    设 \( H \) 是 Hilbert 空间,\( T : H \to H \) 是线性算子,定义域为整个 \( H \)。如果对于所有 \( x, y \in H \),有 \( \langle T(x), y \rangle = \langle x, T(y) \rangle \),则 \( T \) 是有界线性算子 (自伴算子 - self-adjoint operator)。

    证明:

    我们需要证明 \( T \) 的图像 \( G(T) \) 是闭集。设 \( (x_n, T(x_n)) \) 是 \( G(T) \) 中的序列,且 \( (x_n, T(x_n)) \to (x, y) \) 在 \( H \times H \) 中收敛。我们需要证明 \( y = T(x) \)。

    由于 \( x_n \to x \) 且 \( T(x_n) \to y \),对于任何 \( z \in H \),有:
    \[ \langle T(x_n), z \rangle = \langle x_n, T(z) \rangle \]
    由于内积是连续的,当 \( n \to \infty \) 时,
    \[ \lim_{n \to \infty} \langle T(x_n), z \rangle = \langle \lim_{n \to \infty} T(x_n), z \rangle = \langle y, z \rangle \]
    \[ \lim_{n \to \infty} \langle x_n, T(z) \rangle = \langle \lim_{n \to \infty} x_n, T(z) \rangle = \langle x, T(z) \rangle \]
    因此,\( \langle y, z \rangle = \langle x, T(z) \rangle \)。根据条件,\( \langle x, T(z) \rangle = \langle T(x), z \rangle \)。
    所以,\( \langle y, z \rangle = \langle T(x), z \rangle \),即 \( \langle y - T(x), z \rangle = 0 \) 对于所有 \( z \in H \) 成立。
    取 \( z = y - T(x) \),得到 \( \|y - T(x)\|^2 = \langle y - T(x), y - T(x) \rangle = 0 \)。
    因此,\( y - T(x) = 0 \),即 \( y = T(x) \)。
    所以 \( (x, y) = (x, T(x)) \in G(T) \)。因此 \( G(T) \) 是闭集。
    根据闭图像定理,\( T \) 是有界线性算子。

    证毕。

    应用:解线性方程组的适定性 (Well-posedness)

    考虑线性方程 \( T(x) = y \),其中 \( T : X \to Y \) 是 Banach 空间之间的有界线性算子。适定性通常包含三个方面:

    存在性 (Existence):对于每个 \( y \in Y \),方程 \( T(x) = y \) 至少有一个解 \( x \in X \)。这要求 \( T \) 是满射的。

    唯一性 (Uniqueness):对于每个 \( y \in Y \),方程 \( T(x) = y \) 至多有一个解 \( x \in X \)。这要求 \( T \) 是单射的。

    稳定性 (Stability):解 \( x \) 连续依赖于数据 \( y \)。这意味着如果 \( y \) 有小扰动,解 \( x \) 的扰动也很小。这要求逆算子 \( T^{-1} \) 是有界的 (如果 \( T \) 是双射)。

    如果 \( T : X \to Y \) 是 Banach 空间之间的有界线性双射,根据逆算子定理,\( T^{-1} : Y \to X \) 也是有界的。这意味着线性方程 \( T(x) = y \) 是适定的。存在唯一解 \( x = T^{-1}(y) \),且解 \( x \) 连续依赖于 \( y \),因为 \( \|x\| = \|T^{-1}(y)\| \leq \|T^{-1}\| \|y\| \)。

    总结:

    一致有界原理、开映射定理和闭图像定理是泛函分析中三个 фундаментальный (fundamental) 定理,它们之间相互关联,并且在泛函分析的理论发展和应用中都起着至关重要的作用。一致有界原理给出了算子族一致有界的条件;开映射定理描述了 Banach 空间之间满射有界线性算子的开映射性质,并导出了逆算子定理;闭图像定理提供了判断线性算子有界性的实用准则。这些定理是解决泛函分析中许多问题的有力工具。

    7. chapter 7: 对偶空间与共轭算子 (Dual Spaces and Adjoint Operators)

    7.1 对偶空间 (Dual Space)

    在泛函分析中,对偶空间 (Dual Space) 的概念至关重要。它为我们提供了一种从线性泛函的角度研究线性空间的有力工具。本节将深入探讨对偶空间的定义、性质以及一些重要的例子。

    7.1.1 连续线性泛函 (Continuous Linear Functionals)

    为了引入对偶空间,我们首先需要了解连续线性泛函 (Continuous Linear Functionals) 的概念。

    定义 7.1.1 (线性泛函)
    设 \( X \) 是数域 \( \mathbb{K} \) (实数域 \( \mathbb{R} \) 或复数域 \( \mathbb{C} \)) 上的线性空间。线性泛函 (Linear Functional) \( f \) 是指从 \( X \) 到数域 \( \mathbb{K} \) 的线性映射,即 \( f: X \rightarrow \mathbb{K} \) 满足:
    ① 线性性:对于任意 \( x, y \in X \) 和 \( \alpha, \beta \in \mathbb{K} \),有 \( f(\alpha x + \beta y) = \alpha f(x) + \beta f(y) \)。

    定义 7.1.2 (连续线性泛函)
    设 \( X \) 是赋范线性空间 (Normed Linear Space)。线性泛函 \( f: X \rightarrow \mathbb{K} \) 被称为连续的 (Continuous),如果对于 \( X \) 中的任意收敛序列 \( \{x_n\}_{n=1}^\infty \) 且 \( \lim_{n\to\infty} x_n = x \),都有 \( \lim_{n\to\infty} f(x_n) = f(x) \)。

    连续性在线性泛函的研究中至关重要。对于线性泛函,连续性等价于有界性,这是一个非常重要的性质。

    定理 7.1.1 (连续性与有界性的等价性)
    设 \( X \) 是赋范线性空间,\( f: X \rightarrow \mathbb{K} \) 是线性泛函。则 \( f \) 连续当且仅当存在常数 \( M \geq 0 \),使得对于所有 \( x \in X \),有 \( |f(x)| \leq M \|x\| \)。

    证明:
    \( (\Rightarrow) \) 若 \( f \) 连续,但 \( f \) 不是有界的。则对于任意 \( n \in \mathbb{N} \),存在 \( x_n \in X \) 使得 \( |f(x_n)| > n \|x_n\| \)。若 \( x_n = 0 \),则 \( f(x_n) = 0 \),矛盾。因此 \( x_n \neq 0 \)。令 \( y_n = \frac{x_n}{n \|x_n\|} \)。则 \( \|y_n\| = \frac{\|x_n\|}{n \|x_n\|} = \frac{1}{n} \rightarrow 0 \) 当 \( n \rightarrow \infty \) 时。因此 \( y_n \rightarrow 0 \)。由于 \( f \) 连续,所以 \( f(y_n) \rightarrow f(0) = 0 \)。但是,\( |f(y_n)| = |f(\frac{x_n}{n \|x_n\|})| = \frac{|f(x_n)|}{n \|x_n\|} > \frac{n \|x_n\|}{n \|x_n\|} = 1 \)。这与 \( f(y_n) \rightarrow 0 \) 矛盾。因此,\( f \) 必须是有界的。

    \( (\Leftarrow) \) 若存在 \( M \geq 0 \) 使得 \( |f(x)| \leq M \|x\| \) 对所有 \( x \in X \) 成立。设 \( \{x_n\} \) 是 \( X \) 中的序列,且 \( x_n \rightarrow x \)。则 \( \|x_n - x\| \rightarrow 0 \)。我们有 \( |f(x_n) - f(x)| = |f(x_n - x)| \leq M \|x_n - x\| \)。由于 \( \|x_n - x\| \rightarrow 0 \),所以 \( |f(x_n) - f(x)| \rightarrow 0 \),即 \( f(x_n) \rightarrow f(x) \)。因此,\( f \) 是连续的。

    定义 7.1.3 (线性泛函的范数)
    设 \( X \) 是赋范线性空间,\( f: X \rightarrow \mathbb{K} \) 是连续线性泛函。定义 \( f \) 的范数 (Norm) 为:
    \[ \|f\| = \sup_{\|x\| \leq 1} |f(x)| = \sup_{x \neq 0} \frac{|f(x)|}{\|x\|} \]
    根据定理 7.1.1,连续线性泛函都是有界的,因此上述范数是有限的。

    7.1.2 对偶空间的定义 (Definition of Dual Space)

    有了连续线性泛函的概念,我们就可以定义对偶空间了。

    定义 7.1.4 (对偶空间)
    设 \( X \) 是赋范线性空间。\( X \) 的对偶空间 (Dual Space),记为 \( X^* \),定义为 \( X \) 上所有连续线性泛函构成的集合,即
    \[ X^* = \{f: X \rightarrow \mathbb{K} \mid f \text{ 是连续线性泛函} \} \]
    在 \( X^* \) 上定义线性运算和范数如下:
    ① 加法:对于 \( f, g \in X^* \),定义 \( (f+g)(x) = f(x) + g(x) \),对于所有 \( x \in X \)。
    ② 数乘:对于 \( f \in X^* \) 和 \( \alpha \in \mathbb{K} \),定义 \( (\alpha f)(x) = \alpha f(x) \),对于所有 \( x \in X \)。
    ③ 范数:对于 \( f \in X^* \),定义 \( \|f\| = \sup_{\|x\| \leq 1} |f(x)| \)。

    可以验证,在上述定义的运算下,\( X^* \) 构成一个线性空间。更重要的是,\( X^* \) 在定义的范数下是一个 Banach 空间 (Banach Space)。

    定理 7.1.2 (对偶空间是 Banach 空间)
    赋范线性空间 \( X \) 的对偶空间 \( X^* \) 在范数 \( \|f\| = \sup_{\|x\| \leq 1} |f(x)| \) 下是一个 Banach 空间。

    证明:
    我们需要证明 \( X^* \) 是完备的 (Complete)。设 \( \{f_n\}_{n=1}^\infty \) 是 \( X^* \) 中的 Cauchy 序列。对于任意 \( x \in X \),\( \{f_n(x)\}_{n=1}^\infty \) 是 \( \mathbb{K} \) 中的 Cauchy 序列,因为 \( |f_n(x) - f_m(x)| = |(f_n - f_m)(x)| \leq \|f_n - f_m\| \|x\| \)。由于 \( \mathbb{K} \) 是完备的,所以 \( \{f_n(x)\}_{n=1}^\infty \) 收敛。定义 \( f: X \rightarrow \mathbb{K} \) 为 \( f(x) = \lim_{n\to\infty} f_n(x) \)。

    首先证明 \( f \) 是线性的。对于任意 \( x, y \in X \) 和 \( \alpha, \beta \in \mathbb{K} \),
    \[ f(\alpha x + \beta y) = \lim_{n\to\infty} f_n(\alpha x + \beta y) = \lim_{n\to\infty} (\alpha f_n(x) + \beta f_n(y)) = \alpha \lim_{n\to\infty} f_n(x) + \beta \lim_{n\to\infty} f_n(y) = \alpha f(x) + \beta f(y) \]
    所以 \( f \) 是线性的。

    接下来证明 \( f \) 是连续的,且 \( f_n \rightarrow f \) 在 \( X^* \) 中。由于 \( \{f_n\} \) 是 Cauchy 序列,对于任意 \( \epsilon > 0 \),存在 \( N \) 使得当 \( n, m > N \) 时,\( \|f_n - f_m\| < \epsilon \)。因此,对于任意 \( x \in X \) 且 \( \|x\| \leq 1 \),有 \( |f_n(x) - f_m(x)| \leq \|f_n - f_m\| \|x\| < \epsilon \)。当 \( m \rightarrow \infty \) 时,\( |f_n(x) - f(x)| \leq \epsilon \)。这表明对于所有 \( \|x\| \leq 1 \),\( |f_n(x) - f(x)| \leq \epsilon \),因此 \( \|f_n - f\| = \sup_{\|x\| \leq 1} |f_n(x) - f(x)| \leq \epsilon \)。所以 \( f_n \rightarrow f \) 在 \( X^* \) 中。由于 \( f_n = f + (f_n - f) \),且 \( f_n \) 和 \( (f_n - f) \) 都是连续线性泛函(因为 \( f_n \in X^* \) 且 \( \|f_n - f\| < \infty \) 意味着 \( f_n - f \in X^* \)),所以 \( f = f_n - (f_n - f) \) 也是连续线性泛函,即 \( f \in X^* \)。

    因此,\( X^* \) 是完备的,即 \( X^* \) 是 Banach 空间。

    7.1.3 对偶空间的例子 (Examples of Dual Spaces)

    理解对偶空间的关键在于掌握一些具体的例子。下面我们给出几个重要的例子。

    例 7.1.1 (有限维空间的对偶空间)
    设 \( X = \mathbb{K}^n \) 是 \( n \) 维线性空间,配备 \( p \)-范数 \( \|x\|_p = (\sum_{i=1}^n |x_i|^p)^{1/p} \) (当 \( 1 \leq p < \infty \)) 或 \( \|\mathbf{x}\|_{\infty} = \max_{1\leq i \leq n} |x_i| \) (当 \( p = \infty \))。考虑 \( X \) 的对偶空间 \( X^* \)。
    对于 \( f \in X^* \),由于 \( X \) 是有限维的,任何线性泛函都是连续的。设 \( \{e_1, e_2, \ldots, e_n\} \) 是 \( \mathbb{K}^n \) 的标准基。对于任意 \( x = \sum_{i=1}^n x_i e_i \in \mathbb{K}^n \),有 \( f(x) = f(\sum_{i=1}^n x_i e_i) = \sum_{i=1}^n x_i f(e_i) \)。令 \( y_i = f(e_i) \)。则 \( f(x) = \sum_{i=1}^n x_i y_i \)。我们可以将 \( f \) 与向量 \( y = (y_1, y_2, \ldots, y_n) \in \mathbb{K}^n \) 等同起来。

    特别地,如果 \( X = \ell_p^n \) (即 \( \mathbb{K}^n \) 配备 \( p \)-范数),则 \( X^* \) 同构于 \( \ell_q^n \),其中 \( \frac{1}{p} + \frac{1}{q} = 1 \) (当 \( 1 < p < \infty \)),\( q = \infty \) 当 \( p = 1 \),\( q = 1 \) 当 \( p = \infty \)。这种同构关系是通过 Hölder 不等式 (Hölder's Inequality) 建立的。例如,当 \( 1 < p < \infty \) 时,对于 \( f \in (\ell_p^n)^* \),存在 \( y = (y_1, \ldots, y_n) \in \ell_q^n \) 使得 \( f(x) = \sum_{i=1}^n x_i y_i \),且 \( \|f\| = \|y\|_q \)。

    例 7.1.2 ( \( \ell_p \) 空间的对偶空间)
    考虑序列空间 \( \ell_p \) ( \( 1 \leq p < \infty \) ),定义为
    \[ \ell_p = \{x = (x_1, x_2, \ldots) \mid \sum_{i=1}^\infty |x_i|^p < \infty \} \]
    其范数为 \( \|x\|_p = (\sum_{i=1}^\infty |x_i|^p)^{1/p} \)。\( \ell_p \) 的对偶空间 \( (\ell_p)^* \) 同构于 \( \ell_q \),其中 \( \frac{1}{p} + \frac{1}{q} = 1 \) (当 \( 1 < p < \infty \)),\( q = \infty \) 当 \( p = 1 \)。

    对于 \( 1 < p < \infty \),对于任意 \( y = (y_1, y_2, \ldots) \in \ell_q \),定义线性泛函 \( f_y: \ell_p \rightarrow \mathbb{K} \) 为 \( f_y(x) = \sum_{i=1}^\infty x_i y_i \)。由 Hölder 不等式,级数 \( \sum_{i=1}^\infty x_i y_i \) 收敛,且 \( |f_y(x)| \leq \|x\|_p \|y\|_q \)。因此 \( f_y \) 是连续线性泛函,且 \( \|f_y\| \leq \|y\|_q \)。可以证明,实际上 \( \|f_y\| = \|y\|_q \),并且 \( (\ell_p)^* = \{f_y \mid y \in \ell_q \} \)。因此 \( (\ell_p)^* \cong \ell_q \)。

    当 \( p = 1 \) 时,\( (\ell_1)^* \cong \ell_\infty \)。对于 \( y = (y_1, y_2, \ldots) \in \ell_\infty \),定义 \( f_y(x) = \sum_{i=1}^\infty x_i y_i \)。则 \( |f_y(x)| \leq \sum_{i=1}^\infty |x_i| |y_i| \leq \|y\|_\infty \sum_{i=1}^\infty |x_i| = \|y\|_\infty \|x\|_1 \)。因此 \( f_y \in (\ell_1)^* \) 且 \( \|f_y\| \leq \|y\|_\infty \)。可以证明 \( \|f_y\| = \|y\|_\infty \) 且 \( (\ell_1)^* \cong \ell_\infty \)。

    例 7.1.3 ( \( L_p \) 空间的对偶空间)
    考虑 \( L_p(\mu) \) 空间 ( \( 1 \leq p < \infty \) ),其中 \( (\Omega, \Sigma, \mu) \) 是测度空间。\( L_p(\mu) \) 的对偶空间 \( (L_p(\mu))^* \) 同构于 \( L_q(\mu) \),其中 \( \frac{1}{p} + \frac{1}{q} = 1 \) (当 \( 1 < p < \infty \)),\( q = \infty \) 当 \( p = 1 \)。

    对于 \( 1 < p < \infty \),对于任意 \( g \in L_q(\mu) \),定义线性泛函 \( F_g: L_p(\mu) \rightarrow \mathbb{K} \) 为 \( F_g(f) = \int_\Omega f(t) g(t) d\mu(t) \)。由 Hölder 不等式,积分 \( \int_\Omega f(t) g(t) d\mu(t) \) 存在且有限,且 \( |F_g(f)| \leq \|f\|_{L_p} \|g\|_{L_q} \)。因此 \( F_g \in (L_p(\mu))^* \) 且 \( \|F_g\| \leq \|g\|_{L_q} \)。可以证明 \( \|F_g\| = \|g\|_{L_q} \) 且 \( (L_p(\mu))^* \cong L_q(\mu) \)。

    当 \( p = 1 \) 时,\( (L_1(\mu))^* \cong L_\infty(\mu) \)。对于 \( g \in L_\infty(\mu) \),定义 \( F_g(f) = \int_\Omega f(t) g(t) d\mu(t) \)。则 \( |F_g(f)| \leq \int_\Omega |f(t)| |g(t)| d\mu(t) \leq \|g\|_{L_\infty} \int_\Omega |f(t)| d\mu(t) = \|g\|_{L_\infty} \|f\|_{L_1} \)。因此 \( F_g \in (L_1(\mu))^* \) 且 \( \|F_g\| \leq \|g\|_{L_\infty} \)。可以证明 \( \|F_g\| = \|g\|_{L_\infty} \) 且 \( (L_1(\mu))^* \cong L_\infty(\mu) \)。

    注意: \( (L_\infty(\mu))^* \) 不一定同构于 \( L_1(\mu) \),除非测度空间 \( (\Omega, \Sigma, \mu) \) 具有某些特殊性质(例如,是原子测度空间)。对于一般的 \( L_\infty(\mu) \) 空间,其对偶空间 \( (L_\infty(\mu))^* \) 比 \( L_1(\mu) \) 更大。

    7.1.4 共轭空间 (Conjugate Space)

    在复数域 \( \mathbb{C} \) 上,有时会遇到共轭线性泛函 (Conjugate Linear Functionals)。与线性泛函 \( f(\alpha x + \beta y) = \alpha f(x) + \beta f(y) \) 不同,共轭线性泛函 \( g \) 满足 \( g(\alpha x + \beta y) = \bar{\alpha} g(x) + \bar{\beta} g(y) \),其中 \( \bar{\alpha} \) 和 \( \bar{\beta} \) 是复数 \( \alpha \) 和 \( \beta \) 的共轭。

    对于复 Hilbert 空间 (Hilbert Space) \( H \),Riesz 表示定理 (Riesz Representation Theorem) 表明,\( H \) 的对偶空间 \( H^* \) 反同构于 \( H \) 自身。更精确地说,对于每个 \( f \in H^* \),存在唯一的 \( y \in H \) 使得 \( f(x) = \langle x, y \rangle \) 对于所有 \( x \in H \) 成立,其中 \( \langle \cdot, \cdot \rangle \) 是 \( H \) 上的内积。这种对应关系是反线性的,即如果 \( f_1 \) 对应 \( y_1 \),\( f_2 \) 对应 \( y_2 \),则 \( \alpha f_1 + \beta f_2 \) 对应 \( \bar{\alpha} y_1 + \bar{\beta} y_2 \)。

    在某些文献中,特别是在物理学文献中,会将共轭线性泛函空间称为共轭空间 (Conjugate Space)。为了避免混淆,本书中我们统一使用对偶空间 (Dual Space) 指代连续线性泛函空间 \( X^* \)。在 Hilbert 空间的情形,Riesz 表示定理给出了 Hilbert 空间与其自身对偶空间之间的紧密联系,这在量子力学等领域有重要应用。

    7.2 共轭算子 (Adjoint Operator)

    共轭算子 (Adjoint Operator) 是泛函分析中另一个核心概念,它推广了有限维线性代数中共轭转置 (conjugate transpose) 的概念。共轭算子在研究 Hilbert 空间上的算子理论,特别是谱理论 (Spectral Theory) 中起着至关重要的作用。

    7.2.1 共轭算子的定义 (Definition of Adjoint Operator)

    设 \( X \) 和 \( Y \) 是赋范线性空间,\( T: X \rightarrow Y \) 是有界线性算子 (Bounded Linear Operator)。我们希望定义一个算子 \( T^*: Y^* \rightarrow X^* \),称为 \( T \) 的共轭算子。

    定义 7.2.1 (共轭算子)
    设 \( X \) 和 \( Y \) 是赋范线性空间,\( T: X \rightarrow Y \) 是有界线性算子。定义 \( T \) 的共轭算子 (Adjoint Operator) \( T^*: Y^* \rightarrow X^* \) 如下:对于任意 \( g \in Y^* \),\( T^*g \) 是 \( X \) 上的线性泛函,定义为
    \[ (T^*g)(x) = g(Tx), \quad \forall x \in X \]

    我们需要验证 \( T^*g \) 是 \( X \) 上的连续线性泛函,即 \( T^*g \in X^* \),并且 \( T^* \) 是从 \( Y^* \) 到 \( X^* \) 的有界线性算子。

    定理 7.2.1 (共轭算子的性质)
    设 \( X \) 和 \( Y \) 是赋范线性空间,\( T: X \rightarrow Y \) 是有界线性算子。则共轭算子 \( T^*: Y^* \rightarrow X^* \) 具有以下性质:
    ① \( T^* \) 是线性的。
    ② \( T^* \) 是有界的,且 \( \|T^*\| = \|T\| \)。

    证明:
    ① 线性性:对于任意 \( g_1, g_2 \in Y^* \) 和 \( \alpha, \beta \in \mathbb{K} \),我们需要证明 \( T^*(\alpha g_1 + \beta g_2) = \alpha T^*g_1 + \beta T^*g_2 \)。对于任意 \( x \in X \),
    \[ (T^*(\alpha g_1 + \beta g_2))(x) = (\alpha g_1 + \beta g_2)(Tx) = \alpha g_1(Tx) + \beta g_2(Tx) = \alpha (T^*g_1)(x) + \beta (T^*g_2)(x) = (\alpha T^*g_1 + \beta T^*g_2)(x) \]
    因此 \( T^*(\alpha g_1 + \beta g_2) = \alpha T^*g_1 + \beta T^*g_2 \)。

    ② 有界性与范数:首先证明 \( T^* \) 是有界的。对于任意 \( g \in Y^* \) 和 \( x \in X \),
    \[ |(T^*g)(x)| = |g(Tx)| \leq \|g\| \|Tx\| \leq \|g\| \|T\| \|x\| \]
    因此,对于任意 \( g \in Y^* \),\( \|T^*g\| = \sup_{\|x\| \leq 1} |(T^*g)(x)| \leq \|g\| \|T\| \)。这表明 \( T^* \) 是有界的,且 \( \|T^*\| \leq \|T\| \)。

    接下来证明 \( \|T\| \leq \|T^*\| \)。对于任意 \( x \in X \),我们需要估计 \( \|Tx\| \)。根据 Hahn-Banach 定理 (Hahn-Banach Theorem),存在 \( g \in Y^* \) 使得 \( \|g\| = 1 \) 且 \( |g(Tx)| = \|Tx\| \)。则
    \[ \|Tx\| = |g(Tx)| = |(T^*g)(x)| \leq \|T^*g\| \|x\| \leq \|T^*\| \|g\| \|x\| = \|T^*\| \|x\| \]
    因此,\( \|Tx\| \leq \|T^*\| \|x\| \),对所有 \( x \in X \) 成立。取上确界,得到 \( \|T\| = \sup_{\|x\| \leq 1} \|Tx\| \leq \|T^*\| \)。

    综合 \( \|T^*\| \leq \|T\| \) 和 \( \|T\| \leq \|T^*\| \),我们得到 \( \|T^*\| = \|T\| \)。

    7.2.2 Hilbert 空间上的共轭算子 (Adjoint Operator on Hilbert Spaces)

    当 \( X = H \) 和 \( Y = K \) 是 Hilbert 空间时,共轭算子的概念与内积 (inner product) 密切相关。根据 Riesz 表示定理,对于 Hilbert 空间 \( H \),其对偶空间 \( H^* \) 可以看作是 \( H \) 自身。更精确地说,存在一个反线性同构 \( \Phi: H \rightarrow H^* \),使得对于每个 \( y \in H \),\( \Phi(y) = f_y \in H^* \) 定义为 \( f_y(x) = \langle x, y \rangle \)。

    设 \( T: H \rightarrow K \) 是 Hilbert 空间之间的有界线性算子。我们希望找到一个算子 \( T^*: K \rightarrow H \),使得它在某种意义上对应于赋范线性空间意义下的共轭算子。

    定义 7.2.2 (Hilbert 空间上的共轭算子)
    设 \( H \) 和 \( K \) 是 Hilbert 空间,\( T: H \rightarrow K \) 是有界线性算子。定义 \( T \) 的 Hilbert 共轭算子 (Hilbert Adjoint Operator) \( T^*: K \rightarrow H \) 为满足以下条件的算子:对于所有 \( x \in H \) 和 \( y \in K \),
    \[ \langle Tx, y \rangle_K = \langle x, T^*y \rangle_H \]
    其中 \( \langle \cdot, \cdot \rangle_K \) 和 \( \langle \cdot, \cdot \rangle_H \) 分别是 \( K \) 和 \( H \) 上的内积。

    定理 7.2.2 (Hilbert 共轭算子的存在性和唯一性)
    对于 Hilbert 空间 \( H \) 和 \( K \) 之间的每个有界线性算子 \( T: H \rightarrow K \),存在唯一的有界线性算子 \( T^*: K \rightarrow H \) 满足 \( \langle Tx, y \rangle_K = \langle x, T^*y \rangle_H \) 对所有 \( x \in H \) 和 \( y \in K \) 成立。此外,\( \|T^*\| = \|T\| \)。

    证明:
    对于固定的 \( y \in K \),考虑泛函 \( f_y: H \rightarrow \mathbb{K} \) 定义为 \( f_y(x) = \langle Tx, y \rangle_K \)。由于 \( T \) 是有界的,内积是连续的,所以 \( f_y \) 是 \( H \) 上的连续线性泛函。根据 Riesz 表示定理,存在唯一的 \( z \in H \) 使得 \( f_y(x) = \langle x, z \rangle_H \) 对所有 \( x \in H \) 成立。我们定义 \( T^*y = z \)。因此,\( \langle Tx, y \rangle_K = \langle x, T^*y \rangle_H \)。

    我们需要验证 \( T^*: K \rightarrow H \) 是线性的和有界的。
    线性性:对于 \( y_1, y_2 \in K \) 和 \( \alpha, \beta \in \mathbb{K} \),
    \[ \langle Tx, \alpha y_1 + \beta y_2 \rangle_K = \bar{\alpha} \langle Tx, y_1 \rangle_K + \bar{\beta} \langle Tx, y_2 \rangle_K = \bar{\alpha} \langle x, T^*y_1 \rangle_H + \bar{\beta} \langle x, T^*y_2 \rangle_H = \langle x, \alpha T^*y_1 + \beta T^*y_2 \rangle_H \]
    另一方面,\( \langle Tx, \alpha y_1 + \beta y_2 \rangle_K = \langle x, T^*(\alpha y_1 + \beta y_2) \rangle_H \)。由 Riesz 表示定理的唯一性,\( T^*(\alpha y_1 + \beta y_2) = \alpha T^*y_1 + \beta T^*y_2 \)。所以 \( T^* \) 是线性的。

    有界性:
    \[ \|T^*y\|_H^2 = \langle T^*y, T^*y \rangle_H = \langle T(T^*y), y \rangle_K \leq \|T(T^*y)\|_K \|y\|_K \leq \|T\| \|T^*y\|_H \|y\|_K \]
    如果 \( T^*y \neq 0 \),则 \( \|T^*y\|_H \leq \|T\| \|y\|_K \)。如果 \( T^*y = 0 \),则不等式显然成立。因此,\( \|T^*y\|_H \leq \|T\| \|y\|_K \),即 \( \|T^*\| \leq \|T\| \)。

    反过来,
    \[ \|Tx\|_K^2 = \langle Tx, Tx \rangle_K = \langle x, T^*Tx \rangle_H \leq \|x\|_H \|T^*Tx\|_H \leq \|x\|_H \|T^*\| \|Tx\|_H \]
    这推导过程有误,应该使用对偶性证明。
    我们已经证明了 \( \|T^*\| \leq \|T\| \)。现在证明 \( \|T\| \leq \|T^*\| \)。
    \[ \|T\| = \sup_{\|x\|_H \leq 1} \|Tx\|_K = \sup_{\|x\|_H \leq 1} \sup_{\|y\|_K \leq 1} |\langle Tx, y \rangle_K| = \sup_{\|x\|_H \leq 1} \sup_{\|y\|_K \leq 1} |\langle x, T^*y \rangle_H| = \sup_{\|y\|_K \leq 1} \sup_{\|x\|_H \leq 1} |\langle x, T^*y \rangle_H| = \sup_{\|y\|_K \leq 1} \|T^*y\|_H = \|T^*\| \]
    因此,\( \|T^*\| = \|T\| \)。

    7.2.3 共轭算子的性质 (Properties of Adjoint Operators)

    Hilbert 空间上的共轭算子具有许多重要的性质,这些性质在算子理论和应用中非常有用。

    定理 7.2.3 (Hilbert 共轭算子的性质)
    设 \( S, T \in B(H, K) \) 和 \( R \in B(K, L) \),\( \alpha \in \mathbb{K} \)。则 Hilbert 共轭算子具有以下性质:
    ① \( (S+T)^* = S^* + T^* \)
    ② \( (\alpha T)^* = \bar{\alpha} T^* \)
    ③ \( (RT)^* = T^*R^* \)
    ④ \( (T^*)^* = T \)
    ⑤ \( I^* = I \) (其中 \( I \) 是恒等算子)
    ⑥ \( \|T^*T\| = \|TT^*\| = \|T\|^2 \)

    证明:
    ① \( \langle x, (S+T)^*y \rangle = \langle (S+T)x, y \rangle = \langle Sx + Tx, y \rangle = \langle Sx, y \rangle + \langle Tx, y \rangle = \langle x, S^*y \rangle + \langle x, T^*y \rangle = \langle x, (S^* + T^*)y \rangle \)。

    ② \( \langle x, (\alpha T)^*y \rangle = \langle (\alpha T)x, y \rangle = \langle \alpha Tx, y \rangle = \alpha \langle Tx, y \rangle = \alpha \langle x, T^*y \rangle = \langle x, \bar{\alpha} T^*y \rangle \)。

    ③ \( \langle x, (RT)^*z \rangle = \langle (RT)x, z \rangle = \langle R(Tx), z \rangle = \langle Tx, R^*z \rangle = \langle x, T^*(R^*z) \rangle = \langle x, (T^*R^*)z \rangle \)。

    ④ \( \langle Tx, y \rangle = \langle x, T^*y \rangle = \overline{\langle T^*y, x \rangle} = \overline{\langle y, (T^*)^*x \rangle} = \langle (T^*)^*x, y \rangle \)。

    ⑤ \( \langle Ix, y \rangle = \langle x, y \rangle = \langle x, Iy \rangle \)。所以 \( I^* = I \)。

    ⑥ \( \|T^*T\| \leq \|T^*\| \|T\| = \|T\|^2 \)。另一方面,\( \|Tx\|^2 = \langle Tx, Tx \rangle = \langle T^*Tx, x \rangle \leq \|T^*Tx\| \|x\| \leq \|T^*T\| \|x\|^2 \)。因此 \( \|T\|^2 = \sup_{\|x\| \leq 1} \|Tx\|^2 \leq \|T^*T\| \)。所以 \( \|T^*T\| = \|T\|^2 \)。同理可证 \( \|TT^*\| = \|T\|^2 \)。

    7.3 自反空间 (Reflexive Space)

    自反空间 (Reflexive Space) 是泛函分析中一类重要的赋范线性空间。自反性与空间的对偶空间结构密切相关,并且在许多理论和应用中都具有重要意义。

    7.3.1 正则嵌入 (Canonical Embedding)

    设 \( X \) 是赋范线性空间,\( X^* \) 是其对偶空间,\( X^{**} = (X^*)^* \) 是 \( X^* \) 的对偶空间,称为 \( X \) 的二次对偶空间 (Second Dual Space)。我们可以定义一个从 \( X \) 到 \( X^{**} \) 的自然映射 \( J: X \rightarrow X^{**} \),称为正则嵌入 (Canonical Embedding)。

    定义 7.3.1 (正则嵌入)
    设 \( X \) 是赋范线性空间。定义正则嵌入 \( J: X \rightarrow X^{**} \) 如下:对于每个 \( x \in X \),定义 \( Jx \) 为 \( X^* \) 上的线性泛函,使得对于所有 \( f \in X^* \),
    \[ (Jx)(f) = f(x) \]

    我们需要验证对于每个 \( x \in X \),\( Jx \) 是 \( X^* \) 上的连续线性泛函,即 \( Jx \in X^{**} \),并且 \( J: X \rightarrow X^{**} \) 是线性有界的。

    定理 7.3.1 (正则嵌入的性质)
    正则嵌入 \( J: X \rightarrow X^{**} \) 是线性的等距同构 (isometric isomorphism) 到 \( J(X) \subseteq X^{**} \)。

    证明:
    线性性:对于 \( x_1, x_2 \in X \) 和 \( \alpha, \beta \in \mathbb{K} \),对于任意 \( f \in X^* \),
    \[ (J(\alpha x_1 + \beta x_2))(f) = f(\alpha x_1 + \beta x_2) = \alpha f(x_1) + \beta f(x_2) = \alpha (Jx_1)(f) + \beta (Jx_2)(f) = (\alpha Jx_1 + \beta Jx_2)(f) \]
    因此 \( J(\alpha x_1 + \beta x_2) = \alpha Jx_1 + \beta Jx_2 \)。所以 \( J \) 是线性的。

    等距性:对于任意 \( x \in X \),我们需要计算 \( \|Jx\|_{X^{**}} \)。根据二次对偶空间的范数定义,
    \[ \|Jx\|_{X^{**}} = \sup_{\|f\|_{X^*} \leq 1} |(Jx)(f)| = \sup_{\|f\|_{X^*} \leq 1} |f(x)| \]
    根据 Hahn-Banach 定理的推论,对于任意 \( x \in X \),存在 \( f_0 \in X^* \) 使得 \( \|f_0\|_{X^*} = 1 \) 且 \( |f_0(x)| = \|x\|_X \)。因此,
    \[ \|Jx\|_{X^{**}} = \sup_{\|f\|_{X^*} \leq 1} |f(x)| \geq |f_0(x)| = \|x\|_X \]
    另一方面,对于任意 \( f \in X^* \),\( |f(x)| \leq \|f\|_{X^*} \|x\|_X \)。因此,\( \sup_{\|f\|_{X^*} \leq 1} |f(x)| \leq \|x\|_X \)。
    综合两方面,得到 \( \|Jx\|_{X^{**}} = \|x\|_X \)。所以 \( J \) 是等距的。

    由于 \( J \) 是等距的,所以 \( J \) 是单射 (injective)。因此,\( J \) 是从 \( X \) 到其像 \( J(X) \subseteq X^{**} \) 的等距同构。

    7.3.2 自反空间的定义 (Definition of Reflexive Space)

    定义 7.3.2 (自反空间)
    赋范线性空间 \( X \) 被称为自反空间 (Reflexive Space),如果正则嵌入 \( J: X \rightarrow X^{**} \) 是满射 (surjective),即 \( J(X) = X^{**} \)。换句话说,对于每个 \( F \in X^{**} \),都存在 \( x \in X \) 使得 \( F = Jx \),即对于所有 \( f \in X^* \),\( F(f) = f(x) \)。

    如果 \( X \) 是自反空间,则正则嵌入 \( J: X \rightarrow X^{**} \) 是等距同构,因此 \( X \) 与 \( X^{**} \) 等距同构。

    7.3.3 自反空间的例子与性质 (Examples and Properties of Reflexive Spaces)

    例 7.3.1 (有限维空间是自反的)
    有限维赋范线性空间都是自反的。如果 \( \dim(X) = n < \infty \),则 \( \dim(X^*) = n \) 且 \( \dim(X^{**}) = n \)。由于 \( J: X \rightarrow X^{**} \) 是单射线性映射,且 \( \dim(X) = \dim(X^{**}) < \infty \),所以 \( J \) 必须是满射。因此,有限维空间是自反的。

    例 7.3.2 ( \( \ell_p \) 和 \( L_p \) 空间 ( \( 1 < p < \infty \) ) 是自反的)
    对于 \( 1 < p < \infty \),我们知道 \( (\ell_p)^* \cong \ell_q \) 和 \( (\ell_q)^* \cong \ell_p \) (其中 \( \frac{1}{p} + \frac{1}{q} = 1 \))。因此 \( (\ell_p)^{**} \cong (\ell_q)^* \cong \ell_p \)。可以证明,正则嵌入 \( J: \ell_p \rightarrow (\ell_p)^{**} \) 实际上就是从 \( \ell_p \) 到 \( (\ell_p)^{**} \cong \ell_p \) 的自然同构。因此,\( \ell_p \) ( \( 1 < p < \infty \) ) 是自反的。
    类似地,对于 \( 1 < p < \infty \),\( (L_p(\mu))^* \cong L_q(\mu) \) 和 \( (L_q(\mu))^* \cong L_p(\mu) \)。因此 \( (L_p(\mu))^{**} \cong (L_q(\mu))^* \cong L_p(\mu) \)。\( L_p(\mu) \) ( \( 1 < p < \infty \) ) 是自反的。

    例 7.3.3 ( \( \ell_1, \ell_\infty, L_1(\mu), L_\infty(\mu), C[a, b] \) 不是自反的)
    \( (\ell_1)^* \cong \ell_\infty \),但 \( (\ell_\infty)^* \neq \ell_1 \)。实际上,\( \ell_1 \) 是 \( (\ell_\infty)^* \) 的真子空间。因此 \( \ell_1 \) 不是自反的。
    \( (L_1(\mu))^* \cong L_\infty(\mu) \),但 \( (L_\infty(\mu))^* \neq L_1(\mu) \)。因此 \( L_1(\mu) \) 不是自反的。
    \( C[a, b] \) 的对偶空间是 Radon 测度空间,而 Radon 测度空间的对偶空间不是 \( C[a, b] \)。因此 \( C[a, b] \) 不是自反的。

    定理 7.3.2 (自反空间的性质)
    ① 如果 \( X \) 是自反的,则 \( X^* \) 也是自反的。
    ② Banach 空间 \( X \) 是自反的当且仅当其单位闭球是弱紧集 (weakly compact)。
    ③ 自反 Banach 空间的闭子空间是自反的。
    ④ 如果 \( Y \) 是自反 Banach 空间,\( T: X \rightarrow Y \) 是有界线性算子,且 \( T \) 是满射,则 \( X \) 不一定是自反的。但是,如果 \( T \) 是同构,且 \( Y \) 是自反的,则 \( X \) 也是自反的。

    自反空间在变分法 (Variational Methods)、优化理论 (Optimization Theory) 和偏微分方程 (Partial Differential Equations) 等领域有重要应用。例如,在求解椭圆型偏微分方程的变分问题时,Sobolev 空间 (Sobolev Spaces) 的自反性是保证弱解 (weak solution) 存在性的关键。

    7.4 弱收敛与弱收敛 (Weak Convergence and Weak Convergence)

    在泛函分析中,除了通常的强收敛 (norm convergence) 外,还有弱收敛 (weak convergence) 和弱收敛 (weak convergence) 等重要的收敛概念。这些弱收敛概念在研究无限维空间中的序列和算子时非常有用。

    7.4.1 弱收敛 (Weak Convergence)

    定义 7.4.1 (弱收敛)
    设 \( X \) 是赋范线性空间,\( \{x_n\}_{n=1}^\infty \) 是 \( X \) 中的序列,\( x \in X \)。称 \( \{x_n\} \) 弱收敛于 \( x \),记为 \( x_n \xrightarrow{w} x \) 或 \( \text{w-}\lim_{n\to\infty} x_n = x \),如果对于每个 \( f \in X^* \),都有 \( \lim_{n\to\infty} f(x_n) = f(x) \)。

    弱收敛的含义是,序列 \( \{x_n\} \) 在每个连续线性泛函 \( f \) 的作用下,其函数值 \( \{f(x_n)\} \) 收敛到 \( f(x) \)。

    定理 7.4.1 (弱收敛的性质)
    ① 如果 \( x_n \rightarrow x \) (强收敛),则 \( x_n \xrightarrow{w} x \) (弱收敛)。
    ② 弱收敛的极限是唯一的。
    ③ 如果 \( x_n \xrightarrow{w} x \),则 \( \{\|x_n\|\} \) 是有界的,且 \( \|x\| \leq \liminf_{n\to\infty} \|x_n\| \)。
    ④ 在有限维空间中,弱收敛等价于强收敛。

    证明:
    ① 如果 \( x_n \rightarrow x \),则对于任意 \( f \in X^* \),\( |f(x_n) - f(x)| = |f(x_n - x)| \leq \|f\| \|x_n - x\| \rightarrow 0 \)。所以 \( f(x_n) \rightarrow f(x) \),即 \( x_n \xrightarrow{w} x \)。

    ② 若 \( x_n \xrightarrow{w} x \) 且 \( x_n \xrightarrow{w} y \)。则对于任意 \( f \in X^* \),\( f(x_n) \rightarrow f(x) \) 且 \( f(x_n) \rightarrow f(y) \)。所以 \( f(x) = f(y) \),即 \( f(x - y) = 0 \)。根据 Hahn-Banach 定理的推论,如果对于所有 \( f \in X^* \),\( f(z) = 0 \),则 \( z = 0 \)。因此 \( x - y = 0 \),即 \( x = y \)。

    ③ 设 \( x_n \xrightarrow{w} x \)。考虑正则嵌入 \( J: X \rightarrow X^{**} \)。则对于每个 \( f \in X^* \),\( (Jx_n)(f) = f(x_n) \rightarrow f(x) = (Jx)(f) \)。这表明序列 \( \{Jx_n\} \) 在 \( X^{**} \) 中点点收敛于 \( Jx \)。根据一致有界原理 (Uniform Boundedness Principle),\( \{\|Jx_n\|_{X^{**}}\} \) 是有界的。由于 \( \|Jx_n\|_{X^{**}} = \|x_n\|_X \),所以 \( \{\|x_n\|\} \) 是有界的。
    为了证明 \( \|x\| \leq \liminf_{n\to\infty} \|x_n\| \),根据 Hahn-Banach 定理,存在 \( f_0 \in X^* \) 使得 \( \|f_0\| = 1 \) 且 \( f_0(x) = \|x\| \)。由于 \( x_n \xrightarrow{w} x \),所以 \( f_0(x_n) \rightarrow f_0(x) = \|x\| \)。因此,\( \|x\| = \lim_{n\to\infty} f_0(x_n) = \lim_{n\to\infty} |f_0(x_n)| \leq \liminf_{n\to\infty} \|f_0\| \|x_n\| = \liminf_{n\to\infty} \|x_n\| \)。

    ④ 在有限维空间中,任何线性泛函都是连续的。如果 \( x_n \xrightarrow{w} x \),则对于每个坐标泛函 \( f_i(x) = x_i \),有 \( f_i(x_n) \rightarrow f_i(x) \),即 \( x_{n, i} \rightarrow x_i \)。因此,\( x_n \) 的每个分量都收敛到 \( x \) 的对应分量。这等价于强收敛。

    7.4.2 弱收敛 (Weak Convergence)

    收敛 (Weak Convergence) 是在对偶空间 \( X^* \) 中定义的收敛概念。

    定义 7.4.2 (弱收敛)
    设 \( X \) 是赋范线性空间,\( X^* \) 是其对偶空间,\( \{f_n\}_{n=1}^\infty \) 是 \( X^* \) 中的序列,\( f \in X^* \)。称 \( \{f_n\} \) 弱
    收敛于 \( f \),记为 \( f_n \xrightarrow{w^*} f \) 或 \( \text{w*-}\lim_{n\to\infty} f_n = f \),如果对于每个 \( x \in X \),都有 \( \lim_{n\to\infty} f_n(x) = f(x) \)。

    弱*收敛的含义是,序列 \( \{f_n\} \) 在每个 \( x \in X \) 的作用下,其函数值 \( \{f_n(x)\} \) 收敛到 \( f(x) \)。

    定理 7.4.2 (弱收敛的性质)
    ① 如果 \( f_n \rightarrow f \) (强收敛于 \( X^* \) ),则 \( f_n \xrightarrow{w^*} f \) (弱
    收敛)。
    ② 弱收敛的极限是唯一的。
    ③ 如果 \( f_n \xrightarrow{w^*} f \),则 \( \{\|f_n\|\} \) 是有界的,且 \( \|f\| \leq \liminf_{n\to\infty} \|f_n\| \)。
    ④ 如果 \( X \) 是自反空间,则 \( X^* \) 中的弱
    收敛等价于弱收敛。

    证明:
    ① 如果 \( f_n \rightarrow f \) 在 \( X^* \) 中,则 \( \|f_n - f\| \rightarrow 0 \)。对于任意 \( x \in X \),\( |f_n(x) - f(x)| = |(f_n - f)(x)| \leq \|f_n - f\| \|x\| \rightarrow 0 \)。所以 \( f_n(x) \rightarrow f(x) \),即 \( f_n \xrightarrow{w^*} f \)。

    ② 若 \( f_n \xrightarrow{w^*} f \) 且 \( f_n \xrightarrow{w^*} g \)。则对于任意 \( x \in X \),\( f_n(x) \rightarrow f(x) \) 且 \( f_n(x) \rightarrow g(x) \)。所以 \( f(x) = g(x) \),即 \( (f - g)(x) = 0 \)。对于所有 \( x \in X \),\( (f - g)(x) = 0 \) 意味着 \( f - g = 0 \),即 \( f = g \)。

    ③ 设 \( f_n \xrightarrow{w^*} f \)。对于每个 \( x \in X \),\( \{f_n(x)\} \) 是收敛的,因此是有界的。根据一致有界原理,\( \{\|f_n\|\} \) 是有界的。类似于弱收敛的证明,可以得到 \( \|f\| \leq \liminf_{n\to\infty} \|f_n\| \)。

    ④ 如果 \( X \) 是自反空间,则 \( X \cong X^{**} \)。\( X^* \) 的弱收敛是指对于每个 \( G \in (X^*)^* = X^{**} \cong X \),\( G(f_n) \rightarrow G(f) \)。由于 \( G \in X^{**} \) 可以表示为 \( G = Jx \) 对于某个 \( x \in X \),所以 \( G(f_n) = (Jx)(f_n) = f_n(x) \) 和 \( G(f) = (Jx)(f) = f(x) \)。因此,弱收敛条件 \( G(f_n) \rightarrow G(f) \) 变为 \( f_n(x) \rightarrow f(x) \),这正是弱*收敛的定义。反之亦然。

    Banach-Alaoglu 定理 (Banach-Alaoglu Theorem) 是关于弱收敛的一个非常重要的定理。它指出,对偶空间 \( X^* \) 中任意有界序列都存在弱收敛的子序列。这个定理在泛函分析和应用中具有广泛的应用。

    定理 7.4.3 (Banach-Alaoglu 定理)
    设 \( X \) 是赋范线性空间。则 \( X^* \) 中任意有界序列都存在弱收敛的子序列。更精确地说,\( X^* \) 的单位闭球在弱拓扑下是紧集 (compact)。

    弱收敛和弱*收敛为我们研究无限维空间提供了有力的工具,特别是在处理算子序列、泛函极值问题以及偏微分方程的弱解等方面。

    8. chapter 8: Banach 空间上的谱理论 (Spectral Theory on Banach Spaces)

    8.1 谱集与预解集 (Spectrum and Resolvent Set)

    在泛函分析 (Functional Analysis) 中,谱理论 (Spectral Theory) 是研究线性算子 (Linear Operator) 的重要分支。它将矩阵特征值 (Eigenvalue) 的概念推广到无限维空间中的算子上,为我们理解和分析 Banach 空间 (Banach Space) 和 Hilbert 空间 (Hilbert Space) 上的线性算子提供了强大的工具。本节首先介绍谱集 (Spectrum) 与预解集 (Resolvent Set) 的基本概念。

    设 \( X \) 是复 Banach 空间 (complex Banach space),\( T: X \to X \) 是有界线性算子 (Bounded Linear Operator)。我们考虑算子 \( \lambda I - T \),其中 \( \lambda \in \mathbb{C} \) 是复数,\( I \) 是 \( X \) 上的恒等算子 (Identity Operator)。

    定义 8.1.1 (预解集与谱集)

    算子 \( T \) 的预解集 (resolvent set),记为 \( \rho(T) \),定义为所有使得 \( \lambda I - T \) 是双射 (bijective) 且其逆算子 \( (\lambda I - T)^{-1} \) 是有界线性算子 (bounded linear operator) 的复数 \( \lambda \) 的集合。

    算子 \( T \) 的谱集 (spectrum),记为 \( \sigma(T) \),定义为复平面 \( \mathbb{C} \) 中预解集 \( \rho(T) \) 的补集,即 \( \sigma(T) = \mathbb{C} \setminus \rho(T) \)。

    对于 \( \lambda \in \rho(T) \),算子 \( R_\lambda(T) = (\lambda I - T)^{-1} \) 称为 \( T \) 的 预解算子 (resolvent operator)

    注:

    ⚝ 根据有界逆定理 (Bounded Inverse Theorem),如果 \( \lambda I - T \) 是双射,则其逆算子 \( (\lambda I - T)^{-1} \) 必然是有界的。因此,预解集 \( \rho(T) \) 可以等价地定义为所有使得 \( \lambda I - T \) 是双射的复数 \( \lambda \) 的集合。
    ⚝ 谱集 \( \sigma(T) \) 描述了算子 \( T \) 的“奇异性”。当 \( \lambda \in \sigma(T) \) 时,算子 \( \lambda I - T \) 不是双射,这意味着它要么不是单射 (injective),要么不是满射 (surjective),或者两者都不是。

    为了更深入地理解谱集,我们将其进一步细分为三个部分:点谱 (Point Spectrum)、连续谱 (Continuous Spectrum) 和剩余谱 (Residual Spectrum)。

    定义 8.1.2 (点谱、连续谱、剩余谱)

    算子 \( T \) 的谱集 \( \sigma(T) \) 可以分解为三个互不相交的集合:

    点谱 (point spectrum) \( \sigma_p(T) \):由所有使得 \( \lambda I - T \) 不是单射的 \( \lambda \in \mathbb{C} \) 组成。换句话说,\( \lambda \in \sigma_p(T) \) 当且仅当存在非零向量 \( x \in X \) 使得 \( (\lambda I - T)x = 0 \),即 \( Tx = \lambda x \)。点谱 \( \sigma_p(T) \) 中的元素称为 \( T \) 的特征值 (eigenvalue),对应的非零向量 \( x \) 称为特征向量 (eigenvector)
    连续谱 (continuous spectrum) \( \sigma_c(T) \):由所有使得 \( \lambda I - T \) 是单射但值域 \( \text{Range}(\lambda I - T) \) 在 \( X \) 中稠密但不等于 \( X \) 的 \( \lambda \in \mathbb{C} \) 组成。
    剩余谱 (residual spectrum) \( \sigma_r(T) \):由所有使得 \( \lambda I - T \) 是单射但值域 \( \text{Range}(\lambda I - T) \) 在 \( X \) 中不稠密的 \( \lambda \in \mathbb{C} \) 组成。

    因此,我们有谱集的分解:
    \[ \sigma(T) = \sigma_p(T) \cup \sigma_c(T) \cup \sigma_r(T) \]
    并且这三个集合两两不相交。

    定理 8.1.3 (预解集的性质)

    设 \( T \in B(X) \),其中 \( B(X) \) 表示 \( X \) 上有界线性算子全体构成的 Banach 空间。则:

    ① 预解集 \( \rho(T) \) 是复平面 \( \mathbb{C} \) 中的开集 (open set)。谱集 \( \sigma(T) \) 是复平面 \( \mathbb{C} \) 中的闭集 (closed set)。

    ② 预解集 \( \rho(T) \) 是无界的 (unbounded)。谱集 \( \sigma(T) \) 是有界的 (bounded) 且非空 (non-empty) 的紧集 (compact set)。

    ③ 预解算子 \( R_\lambda(T) = (\lambda I - T)^{-1} \) 在 \( \rho(T) \) 上是解析的 (analytic)。对于 \( \lambda, \mu \in \rho(T) \),预解方程 (resolvent equation) 成立:
    \[ R_\lambda(T) - R_\mu(T) = (\mu - \lambda) R_\lambda(T) R_\mu(T) \]
    也等价于
    \[ R_\lambda(T) - R_\mu(T) = (\mu - \lambda) R_\mu(T) R_\lambda(T) \]

    证明概要:

    ① 要证明 \( \rho(T) \) 是开集,只需证明若 \( \lambda_0 \in \rho(T) \),则存在 \( \delta > 0 \) 使得当 \( |\lambda - \lambda_0| < \delta \) 时,\( \lambda \in \rho(T) \)。利用 Neumann 级数 (Neumann series) 展开 \( \lambda I - T = (\lambda_0 I - T) - (\lambda_0 - \lambda) I = (\lambda_0 I - T) [I - (\lambda_0 - \lambda) (\lambda_0 I - T)^{-1}] \)。当 \( |\lambda - \lambda_0| \) 足够小时,\( \| (\lambda_0 - \lambda) (\lambda_0 I - T)^{-1} \| < 1 \),从而 \( [I - (\lambda_0 - \lambda) (\lambda_0 I - T)^{-1}]^{-1} \) 存在且有界,因此 \( (\lambda I - T)^{-1} \) 存在且有界。由于 \( \sigma(T) = \mathbb{C} \setminus \rho(T) \),所以 \( \sigma(T) \) 是闭集。

    ② 考虑 \( |\lambda| > \|T\| \)。此时,\( \lambda I - T = \lambda (I - \frac{1}{\lambda} T) \)。由于 \( \| \frac{1}{\lambda} T \| = \frac{\|T\|}{|\lambda|} < 1 \),所以 \( (I - \frac{1}{\lambda} T)^{-1} \) 存在且有界,从而 \( (\lambda I - T)^{-1} = \frac{1}{\lambda} (I - \frac{1}{\lambda} T)^{-1} \) 存在且有界。因此,当 \( |\lambda| > \|T\| \) 时,\( \lambda \in \rho(T) \)。这表明 \( \rho(T) \) 是无界的,且 \( \sigma(T) \subseteq \{ \lambda \in \mathbb{C} : |\lambda| \leq \|T\| \} \),所以 \( \sigma(T) \) 是有界的。要证明 \( \sigma(T) \) 非空,需要用到更深入的理论,例如 Gelfand-Mazur 定理 (Gelfand-Mazur Theorem) 或考虑预解算子的 Laurent 级数展开 (Laurent series expansion)。由于 \( \sigma(T) \) 是有界闭集,所以是紧集。

    ③ 预解算子的解析性可以通过对其级数展开进行分析得到。预解方程可以通过直接计算 \( R_\lambda(T) - R_\mu(T) \) 得到。
    \[ R_\lambda(T) - R_\mu(T) = (\lambda I - T)^{-1} - (\mu I - T)^{-1} = (\lambda I - T)^{-1} [(\mu I - T) - (\lambda I - T)] (\mu I - T)^{-1} = (\lambda I - T)^{-1} (\mu - \lambda) I (\mu I - T)^{-1} = (\mu - \lambda) R_\lambda(T) R_\mu(T) \]
    同理可证另一个形式。

    例子 8.1.4 (有限维空间)

    设 \( X = \mathbb{C}^n \),\( T \) 是 \( X \) 上的线性算子,可以表示为 \( n \times n \) 矩阵。则 \( \lambda \in \sigma(T) \) 当且仅当 \( \det(\lambda I - T) = 0 \)。因此,\( \sigma(T) \) 正是矩阵 \( T \) 的所有特征值组成的集合,即 \( \sigma(T) = \sigma_p(T) \)。在有限维空间中,连续谱和剩余谱为空集,即 \( \sigma_c(T) = \sigma_r(T) = \emptyset \)。

    例子 8.1.5 (乘法算子)

    设 \( X = L^2[0, 1] \),定义乘法算子 \( T: X \to X \) 为 \( (Tf)(x) = xf(x) \)。我们来确定 \( T \) 的谱集。

    考虑算子 \( \lambda I - T \),即 \( ((\lambda I - T)f)(x) = (\lambda - x) f(x) \)。

    点谱 \( \sigma_p(T) \):若 \( \lambda \in \sigma_p(T) \),则存在非零 \( f \in L^2[0, 1] \) 使得 \( (\lambda - x) f(x) = 0 \) 几乎处处成立。这意味着 \( f(x) = 0 \) 几乎处处成立,除非 \( x = \lambda \)。但对于固定的 \( \lambda \),集合 \( \{ \lambda \} \) 的 Lebesgue 测度为零,因此 \( f(x) \) 只能在测度为零的集合上非零,这与 \( f \in L^2[0, 1] \) 非零矛盾。因此,\( \sigma_p(T) = \emptyset \)。

    预解集 \( \rho(T) \):对于 \( \lambda \notin [0, 1] \),算子 \( (\lambda I - T)^{-1} \) 存在,且为乘法算子 \( (R_\lambda(T)g)(x) = \frac{1}{\lambda - x} g(x) \)。由于 \( \lambda \notin [0, 1] \),函数 \( \frac{1}{\lambda - x} \) 在 \( [0, 1] \) 上有界,因此 \( R_\lambda(T) \) 是 \( L^2[0, 1] \) 上的有界线性算子。所以,\( \mathbb{C} \setminus [0, 1] \subseteq \rho(T) \)。

    谱集 \( \sigma(T) \):对于 \( \lambda \in [0, 1] \),算子 \( \lambda I - T \) 是单射的,因为若 \( (\lambda - x) f(x) = 0 \) 几乎处处成立,则 \( f(x) = 0 \) 几乎处处成立。但是,\( \lambda I - T \) 不是满射的。考虑函数 \( g(x) = 1 \)。若存在 \( f \in L^2[0, 1] \) 使得 \( (\lambda - x) f(x) = 1 \),则 \( f(x) = \frac{1}{\lambda - x} \)。当 \( x \to \lambda \) 时,\( |f(x)| \to \infty \)。若 \( \lambda \in (0, 1) \),则 \( f(x) = \frac{1}{\lambda - x} \notin L^2[0, 1] \)。若 \( \lambda = 0 \) 或 \( \lambda = 1 \),同样 \( f(x) \notin L^2[0, 1] \)。因此,\( \text{Range}(\lambda I - T) \neq L^2[0, 1] \)。
    实际上,可以证明 \( \text{Range}(\lambda I - T) \) 在 \( L^2[0, 1] \) 中稠密。因此,对于 \( \lambda \in [0, 1] \),\( \lambda \in \sigma_c(T) \)。

    综上所述,对于乘法算子 \( T \) ,\( \sigma_p(T) = \emptyset \),\( \sigma_c(T) = [0, 1] \),\( \sigma_r(T) = \emptyset \),\( \sigma(T) = [0, 1] \)。

    总结:

    本节介绍了谱集与预解集的基本概念,以及谱集的分解。谱集是描述算子性质的重要工具,预解集是谱集的补集,预解算子在预解集上解析。通过例子,我们了解了有限维空间和无限维空间中谱集的不同表现形式。在有限维空间中,谱集就是点谱,而在无限维空间中,谱集可能包含连续谱和剩余谱。

    8.2 谱半径公式 (Spectral Radius Formula)

    定义 8.2.1 (谱半径)

    有界线性算子 \( T \in B(X) \) 的谱半径 (spectral radius),记为 \( r(T) \),定义为谱集 \( \sigma(T) \) 的半径,即
    \[ r(T) = \sup \{ |\lambda| : \lambda \in \sigma(T) \} \]

    由于谱集 \( \sigma(T) \) 是非空紧集,谱半径总是有限且非负的。谱半径公式给出了谱半径与算子范数 (operator norm) 之间的深刻联系。

    定理 8.2.2 (谱半径公式)

    设 \( X \) 是复 Banach 空间,\( T \in B(X) \)。则 \( T \) 的谱半径 \( r(T) \) 由以下公式给出:
    \[ r(T) = \lim_{n \to \infty} \|T^n\|^{1/n} = \inf_{n \geq 1} \|T^n\|^{1/n} \]

    证明概要:

    首先,我们证明 \( r(T) \leq \liminf_{n \to \infty} \|T^n\|^{1/n} \)。
    对于 \( |\lambda| > \|T\| \),我们知道 \( \lambda \in \rho(T) \)。更一般地,如果 \( |\lambda| > \limsup_{n \to \infty} \|T^n\|^{1/n} \),我们可以证明 \( \lambda \in \rho(T) \)。
    考虑级数 \( \sum_{n=0}^\infty \frac{T^n}{\lambda^{n+1}} \)。当 \( |\lambda| > \limsup_{n \to \infty} \|T^n\|^{1/n} \) 时,级数收敛。可以验证,该级数的和就是 \( (\lambda I - T)^{-1} \),因此 \( \lambda \in \rho(T) \)。
    这表明 \( \sigma(T) \subseteq \{ \lambda \in \mathbb{C} : |\lambda| \leq \limsup_{n \to \infty} \|T^n\|^{1/n} \} \),从而 \( r(T) \leq \limsup_{n \to \infty} \|T^n\|^{1/n} \)。

    其次,我们证明 \( r(T) \geq \limsup_{n \to \infty} \|T^n\|^{1/n} \)。
    假设存在 \( \lambda_0 \in \sigma(T) \) 使得 \( |\lambda_0| = r(T) \)。考虑预解算子 \( R_\lambda(T) = (\lambda I - T)^{-1} \) 在 \( \rho(T) \) 上的解析性。可以证明,对于任意有界线性泛函 (bounded linear functional) \( x^* \in X^* \) 和向量 \( x \in X \),函数 \( f(\lambda) = x^*(R_\lambda(T)x) \) 在 \( \rho(T) \) 上解析。将 \( R_\lambda(T) \) 展开为 Laurent 级数:
    \[ R_\lambda(T) = (\lambda I - T)^{-1} = \frac{1}{\lambda} (I - \frac{T}{\lambda})^{-1} = \sum_{n=0}^\infty \frac{T^n}{\lambda^{n+1}} \]
    当 \( |\lambda| > r(T) \) 时,级数收敛。若 \( |\lambda| > r(T) \),则 \( \lambda \in \rho(T) \)。
    如果 \( r(T) > \limsup_{n \to \infty} \|T^n\|^{1/n} \),则存在 \( \epsilon > 0 \) 和子序列 \( \{n_k\} \) 使得 \( \|T^{n_k}\|^{1/n_k} \leq r(T) - \epsilon \)。这意味着对于足够大的 \( |\lambda| \),级数 \( \sum_{n=0}^\infty \frac{T^n}{\lambda^{n+1}} \) 在 \( |\lambda| > r(T) - \epsilon \) 上收敛,这与 \( r(T) \) 是谱半径矛盾。
    因此,必须有 \( r(T) \geq \limsup_{n \to \infty} \|T^n\|^{1/n} \)。

    综合以上两部分,我们得到 \( r(T) = \lim_{n \to \infty} \|T^n\|^{1/n} \)。
    最后,利用次可加性 (subadditivity) 的性质可以证明 \( \lim_{n \to \infty} \|T^n\|^{1/n} = \inf_{n \geq 1} \|T^n\|^{1/n} \)。

    推论 8.2.3

    对于正规算子 (normal operator) \( T \) 在 Hilbert 空间 (Hilbert space) \( H \) 上,谱半径等于算子范数,即 \( r(T) = \|T\| \)。

    证明概要:

    对于 Hilbert 空间上的正规算子 \( T \),我们有 \( \|T^2\| = \|T\|^2 \)。进一步可以证明 \( \|T^{2^k}\| = \|T\|^{2^k} \)。
    因此,\( r(T) = \lim_{k \to \infty} \|T^{2^k}\|^{1/2^k} = \lim_{k \to \infty} (\|T\|^{2^k})^{1/2^k} = \|T\| \)。

    例子 8.2.4 (谱半径计算)

    考虑矩阵 \( T = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix} \) 在 \( \mathbb{C}^2 \) 上。
    \( T^2 = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix} \),\( T^n = 0 \) for \( n \geq 2 \)。
    因此,\( \|T^n\| = 0 \) for \( n \geq 2 \)。
    \( r(T) = \lim_{n \to \infty} \|T^n\|^{1/n} = \lim_{n \to \infty} 0^{1/n} = 0 \)。
    矩阵 \( T \) 的特征方程为 \( \det(\lambda I - T) = \det \begin{pmatrix} \lambda & -1 \\ 0 & \lambda \end{pmatrix} = \lambda^2 = 0 \)。特征值为 \( \lambda = 0 \) (重根)。谱集 \( \sigma(T) = \{0\} \),谱半径 \( r(T) = 0 \)。
    \( \|T\| = \sup_{\|x\|=1} \|Tx\| = 1 \)。可见,对于非正规算子,谱半径可以严格小于算子范数。

    总结:

    谱半径公式 \( r(T) = \lim_{n \to \infty} \|T^n\|^{1/n} = \inf_{n \geq 1} \|T^n\|^{1/n} \) 是谱理论中的重要结果,它建立了谱半径与算子迭代范数之间的联系。对于正规算子,谱半径等于算子范数。谱半径公式在估计谱集范围和分析算子性质中起着关键作用。

    8.3 Banach 代数初步 (Introduction to Banach Algebras)

    定义 8.3.1 (Banach 代数)

    Banach 代数 (Banach algebra) \( \mathcal{A} \) 是一个复 Banach 空间 (complex Banach space),同时也是一个代数 (algebra),并且代数的乘法运算 \( (x, y) \mapsto xy \) 满足以下条件:

    结合律 (associativity):\( (xy)z = x(yz) \) 对所有 \( x, y, z \in \mathcal{A} \) 成立。
    双线性 (bilinearity):\( (\alpha x + \beta y)z = \alpha(xz) + \beta(yz) \) 和 \( x(\alpha y + \beta z) = \alpha(xy) + \beta(xz) \) 对所有 \( x, y, z \in \mathcal{A} \) 和 \( \alpha, \beta \in \mathbb{C} \) 成立。
    范数不等式 (norm inequality):\( \|xy\| \leq \|x\| \|y\| \) 对所有 \( x, y \in \mathcal{A} \) 成立。

    如果 Banach 代数 \( \mathcal{A} \) 还包含一个单位元 (identity element) \( e \) (即存在 \( e \in \mathcal{A} \) 使得 \( ex = xe = x \) 对所有 \( x \in \mathcal{A} \) 成立),并且 \( \|e\| = 1 \),则称 \( \mathcal{A} \) 为单位 Banach 代数 (unital Banach algebra)

    例子 8.3.2 (Banach 代数的例子)

    复数域 (complex field) \( \mathbb{C} \):复数域 \( \mathbb{C} \) 在通常的加法、乘法和绝对值范数下构成单位 Banach 代数。单位元是 \( 1 \),\( \|1\| = 1 \)。

    有界线性算子代数 (algebra of bounded linear operators) \( B(X) \):设 \( X \) 是复 Banach 空间,\( B(X) \) 是 \( X \) 上所有有界线性算子构成的空间。在算子的加法、复合 (作为乘法) 和算子范数下,\( B(X) \) 构成单位 Banach 代数。单位元是恒等算子 \( I \),\( \|I\| = 1 \)。这是泛函分析中最重要的 Banach 代数之一。

    连续函数代数 (algebra of continuous functions) \( C(K) \):设 \( K \) 是紧 Hausdorff 空间,\( C(K) \) 是 \( K \) 上所有复值连续函数构成的空间。在逐点加法、逐点乘法和上确界范数 (supremum norm) \( \|f\|_\infty = \sup_{x \in K} |f(x)| \) 下,\( C(K) \) 构成单位 Banach 代数。单位元是常数函数 \( e(x) = 1 \),\( \|e\|_\infty = 1 \)。

    群代数 (group algebra) \( L^1(G) \):设 \( G \) 是局部紧拓扑群 (locally compact topological group),\( L^1(G) \) 是 \( G \) 上关于 Haar 测度 (Haar measure) 的 Lebesgue 可积函数空间。在通常的加法和卷积 (convolution) 作为乘法,以及 \( L^1 \) 范数下,\( L^1(G) \) 构成 Banach 代数。如果 \( G \) 是离散群 (discrete group),则 \( L^1(G) \) 有单位元当且仅当 \( G \) 是单位群 (trivial group) \( \{e\} \)。

    定义 8.3.3 (可逆元与谱集)

    设 \( \mathcal{A} \) 是单位 Banach 代数,单位元为 \( e \)。元素 \( x \in \mathcal{A} \) 称为可逆的 (invertible),如果存在 \( y \in \mathcal{A} \) 使得 \( xy = yx = e \)。这样的 \( y \) 是唯一的,称为 \( x \) 的逆元 (inverse),记为 \( x^{-1} \)。

    对于 \( x \in \mathcal{A} \),定义 \( x \) 的谱集 (spectrum) \( \sigma(x) \) 为:
    \[ \sigma(x) = \{ \lambda \in \mathbb{C} : \lambda e - x \text{ 不可逆} \} \]
    预解集 (resolvent set) \( \rho(x) = \mathbb{C} \setminus \sigma(x) \)。
    预解元 (resolvent) \( R_\lambda(x) = (\lambda e - x)^{-1} \) 对于 \( \lambda \in \rho(x) \)。
    谱半径 (spectral radius) \( r(x) = \sup \{ |\lambda| : \lambda \in \sigma(x) \} \)。

    定理 8.3.4 (Banach 代数中可逆元的性质)

    设 \( \mathcal{A} \) 是单位 Banach 代数。

    ① 若 \( \|x\| < 1 \),则 \( e - x \) 可逆,且 \( (e - x)^{-1} = \sum_{n=0}^\infty x^n \) (Neumann 级数)。

    ② 可逆元集合 \( \text{Inv}(\mathcal{A}) \) 是 \( \mathcal{A} \) 中的开集。逆运算 \( x \mapsto x^{-1} \) 在 \( \text{Inv}(\mathcal{A}) \) 上是连续的。

    ③ 对于任何 \( x \in \mathcal{A} \),谱集 \( \sigma(x) \) 是非空紧集,且 \( r(x) = \lim_{n \to \infty} \|x^n\|^{1/n} \leq \|x\| \)。

    证明概要:

    ① 当 \( \|x\| < 1 \) 时,Neumann 级数 \( \sum_{n=0}^\infty x^n \) 在 Banach 空间 \( \mathcal{A} \) 中绝对收敛,设其和为 \( y = \sum_{n=0}^\infty x^n \)。可以验证 \( (e - x)y = y(e - x) = e \),因此 \( e - x \) 可逆,且逆元为 \( y \)。

    ② 利用逆元的 Neumann 级数表示和扰动理论可以证明可逆元集合是开集,逆运算是连续的。

    ③ 谱集 \( \sigma(x) \) 的性质和谱半径公式的证明与有界线性算子的情形类似,可以将 Banach 代数中的元素看作抽象的“算子”。

    例子 8.3.5 ( \( C(K) \) 中的谱集)

    设 \( \mathcal{A} = C(K) \),\( f \in C(K) \)。则 \( \lambda e - f \) 可逆当且仅当函数 \( \lambda - f(x) \) 在 \( K \) 上处处非零,即 \( f(x) \neq \lambda \) 对所有 \( x \in K \) 成立。此时,\( (\lambda e - f)^{-1} = \frac{1}{\lambda - f} \),即 \( (\lambda e - f)^{-1}(x) = \frac{1}{\lambda - f(x)} \)。
    因此,\( \sigma(f) = \{ \lambda \in \mathbb{C} : \lambda e - f \text{ 不可逆} \} = \{ \lambda \in \mathbb{C} : \exists x \in K, f(x) = \lambda \} = f(K) \),即 \( f \) 的谱集就是函数 \( f \) 的值域 (range)。
    谱半径 \( r(f) = \sup \{ |\lambda| : \lambda \in \sigma(f) \} = \sup \{ |\lambda| : \lambda \in f(K) \} = \sup_{x \in K} |f(x)| = \|f\|_\infty \)。
    在 \( C(K) \) 中,谱半径等于范数。

    总结:

    本节初步介绍了 Banach 代数的概念,给出了 Banach 代数的定义和一些重要例子,如 \( B(X) \) 和 \( C(K) \)。定义了 Banach 代数中元素的可逆性、谱集、预解集和谱半径,并讨论了可逆元和谱集的基本性质。Banach 代数为研究谱理论提供了一个更抽象和更广泛的框架。在 Banach 代数框架下讨论谱理论,可以更深刻地理解算子的谱性质。

    9. chapter 9: Hilbert 空间上的谱理论 (Spectral Theory on Hilbert Spaces)

    9.1 Hilbert 空间上的谱定理 (Spectral Theorem on Hilbert Spaces)

    谱定理 (Spectral Theorem) 是泛函分析,特别是 Hilbert 空间理论中的基石。它将线性算子的结构与其谱 (spectrum) 联系起来,为研究 Hilbert 空间上的算子提供了强大的工具。对于不同类型的算子,谱定理有不同的形式,但其核心思想都是将算子分解为更简单的、易于理解的形式,例如对角化或者积分表示。

    谱定理的重要性体现在以下几个方面:

    算子结构刻画: 谱定理揭示了 Hilbert 空间上某些重要类型的算子(如自伴算子、酉算子、正常算子)的内在结构,表明这些算子可以通过谱测度 (spectral measure) 或积分来表示。这使得我们可以从谱的角度来理解和分析算子的性质。

    计算与应用: 谱定理为计算算子的函数、解决算子方程等问题提供了理论基础和方法。例如,通过谱定理可以定义算子的函数演算 (functional calculus),从而可以计算如 \( \sqrt{T} \), \( e^T \) 等复杂的算子表达式。在量子力学、信号处理、偏微分方程等领域,谱定理都有着广泛的应用。

    理论延伸: 谱定理是进一步研究算子代数、非交换几何等高级主题的出发点。它启发了人们将谱的概念推广到更一般的代数结构,例如 C*-代数和 von Neumann 代数。

    本节将介绍 Hilbert 空间上谱定理的几种重要形式,并重点讨论有界自伴算子和有界正常算子的谱定理。

    9.1.1 有界自伴算子的谱定理 (Spectral Theorem for Bounded Self-Adjoint Operators)

    对于 Hilbert 空间 \(H\) 上的有界自伴算子 \(T: H \to H\),谱定理的一种形式是谱测度形式。为了理解谱测度形式,我们首先回顾一些基本概念。

    定义 9.1.1 (投影算子, Projection Operator) Hilbert 空间 \(H\) 上的一个有界线性算子 \(P: H \to H\) 被称为投影算子 (projection operator)正交投影 (orthogonal projection),如果它满足以下两个条件:

    (i) \(P^2 = P\) (幂等性, idempotent)
    (ii) \(P^* = P\) (自伴性, self-adjoint)

    投影算子 \(P\) 的值域 \(R(P)\) 是 \(H\) 的闭子空间,并且 \(P\) 是到 \(R(P)\) 上的正交投影。反之,对于 \(H\) 的任一闭子空间 \(M\),都存在唯一的正交投影 \(P_M\) 使得 \(R(P_M) = M\)。

    谱测度 (Spectral Measure) 是谱定理的关键概念。粗略地说,谱测度是将 Borel 集 (Borel set) 映射到投影算子的映射,它描述了谱分解中不同谱成分的“大小”。

    定义 9.1.2 (谱测度, Spectral Measure) 设 \((\Omega, \mathcal{B})\) 是一个可测空间,其中 \(\Omega \subseteq \mathbb{R}\) 是实数集的一个 Borel 子集,\(\mathcal{B}\) 是 \(\Omega\) 上的 Borel \(\sigma\)-代数。一个谱测度 (spectral measure) 是一个映射 \(E: \mathcal{B} \to \mathcal{B}(H)\),其中 \(\mathcal{B}(H)\) 表示 Hilbert 空间 \(H\) 上有界线性算子的集合,满足以下性质:

    (i) 对于任意 \( \Delta \in \mathcal{B} \),\(E(\Delta)\) 是投影算子。
    (ii) \(E(\emptyset) = 0\), \(E(\Omega) = I\),其中 \(0\) 是零算子,\(I\) 是恒等算子。
    (iii) 若 \(\Delta_1, \Delta_2, \dots\) 是 \(\mathcal{B}\) 中互不相交的集合,则对于任意 \(x \in H\),有
    \[ E\left(\bigcup_{n=1}^\infty \Delta_n\right) x = \sum_{n=1}^\infty E(\Delta_n) x \]
    (强可数可加性, strong countable additivity)。
    (iv) \(E(\Delta_1 \cap \Delta_2) = E(\Delta_1) E(\Delta_2)\) (乘法性, multiplicativity)。

    定理 9.1.1 (有界自伴算子的谱定理 - 谱测度形式) 设 \(T\) 是 Hilbert 空间 \(H\) 上的有界自伴算子。则存在唯一的定义在 \( \sigma(T) \) 的 Borel 集上谱测度 \(E\),使得对于任意 \(x, y \in H\),有
    \[ \langle Tx, y \rangle = \int_{\sigma(T)} \lambda d\langle E(\lambda)x, y \rangle \]
    更简洁地,我们可以将算子 \(T\) 表示为谱积分 (spectral integral):
    \[ T = \int_{\sigma(T)} \lambda dE(\lambda) \]
    其中 \( \sigma(T) \) 是算子 \(T\) 的谱集 (spectrum)。

    这个定理表明,任何有界自伴算子都可以通过关于其谱测度的积分来表示。谱测度 \(E\) 将谱集 \( \sigma(T) \) 分解成一系列投影算子,而积分则将这些投影算子“加权求和”,权重为谱值 \( \lambda \)。

    9.1.2 有界正常算子的谱定理 (Spectral Theorem for Bounded Normal Operators)

    定义 9.1.3 (正常算子, Normal Operator) Hilbert 空间 \(H\) 上的有界线性算子 \(N: H \to H\) 被称为正常算子 (normal operator),如果它与它的伴随算子 \(N^*\) 可交换,即 \(NN^* = N^*N\)。

    自伴算子和酉算子都是正常算子的特例。谱定理也可以推广到有界正常算子。对于正常算子,谱测度需要定义在复平面 \(\mathbb{C}\) 的 Borel 集上,因为正常算子的谱可以是复数。

    定理 9.1.2 (有界正常算子的谱定理 - 谱测度形式) 设 \(N\) 是 Hilbert 空间 \(H\) 上的有界正常算子。则存在唯一的定义在 \( \sigma(N) \) 的 Borel 集上谱测度 \(E\),使得对于任意 \(x, y \in H\),有
    \[ \langle Nx, y \rangle = \int_{\sigma(N)} \lambda d\langle E(\lambda)x, y \rangle \]
    或者简洁地,
    \[ N = \int_{\sigma(N)} \lambda dE(\lambda) \]
    其中 \( \sigma(N) \) 是算子 \(N\) 的谱集,现在 \( \sigma(N) \subseteq \mathbb{C} \)。

    与自伴算子的谱定理类似,正常算子的谱定理也表明正常算子可以通过关于其谱测度的积分来表示。

    9.1.3 乘法算子形式的谱定理 (Multiplication Operator Form of Spectral Theorem)

    谱定理的另一种重要形式是乘法算子形式,它将算子酉等价于某个 \(L^2\) 空间上的乘法算子。这种形式更加具体和直观,有助于理解谱定理的意义。

    定理 9.1.3 (有界自伴算子的谱定理 - 乘法算子形式) 设 \(T\) 是可分 Hilbert 空间 \(H\) 上的有界自伴算子。则存在一个测度空间 \((\Omega, \mu)\) 和一个酉算子 \(U: H \to L^2(\Omega, \mu)\),以及一个实值有界可测函数 \(f: \Omega \to \mathbb{R}\),使得
    \[ (UTU^{-1}g)(\omega) = f(\omega) g(\omega), \quad \forall g \in L^2(\Omega, \mu) \]
    几乎处处成立。换句话说,\(T\) 酉等价于 \(L^2(\Omega, \mu)\) 上的乘法算子 \(M_f\),其中 \(M_f g = f \cdot g\)。

    对于有界正常算子,乘法算子形式的谱定理类似,只是函数 \(f\) 可以是复值有界可测函数。

    定理 9.1.4 (有界正常算子的谱定理 - 乘法算子形式) 设 \(N\) 是可分 Hilbert 空间 \(H\) 上的有界正常算子。则存在一个测度空间 \((\Omega, \mu)\) 和一个酉算子 \(U: H \to L^2(\Omega, \mu)\),以及一个复值有界可测函数 \(f: \Omega \to \mathbb{C}\),使得
    \[ (UNU^{-1}g)(\omega) = f(\omega) g(\omega), \quad \forall g \in L^2(\Omega, \mu) \]
    几乎处处成立。

    乘法算子形式的谱定理表明,通过酉变换,我们可以将一个抽象的自伴算子或正常算子转化为一个具体的乘法算子,这大大简化了对算子的分析。函数 \(f\) 在某种意义上代表了算子的“谱”,而测度空间 \((\Omega, \mu)\) 则提供了谱的“载体”。

    9.1.4 紧自伴算子的谱定理 (Spectral Theorem for Compact Self-Adjoint Operators)

    对于紧自伴算子,谱定理有更简洁和更易于理解的形式,即特征值分解形式

    定理 9.1.5 (紧自伴算子的谱定理 - 特征值分解形式) 设 \(T\) 是可分 Hilbert 空间 \(H\) 上的紧自伴算子。则存在 \(T\) 的至多可数个非零特征值 \( \{\lambda_n\}_{n=1}^N \) (其中 \(N\) 可以是有限的或无限的),以及对应的单位正交特征向量 \( \{e_n\}_{n=1}^N \),使得对于任意 \(x \in H\),有
    \[ Tx = \sum_{n=1}^N \lambda_n \langle x, e_n \rangle e_n \]
    如果 \(T\) 的值域 \(R(T)\) 是无限维的,则 \( \{\lambda_n\}_{n=1}^\infty \) 是一个收敛到 0 的序列。此外,\(H\) 可以分解为
    \[ H = \overline{\text{span}\{e_n\}_{n=1}^N} \oplus \text{Ker}(T) \]
    其中 \(\text{Ker}(T)\) 是 \(T\) 的核空间 (kernel space),即零特征值对应的特征空间。

    这个定理表明,紧自伴算子可以被完全由其特征值和特征向量所决定。算子 \(T\) 的作用可以看作是在特征向量方向上的缩放,缩放因子为对应的特征值。这种分解形式类似于有限维线性代数中对称矩阵的对角化。

    总结: 谱定理是 Hilbert 空间算子理论的核心内容,它有多种等价形式,包括谱测度形式、乘法算子形式和特征值分解形式(对于紧自伴算子)。谱定理为我们理解和分析 Hilbert 空间上的算子提供了深刻的洞察和强大的工具。

    9.2 正常算子、自伴算子与酉算子 (Normal Operators, Self-Adjoint Operators and Unitary Operators)

    在 Hilbert 空间算子理论中,正常算子 (normal operator)自伴算子 (self-adjoint operator)酉算子 (unitary operator) 是三种非常重要的算子类型。它们在数学物理、量子力学、信号处理等领域都有广泛的应用。本节将深入探讨这三种算子的定义、性质以及它们之间的关系。

    9.2.1 正常算子 (Normal Operators)

    定义 9.2.1 (正常算子, Normal Operator) Hilbert 空间 \(H\) 上的有界线性算子 \(N: H \to H\) 被称为正常算子 (normal operator),如果它与它的伴随算子 \(N^*\) 可交换,即
    \[ NN^* = N^*N \]

    正常算子的定义非常简洁,但它包含了非常广泛的一类算子。自伴算子和酉算子都是正常算子的特例,将在后面详细说明。

    正常算子的性质:

    谱定理: 正常算子是谱定理适用的最广泛的一类算子。如 9.1.2 节所述,有界正常算子具有谱测度表示和乘法算子表示的谱定理。

    谱性质: 正常算子的谱具有良好的性质。例如,对于正常算子 \(N\),其谱半径 \(r(N)\) 等于算子范数 \( \|N\| \)。

    特征向量: 对于正常算子 \(N\),属于不同特征值的特征向量是正交的。设 \( \lambda_1, \lambda_2 \) 是 \(N\) 的两个不同的特征值,\(x_1, x_2\) 分别是对应的特征向量,即 \(Nx_1 = \lambda_1 x_1\) 和 \(Nx_2 = \lambda_2 x_2\),且 \( \lambda_1 \neq \lambda_2 \)。则 \( \langle x_1, x_2 \rangle = 0 \)。

    例子:

    自伴算子: 如果 \(T^* = T\),则 \(TT^* = T^2 = T^*T\),所以自伴算子是正常算子。
    酉算子: 如果 \(UU^* = U^*U = I\),则 \(UU^* = I = U^*U\),所以酉算子是正常算子。
    乘法算子: 在 \(L^2(\Omega, \mu)\) 空间上,设 \(f \in L^\infty(\Omega, \mu)\),定义乘法算子 \(M_f\) 为 \( (M_f g)(\omega) = f(\omega) g(\omega) \)。则 \(M_f\) 是正常算子。事实上,\(M_f^* = M_{\overline{f}}\),且 \(M_f M_f^* = M_{|f|^2} = M_{f}^* M_f\)。

    9.2.2 自伴算子 (Self-Adjoint Operators)

    定义 9.2.2 (自伴算子, Self-Adjoint Operator) Hilbert 空间 \(H\) 上的有界线性算子 \(T: H \to H\) 被称为自伴算子 (self-adjoint operator)Hermitian 算子 (Hermitian operator),如果它等于它的伴随算子,即
    \[ T^* = T \]

    自伴算子在量子力学中扮演着核心角色,物理可观测量通常用自伴算子来表示。

    自伴算子的性质:

    谱为实数: 自伴算子的谱 \( \sigma(T) \) 总是实数集 \(\mathbb{R}\) 的子集,即 \( \sigma(T) \subseteq \mathbb{R} \)。

    特征值为实数: 自伴算子的所有特征值都是实数。

    谱定理: 有界自伴算子具有实谱,并且有谱测度形式和乘法算子形式的谱定理(9.1.1 节和 9.1.3 节)。对于紧自伴算子,还有特征值分解形式的谱定理(9.1.5 节)。

    数值域: 自伴算子的数值域 \(W(T) = \{ \langle Tx, x \rangle : \|x\| = 1 \} \) 是实数集 \(\mathbb{R}\) 的子集,并且 \( \sigma(T) \subseteq \overline{W(T)} \)。实际上,对于自伴算子,\( \overline{W(T)} = [\inf \sigma(T), \sup \sigma(T)] \)。

    例子:

    实对称矩阵: 在有限维 Hilbert 空间 \(\mathbb{C}^n\) 中,线性算子可以用矩阵表示。一个矩阵表示的算子是自伴的当且仅当该矩阵是 Hermitian 矩阵(对于实数域,即实对称矩阵)。

    微分算子: 在适当的定义域下,某些微分算子可以是自伴的。例如,拉普拉斯算子在合适的边界条件下是自伴的。

    乘法算子 (实值函数): 在 \(L^2(\Omega, \mu)\) 空间上,如果 \(f \in L^\infty(\Omega, \mu)\) 是实值函数,则乘法算子 \(M_f\) 是自伴的,因为 \(M_f^* = M_{\overline{f}} = M_f\)。

    9.2.3 酉算子 (Unitary Operators)

    定义 9.2.3 (酉算子, Unitary Operator) Hilbert 空间 \(H\) 上的有界线性算子 \(U: H \to H\) 被称为酉算子 (unitary operator),如果它满足
    \[ UU^* = U^*U = I \]
    其中 \(I\) 是恒等算子。等价地,酉算子 \(U\) 是可逆的,且 \(U^{-1} = U^*\)。

    酉算子保持 Hilbert 空间的内积和范数不变,因此可以看作是 Hilbert 空间上的“旋转”或“反射”。在量子力学中,时间演化算符通常是酉算子。

    酉算子的性质:

    谱在单位圆上: 酉算子的谱 \( \sigma(U) \) 包含在复平面的单位圆 \(\mathbb{T} = \{z \in \mathbb{C} : |z| = 1\}\) 上,即 \( \sigma(U) \subseteq \mathbb{T} \)。

    特征值模长为 1: 酉算子的所有特征值的模长都为 1。

    谱定理: 有界酉算子是正常算子,因此也具有谱测度形式和乘法算子形式的谱定理。

    保距同构: 酉算子是 Hilbert 空间上的保距同构 (isometry) 和满射 (surjection)。它保持向量的长度和向量之间的角度。

    例子:

    旋转矩阵: 在有限维 Hilbert 空间 \(\mathbb{C}^n\) 中,酉算子可以用酉矩阵表示。在二维实 Hilbert 空间 \(\mathbb{R}^2\) 中,旋转矩阵是酉算子的例子。

    傅里叶变换: 傅里叶变换 (Fourier transform) 是 \(L^2(\mathbb{R}^n)\) 上的酉算子。

    乘法算子 (模长为 1 的函数): 在 \(L^2(\Omega, \mu)\) 空间上,如果 \(f \in L^\infty(\Omega, \mu)\) 满足 \(|f(\omega)| = 1\) 几乎处处成立,则乘法算子 \(M_f\) 是酉算子,因为 \(M_f^* = M_{\overline{f}}\) 且 \(M_f M_f^* = M_{f\overline{f}} = M_{|f|^2} = M_1 = I\)。

    9.2.4 正常算子、自伴算子与酉算子的关系

    正常算子、自伴算子和酉算子之间存在着包含关系:

    \[ \{\text{自伴算子}\} \subsetneq \{\text{正常算子}\}, \quad \{\text{酉算子}\} \subsetneq \{\text{正常算子}\} \]
    即,所有自伴算子和酉算子都是正常算子,但反之不成立。

    谱刻画: 利用谱定理,我们可以更精确地刻画这三种算子之间的关系。

    自伴算子: 有界线性算子 \(T\) 是自伴的当且仅当其谱 \( \sigma(T) \subseteq \mathbb{R} \)。

    酉算子: 有界线性算子 \(U\) 是酉算子当且仅当其谱 \( \sigma(U) \subseteq \mathbb{T} = \{z \in \mathbb{C} : |z| = 1\} \)。

    正常算子: 有界线性算子 \(N\) 是正常的当且仅当在谱测度表示 \( N = \int_{\sigma(N)} \lambda dE(\lambda) \) 中,谱测度 \(E\) 满足 \(E(\Delta_1)E(\Delta_2) = E(\Delta_2)E(\Delta_1)\) 对于任意 Borel 集 \( \Delta_1, \Delta_2 \subseteq \sigma(N) \) 成立(这个条件实际上是自动满足的,因为谱测度本身就由投影算子构成,而投影算子之间不一定可交换,但谱测度的定义保证了可交换性)。更本质的刻画是利用谱定理的乘法算子形式。

    总结: 正常算子、自伴算子和酉算子是 Hilbert 空间算子理论中重要的算子类型。正常算子是最广泛的一类,自伴算子和酉算子是正常算子的特殊情况,分别对应于谱为实数和谱在单位圆上的正常算子。谱定理为研究这些算子提供了统一的框架和强大的工具。

    9.3 谱分解 (Spectral Decomposition)

    谱分解 (spectral decomposition) 是谱定理的另一种表达形式,它将算子分解为一系列更基本、更易于处理的算子的线性组合或积分。对于不同类型的算子,谱分解的形式有所不同。本节将介绍紧自伴算子的谱分解和一般有界正常算子的谱分解。

    9.3.1 紧自伴算子的谱分解 (Spectral Decomposition of Compact Self-Adjoint Operators)

    对于紧自伴算子,谱定理的特征值分解形式(定理 9.1.5)本身就是一种谱分解。它可以写成以下形式:

    设 \(T\) 是可分 Hilbert 空间 \(H\) 上的紧自伴算子,\( \{\lambda_n\}_{n=1}^N \) 是 \(T\) 的非零特征值,\( \{e_n\}_{n=1}^N \) 是对应的单位正交特征向量。定义投影算子 \(P_n\) 为到 \( \text{span}\{e_n\} \) 上的一维投影,即 \(P_n x = \langle x, e_n \rangle e_n\)。则紧自伴算子 \(T\) 可以分解为:
    \[ T = \sum_{n=1}^N \lambda_n P_n \]
    这个表达式称为 紧自伴算子的谱分解 (spectral decomposition of compact self-adjoint operator)

    性质:

    ① \(P_n\) 是投影算子,且 \(P_n P_m = 0\) (当 \(n \neq m\)),\(P_n^* = P_n\),\(P_n^2 = P_n\)。投影算子 \( \{P_n\}_{n=1}^N \) 构成一组正交投影 (orthogonal projections)

    ② \(R(P_n) = \text{span}\{e_n\}\) 是与特征值 \( \lambda_n \) 对应的特征子空间。

    ③ 上述级数是算子范数收敛的。

    ④ 如果算子 \(T\) 还有零特征值,设 \(P_0\) 是到核空间 \(\text{Ker}(T)\) 上的投影,则 \(I = P_0 + \sum_{n=1}^N P_n\) (在强算子拓扑意义下)。

    意义: 紧自伴算子的谱分解将算子表示为特征值和特征投影的线性组合。这使得我们可以通过研究特征值和特征向量来理解算子的性质。例如,计算 \(T^k\) 或 \(f(T)\) (其中 \(f\) 是适当的函数) 可以通过谱分解转化为对特征值的运算:
    \[ T^k = \sum_{n=1}^N \lambda_n^k P_n, \quad f(T) = \sum_{n=1}^N f(\lambda_n) P_n \]

    9.3.2 一般有界正常算子的谱分解 (Spectral Decomposition of Bounded Normal Operators)

    对于一般的有界正常算子 \(N\),谱分解的形式是谱积分。设 \(N\) 是 Hilbert 空间 \(H\) 上的有界正常算子,\(E\) 是其谱测度。则谱定理给出了 \(N\) 的谱分解:
    \[ N = \int_{\sigma(N)} \lambda dE(\lambda) \]
    这个表达式称为 有界正常算子的谱分解 (spectral decomposition of bounded normal operator)谱积分表示 (spectral integral representation)

    理解谱积分: 谱积分 \( \int_{\sigma(N)} \lambda dE(\lambda) \) 可以理解为对谱集 \( \sigma(N) \) 进行“积分”,积分的“测度”是谱测度 \(E\),积分的“函数”是恒等函数 \(f(\lambda) = \lambda\)。

    为了更具体地理解谱积分,我们可以将谱集 \( \sigma(N) \) 分割成小块 \( \Delta_i \),在每个小块中取一个代表点 \( \lambda_i^* \in \Delta_i \),然后用 Riemann 和来逼近谱积分:
    \[ N \approx \sum_{i} \lambda_i^* E(\Delta_i) \]
    当分割越来越细时,Riemann 和的极限就是谱积分 \( \int_{\sigma(N)} \lambda dE(\lambda) \)。

    性质:

    ① \(E(\Delta)\) 是投影算子,对于任意 Borel 集 \( \Delta \subseteq \sigma(N) \)。

    ② \(E(\Delta_1)E(\Delta_2) = E(\Delta_1 \cap \Delta_2) = E(\Delta_2)E(\Delta_1)\)。谱测度在不同 Borel 集上的投影算子是可交换的。

    ③ 可以利用谱分解定义算子的函数演算。对于任意有界 Borel 可测函数 \(f: \sigma(N) \to \mathbb{C}\),可以定义算子 \(f(N)\) 为:
    \[ f(N) = \int_{\sigma(N)} f(\lambda) dE(\lambda) \]
    这种定义方式保持了函数运算的许多性质,例如 \( (f+g)(N) = f(N) + g(N) \), \( (fg)(N) = f(N)g(N) \), \( \overline{f}(N) = f(N)^* \)。

    应用: 谱分解是研究正常算子的有力工具。通过谱分解,我们可以将算子运算转化为对谱测度的积分运算,从而解决许多算子理论问题。例如,谱分解在算子函数、算子方程、量子力学等领域都有重要应用。

    总结: 谱分解是将算子表示为更基本算子的组合或积分的过程。对于紧自伴算子,谱分解是特征值和特征投影的线性组合;对于一般有界正常算子,谱分解是关于谱测度的谱积分。谱分解是谱定理的重要组成部分,为我们深入理解和应用 Hilbert 空间上的算子提供了关键工具。

    10. chapter 10: 紧算子理论 (Theory of Compact Operators)

    10.1 紧算子的基本性质 (Basic Properties of Compact Operators)

    紧算子 (Compact Operator) 在泛函分析中扮演着重要的角色,它们是有限秩算子 (Finite Rank Operator) 的推广,并在谱理论、积分方程以及许多应用领域中都有着广泛的应用。本节将介绍紧算子的定义、基本性质以及一些重要的例子。

    定义 10.1.1 (紧算子)

    设 \(X\) 和 \(Y\) 是 Banach 空间。一个线性算子 \(T: X \to Y\) 被称为 紧算子 (compact operator),如果对于 \(X\) 中的任意有界集 \(B\),集合 \(T(B) = \{Tx : x \in B\}\) 在 \(Y\) 中是相对紧的 (relatively compact)。

    相对紧集 (relatively compact set) 的定义回顾:集合 \(S \subseteq Y\) 是相对紧的,如果 \(S\) 的闭包 \(\overline{S}\) 是紧集 (compact set)。在度量空间中,相对紧集等价于 完全有界集 (totally bounded set)。对于 Banach 空间,相对紧集也等价于 序列紧集 (sequentially compact set),即集合中的任何序列都存在收敛的子序列,但其极限不一定在原集合中,而是在闭包中。

    紧算子的等价定义 (Equivalent Definitions of Compact Operators)

    以下给出紧算子的一些等价定义,这些定义在不同的场景下可能更加方便使用。

    定理 10.1.2 (紧算子的等价定义)

    设 \(X\) 和 \(Y\) 是 Banach 空间,\(T: X \to Y\) 是线性算子。则以下陈述等价:

    ① \(T\) 是紧算子。

    ② 对于 \(X\) 中任意有界序列 \(\{x_n\}\),序列 \(\{Tx_n\}\) 在 \(Y\) 中存在收敛子序列。

    ③ 对于 \(X\) 的单位闭球 \(B_X = \{x \in X : \|x\| \leq 1\}\),\(T(B_X)\) 在 \(Y\) 中是相对紧的。

    ④ \(T\) 将 \(X\) 中的弱收敛序列 (weakly convergent sequence) 映射为 \(Y\) 中的强收敛序列 (strongly convergent sequence)。 更准确地说,如果 \(x_n \xrightarrow{w} x\) 在 \(X\) 中弱收敛,则 \(Tx_n \xrightarrow{s} Tx\) 在 \(Y\) 中强收敛。

    证明概要:

    ⚝ ① $\Leftrightarrow$ ②: 相对紧集与序列紧集的等价性。
    ⚝ ① $\Leftrightarrow$ ③: 只需考虑单位闭球,因为任何有界集都可以通过缩放包含在单位闭球的倍数中,而线性算子保持比例关系,相对紧性也在线性变换下保持。
    ⚝ ② $\Rightarrow$ ④: 弱收敛序列是有界的(一致有界原理的推论)。因此,如果 \(x_n \xrightarrow{w} x\),则 \(\{x_n\}\) 是有界序列,根据条件 ②,\(\{Tx_n\}\) 存在收敛子序列。要证明整个序列 \(\{Tx_n\}\) 收敛到 \(Tx\),需要利用弱收敛的性质和线性性。
    ⚝ ④ $\Rightarrow$ ②: 假设条件 ④ 成立。对于 \(X\) 中的有界序列 \(\{x_n\}\),根据 Banach-Alaoglu 定理,\(\{x_n\}\) 存在弱收敛子序列 \(\{x_{n_k}\}\) 在 \(X^{**}\) 中。如果 \(X\) 是自反空间 (reflexive space),则弱收敛等价于弱收敛,即存在弱收敛子序列 \(x_{n_k} \xrightarrow{w} x\)。根据条件 ④,\(Tx_{n_k} \xrightarrow{s} Tx\),因此 \(\{Tx_n\}\) 存在收敛子序列。对于一般的 Banach 空间,需要更精细的论证,但核心思想仍然是利用弱收敛和紧算子的性质。

    紧算子的基本性质 (Basic Properties)

    紧算子构成 Banach 空间中有界线性算子空间的一个重要子集,它们具有许多重要的性质。

    定理 10.1.3 (紧算子的基本性质)

    设 \(X, Y, Z\) 是 Banach 空间。

    线性性 (Linearity): 若 \(T_1, T_2: X \to Y\) 是紧算子,且 \(\alpha, \beta \in \mathbb{C}\) (或 \(\mathbb{R}\)),则 \(\alpha T_1 + \beta T_2\) 也是紧算子。

    有界性 (Boundedness): 每个紧算子都是有界线性算子。

    理想性质 (Ideal Property):
    ▮▮▮▮⚝ 若 \(T: X \to Y\) 是紧算子,\(S: Y \to Z\) 是有界线性算子,则 \(ST: X \to Z\) 是紧算子。
    ▮▮▮▮⚝ 若 \(S: X \to Y\) 是有界线性算子,\(T: Y \to Z\) 是紧算子,则 \(TS: X \to Z\) 是紧算子。

    有限秩算子 (Finite Rank Operator) 的逼近: 紧算子可以被有限秩算子逼近。更精确地说,如果 \(T: X \to Y\) 是紧算子,则存在一列有限秩算子 \(\{T_n\}\) 使得 \(\|T_n - T\| \to 0\) 当 \(n \to \infty\)。反之,有限秩算子是紧算子,且紧算子是有限秩算子的算子范数极限。

    紧算子的伴随算子 (Adjoint Operator): 算子 \(T: X \to Y\) 是紧算子当且仅当其伴随算子 \(T^*: Y^* \to X^*\) 是紧算子。

    证明概要:

    线性性: 若 \(B \subseteq X\) 是有界集,则 \(T_1(B)\) 和 \(T_2(B)\) 是相对紧集。相对紧集的线性组合仍然是相对紧集,因此 \((\alpha T_1 + \beta T_2)(B) = \alpha T_1(B) + \beta T_2(B)\) 是相对紧集。

    有界性: 单位闭球 \(B_X\) 是有界集。若 \(T\) 是紧算子,则 \(T(B_X)\) 是相对紧集,因此也是有界的。由于 \(T(B_X)\) 的有界性,可以推导出 \(T\) 的有界性,即存在常数 \(M > 0\) 使得 \(\|Tx\| \leq M\|x\|\) 对所有 \(x \in X\) 成立。

    理想性质:
    ▮▮▮▮⚝ 对于 \(ST\): 若 \(B \subseteq X\) 是有界集,由于 \(T\) 是紧算子,\(T(B)\) 是 \(Y\) 中的相对紧集。由于 \(S\) 是有界线性算子(连续算子),连续算子将相对紧集映射为相对紧集,因此 \(S(T(B)) = (ST)(B)\) 是 \(Z\) 中的相对紧集。
    ▮▮▮▮⚝ 对于 \(TS\): 若 \(B \subseteq X\) 是有界集,由于 \(S\) 是有界线性算子,\(S(B)\) 是 \(Y\) 中的有界集。由于 \(T\) 是紧算子,\(T(S(B)) = (TS)(B)\) 是 \(Z\) 中的相对紧集。

    有限秩算子的逼近: 这个性质的证明通常需要利用有限维子空间的性质和逼近理论。对于 Hilbert 空间,可以使用正交投影算子来构造有限秩算子序列逼近紧算子。对于一般的 Banach 空间,需要使用更抽象的手段,例如有限网 (finite net) 和有限维子空间的逼近。

    伴随算子: 这个性质的证明需要利用伴随算子的定义和相对紧集的性质,以及对偶空间的一些知识。可以使用 Arzelà-Ascoli 定理或者 Goldstine 定理等工具进行证明。

    例子与反例 (Examples and Counterexamples)

    有限秩算子 (Finite Rank Operator): 任何有限秩算子都是紧算子。设 \(T: X \to Y\) 是有限秩算子,则 \(R(T)\) (值域) 是有限维子空间。对于 \(X\) 中的有界集 \(B\),\(T(B) \subseteq R(T)\) 也是有界的。由于 \(R(T)\) 是有限维的,\(T(B)\) 在有限维空间中的有界集是相对紧的(有限维空间中的有界闭集是紧集)。因此,\(T(B)\) 在 \(Y\) 中也是相对紧的。

    积分算子 (Integral Operator): 在 \(L^p\) 空间上定义的某些积分算子是紧算子。例如,考虑 \(L^2[0, 1]\) 上的 Urysohn 积分算子:
    \[ (Tf)(x) = \int_0^1 K(x, y) f(y) dy \]
    如果核函数 \(K(x, y)\) 满足一定的条件(例如,\(K \in L^2([0, 1] \times [0, 1])\),即平方可积),则 \(T\) 是 \(L^2[0, 1]\) 上的紧算子。更一般的,Hilbert-Schmidt 积分算子是紧算子。

    乘法算子 (Multiplication Operator): 在 \(L^p[0, 1]\) 上,考虑乘法算子 \(M_g: L^p[0, 1] \to L^p[0, 1]\),定义为 \((M_g f)(x) = g(x) f(x)\),其中 \(g \in L^\infty[0, 1]\)。一般来说,乘法算子不是紧算子,除非在一些特殊情况下,例如当值域空间是有限维的时候。例如,如果 \(g(x) = 0\) 对所有 \(x\) 成立,则 \(M_g = 0\) 是有限秩算子,也是紧算子。如果 \(g(x) = c \neq 0\) 是常数,则 \(M_g = cI\) 是恒等算子的倍数,在无限维空间上不是紧算子(因为单位球不是相对紧的)。

    恒等算子 (Identity Operator): 设 \(I: X \to X\) 是恒等算子。\(I\) 是紧算子当且仅当 \(X\) 是有限维空间。如果 \(X\) 是有限维的,则单位球是紧集,因此 \(I\) 是紧算子。如果 \(X\) 是无限维的,则单位球不是相对紧的(Riesz 引理),因此 \(I\) 不是紧算子。

    对角算子 (Diagonal Operator): 考虑序列空间 \(l^p\) (例如 \(l^2\)),设 \(\{\lambda_n\}\) 是一个趋于 0 的标量序列。定义对角算子 \(D: l^p \to l^p\) 为 \(D(x_1, x_2, \dots) = (\lambda_1 x_1, \lambda_2 x_2, \dots)\)。则 \(D\) 是紧算子。如果 \(\lambda_n\) 不趋于 0,则 \(D\) 一般不是紧算子(除非 \(\lambda_n\) 只有有限个非零项,此时 \(D\) 是有限秩算子)。

    总结 (Summary)

    本节介绍了紧算子的定义和基本性质。紧算子是泛函分析中一类重要的算子,它们具有许多特殊的性质,例如有界性、理想性质以及可以被有限秩算子逼近。理解紧算子的基本性质是进一步研究紧算子的谱理论和应用的基础。

    10.2 紧算子的谱理论 (Spectral Theory of Compact Operators)

    紧算子的谱理论 (Spectral Theory of Compact Operators) 是泛函分析中的一个核心内容。与一般的有界线性算子相比,紧算子的谱结构要简单得多,也更接近于有限维线性代数中的情况。本节将深入探讨紧算子的谱性质,特别是关于特征值 (eigenvalue) 和谱集 (spectrum) 的结构。

    预备知识回顾 (Review of Spectrum)

    对于 Banach 空间 \(X\) 上的有界线性算子 \(T: X \to X\),预解集 (resolvent set) \(\rho(T)\) 定义为所有使得 预解算子 (resolvent operator) \(R_\lambda(T) = (\lambda I - T)^{-1}\) 存在且为有界线性算子的复数 \(\lambda \in \mathbb{C}\) 的集合。谱集 (spectrum) \(\sigma(T)\) 定义为预解集的补集,即 \(\sigma(T) = \mathbb{C} \setminus \rho(T)\)。谱集 \(\sigma(T)\) 可以分解为三个互不相交的子集:

    点谱 (point spectrum) \(\sigma_p(T)\):由所有特征值 (eigenvalue) 组成的集合。 \(\lambda \in \sigma_p(T)\) 当且仅当 \(\ker(\lambda I - T) \neq \{0\}\),即存在非零向量 \(x \in X\) 使得 \(Tx = \lambda x\)。
    连续谱 (continuous spectrum) \(\sigma_c(T)\):由所有 \(\lambda \in \mathbb{C} \setminus \sigma_p(T)\) 使得 \(R(\lambda I - T)\) (值域) 在 \(X\) 中稠密,但 \(R(\lambda I - T) \neq X\) 的 \(\lambda\) 组成的集合。
    剩余谱 (residual spectrum) \(\sigma_r(T)\):由所有 \(\lambda \in \mathbb{C} \setminus \sigma_p(T)\) 使得 \(R(\lambda I - T)\) 在 \(X\) 中不稠密的 \(\lambda\) 组成的集合。

    对于紧算子,其谱结构具有显著的特点。

    定理 10.2.1 (紧算子的谱性质)

    设 \(X\) 是无限维 Banach 空间,\(T: X \to X\) 是紧算子。则:

    ① \(0 \in \sigma(T)\)。

    ② \(\sigma(T) \setminus \{0\} = \sigma_p(T) \setminus \{0\}\)。即,谱集 \(\sigma(T)\) 中非零部分完全由特征值组成。换句话说,对于任何非零 \(\lambda \in \sigma(T)\),\(\lambda\) 必是 \(T\) 的特征值。

    ③ \(\sigma(T)\) 是可数集 (countable set),且在 \(\mathbb{C}\) 中至多以 0 为唯一的聚点 (accumulation point)。如果 \(\sigma(T)\) 是无限集,则其唯一的聚点是 0。

    ④ 对于任何非零特征值 \(\lambda \in \sigma(T) \setminus \{0\}\),其特征子空间 \(N(\lambda I - T) = \ker(\lambda I - T)\) 是有限维的,即非零特征值的 代数重数 (algebraic multiplicity) (特征子空间的维数) 是有限的。

    证明概要:

    证明 \(0 \in \sigma(T)\): 假设 \(0 \notin \sigma(T)\),则 \(0I - T = -T\) 是可逆的,即 \(T^{-1}\) 存在且有界。因此 \(I = T^{-1}T\)。由于 \(T\) 是紧算子,\(T^{-1}\) 是有界算子,根据紧算子的理想性质,\(I = T^{-1}T\) 必须是紧算子。但是,在无限维 Banach 空间中,恒等算子 \(I\) 不是紧算子(如 10.1 节例子 ④ 所述)。矛盾。因此,必须有 \(0 \in \sigma(T)\)。

    证明 \(\sigma(T) \setminus \{0\} = \sigma_p(T) \setminus \{0\}\): 我们需要证明对于任何非零 \(\lambda \neq 0\),\(\lambda \in \sigma(T)\) 当且仅当 \(\lambda \in \sigma_p(T)\)。
    ▮▮▮▮⚝ 若 \(\lambda \in \sigma_p(T)\),则 \(\ker(\lambda I - T) \neq \{0\}\),\(\lambda I - T\) 不是单射的,因此 \(\lambda I - T\) 不可逆,所以 \(\lambda \in \sigma(T)\)。
    ▮▮▮▮⚝ 反之,若 \(\lambda \neq 0\) 且 \(\lambda \in \sigma(T)\),我们需要证明 \(\lambda \in \sigma_p(T)\)。假设 \(\lambda \notin \sigma_p(T)\),即 \(\ker(\lambda I - T) = \{0\}\),则 \(\lambda I - T\) 是单射的。我们需要证明在这种情况下,\(\lambda I - T\) 不可能是满射的,或者 \((\lambda I - T)^{-1}\) 不是有界的。 这部分证明通常需要用到 Riesz 引理 (Riesz Lemma)Fredholm 二择一定理 (Fredholm Alternative Theorem) 的思想。 关键步骤是证明如果 \(\lambda I - T\) 是单射的,且 \(\lambda \neq 0\),则 \(R(\lambda I - T)\) 不可能是 \(X\),或者 \((\lambda I - T)^{-1}\) 不是有界的,从而 \(\lambda \in \sigma(T)\) 必须是由于 \(\lambda I - T\) 不是双射造成的,而单射性已经假设成立,因此只能是 \(\lambda I - T\) 不是满射,或者 \((\lambda I - T)^{-1}\) 无界。更精确的证明需要用到 Fredholm 算子的理论,或者使用反证法结合 Riesz 引理构造矛盾。

    证明 \(\sigma(T)\) 的可数性和聚点: 这个性质的证明较为复杂,通常需要用到 Riesz-Schauder 理论 (Riesz-Schauder Theory)。核心思想是利用紧算子可以“压缩”空间维度,从而使得谱集结构变得简单。可以证明对于任何 \(\epsilon > 0\),\(\sigma(T) \setminus \{\lambda \in \mathbb{C} : |\lambda| \geq \epsilon\}\) 是有限集。这表明非零谱值只能在原点附近聚集,因此 0 是 \(\sigma(T)\) 唯一的可能聚点,且 \(\sigma(T)\) 是可数集。

    证明非零特征值的特征子空间是有限维的: 假设存在非零特征值 \(\lambda \neq 0\),且特征子空间 \(N(\lambda I - T)\) 是无限维的。考虑 \(N(\lambda I - T)\) 中的单位闭球 \(B_{N(\lambda I - T)}\)。由于 \(T\) 是紧算子,\(T(B_{N(\lambda I - T)})\) 是相对紧集。但是,对于 \(x \in N(\lambda I - T)\),\(Tx = \lambda x\),因此 \(T(B_{N(\lambda I - T)}) = \{\lambda x : x \in B_{N(\lambda I - T)}\} = \lambda B_{N(\lambda I - T)}\)。如果 \(N(\lambda I - T)\) 是无限维的,则 \(B_{N(\lambda I - T)}\) 不是紧集(Riesz 引理),因此 \(\lambda B_{N(\lambda I - T)}\) 也不是紧集(因为 \(\lambda \neq 0\))。这与 \(T(B_{N(\lambda I - T)})\) 是相对紧集矛盾。因此,\(N(\lambda I - T)\) 必须是有限维的。

    Riesz-Schauder 定理 (Riesz-Schauder Theorem)

    Riesz-Schauder 定理是紧算子谱理论的核心定理,它更精确地描述了紧算子的谱结构。

    定理 10.2.2 (Riesz-Schauder 定理)

    设 \(X\) 是 Banach 空间,\(T: X \to X\) 是紧算子。则对于任何非零复数 \(\lambda \neq 0\),以下性质成立:

    ① \(\ker(\lambda I - T)\) 是有限维的。

    ② \(R(\lambda I - T)\) 是闭子空间。

    ③ \(\ker(\lambda I - T) = \{0\}\) 当且仅当 \(R(\lambda I - T) = X\)。

    ④ \(\ker(\lambda I - T) = \{0\}\) 当且仅当 \(\ker(\lambda I - T^*) = \{0\}\)。

    ⑤ \(\dim \ker(\lambda I - T) = \mathrm{codim} R(\lambda I - T) = \dim (X / R(\lambda I - T))\)。

    推论 10.2.3 (紧算子的谱结构)

    设 \(X\) 是无限维 Banach 空间,\(T: X \to X\) 是紧算子。则 \(\sigma(T)\) 是一个至多可数的集合,以 0 为唯一的可能聚点。 \(\sigma(T) \setminus \{0\}\) 中的每个非零元素都是 \(T\) 的特征值,且具有有限的代数重数。

    例子 (Examples)

    有限秩算子: 有限秩算子的谱集由有限个非零特征值(以及 0,如果空间是无限维的)组成。

    对角算子: 对于 \(l^2\) 上的对角算子 \(D(x_1, x_2, \dots) = (\lambda_1 x_1, \lambda_2 x_2, \dots)\),其中 \(\lambda_n \to 0\),谱集 \(\sigma(D) = \{0\} \cup \{\lambda_n : n \in \mathbb{N}\}\)。非零谱值 \(\lambda_n\) 都是特征值,特征向量是标准基向量 \(e_n\)。 0 也是谱值(如果 \(\lambda_n \neq 0\) 对所有 \(n\) 成立,则 0 不是特征值,而是连续谱的一部分,但对于紧算子,非零谱值都是特征值,所以 0 只能是谱集的一部分)。

    积分算子: 对于某些积分算子,其谱集也具有类似的离散结构,非零谱值是特征值,且特征子空间有限维。积分方程的 Fredholm 理论与紧算子的谱理论密切相关。

    总结 (Summary)

    本节介绍了紧算子的谱理论,重点讨论了紧算子的谱结构。我们看到,与一般的有界线性算子相比,紧算子的谱结构要简单得多,其非零谱值都是特征值,且谱集是可数的,至多以 0 为聚点。Riesz-Schauder 定理是理解紧算子谱理论的关键工具。这些理论为研究积分方程、算子方程以及许多应用问题提供了重要的理论基础。

    10.3 Fredholm 算子简介 (Introduction to Fredholm Operators)

    Fredholm 算子 (Fredholm Operator) 是泛函分析中另一类重要的算子,它们是紧算子的推广,并在研究椭圆型偏微分方程、指标理论 (index theory) 等领域中发挥着关键作用。本节将简要介绍 Fredholm 算子的定义、性质以及与紧算子的关系。

    定义 10.3.1 (Fredholm 算子)

    设 \(X\) 和 \(Y\) 是 Banach 空间。一个有界线性算子 \(T: X \to Y\) 被称为 Fredholm 算子 (Fredholm operator),如果满足以下两个条件:

    ① \(\dim \ker(T) < \infty\),即 \(T\) 的核空间 (kernel) 是有限维的。

    ② \(\mathrm{codim} R(T) < \infty\),即 \(T\) 的值域 (range) 的余维数 (codimension) 是有限的。余维数定义为 \(\mathrm{codim} R(T) = \dim (Y / R(T))\)。

    等价地,Fredholm 算子 \(T: X \to Y\) 满足:

    ① \(\ker(T)\) 是有限维的。

    ② \(R(T)\) 是闭子空间。

    ③ \(Y / R(T)\) 是有限维的。

    Fredholm 指标 (Fredholm Index)

    对于 Fredholm 算子 \(T: X \to Y\),其 Fredholm 指标 (Fredholm index) 定义为:
    \[ \mathrm{index}(T) = \dim \ker(T) - \mathrm{codim} R(T) = \dim \ker(T) - \dim (Y / R(T)) \]
    Fredholm 指标是一个整数,它可以是正数、负数或零。指标在 Fredholm 算子理论中起着核心作用,它在算子扰动、同伦不变性等方面具有重要的性质。

    Fredholm 算子的性质 (Properties of Fredholm Operators)

    稳定性 (Stability under compact perturbation): 如果 \(T: X \to Y\) 是 Fredholm 算子,\(K: X \to Y\) 是紧算子,则 \(T + K: X \to Y\) 也是 Fredholm 算子,且 \(\mathrm{index}(T + K) = \mathrm{index}(T)\)。 这表明 Fredholm 指标在紧扰动下保持不变,这是一个非常重要的性质。

    复合算子的指标性质 (Index of composition): 如果 \(T: X \to Y\) 和 \(S: Y \to Z\) 都是 Fredholm 算子,则复合算子 \(ST: X \to Z\) 也是 Fredholm 算子,且 \(\mathrm{index}(ST) = \mathrm{index}(S) + \mathrm{index}(T)\)。 指标具有可加性。

    伴随算子的指标性质 (Index of adjoint operator): 如果 \(T: X \to Y\) 是 Fredholm 算子,则其伴随算子 \(T^*: Y^* \to X^*\) 也是 Fredholm 算子,且 \(\mathrm{index}(T^*) = - \mathrm{index}(T)\)。

    可逆性与 Fredholm 算子的关系: 如果 \(T: X \to Y\) 是 Fredholm 算子,且 \(\mathrm{index}(T) = 0\),则存在紧算子 \(K: X \to Y\) 使得 \(T + K\) 是可逆算子。 这表明指标为零的 Fredholm 算子“接近”于可逆算子。

    Atkinson 定理 (Atkinson's Theorem): 一个有界线性算子 \(T: X \to Y\) 是 Fredholm 算子当且仅当存在有界线性算子 \(S_1, S_2: Y \to X\) 使得 \(S_1 T - I_X\) 和 \(T S_2 - I_Y\) 都是紧算子。 其中 \(I_X\) 和 \(I_Y\) 分别是 \(X\) 和 \(Y\) 上的恒等算子。 这表明 Fredholm 算子在“模紧算子”意义下是可逆的。 \(S_1\) 称为 \(T\) 的 左本质逆 (left essential inverse),\(S_2\) 称为 \(T\) 的 右本质逆 (right essential inverse)

    紧算子与 Fredholm 算子的关系 (Relationship between Compact Operators and Fredholm Operators)

    紧算子本身一般不是 Fredholm 算子(除非在有限维空间上)。但是,紧算子在 Fredholm 算子理论中起着重要的辅助作用,例如在 Fredholm 算子的稳定性性质中,紧扰动不改变 Fredholm 性质和指标。

    例子 (Examples)

    可逆算子 (Invertible Operator): 任何可逆的有界线性算子 \(T: X \to Y\) 都是 Fredholm 算子。此时,\(\ker(T) = \{0\}\),\(R(T) = Y\),\(\dim \ker(T) = 0\),\(\mathrm{codim} R(T) = 0\),因此 \(\mathrm{index}(T) = 0\)。

    有限秩算子 (Finite Rank Operator): 有限秩算子一般不是 Fredholm 算子(除非空间是有限维的)。例如,考虑无限维空间 \(X\) 上的有限秩算子 \(T\)。如果 \(T \neq 0\),则 \(\ker(T)\) 可能是无限维的,或者 \(R(T)\) 的余维数可能是无限维的,或者两者都可能。只有当 \(X\) 是有限维时,有限秩算子才是 Fredholm 算子。

    恒等算子 (Identity Operator): 在 Banach 空间 \(X\) 上,恒等算子 \(I: X \to X\) 是 Fredholm 算子,且 \(\mathrm{index}(I) = 0\)。

    微分算子 (Differential Operator): 在适当的函数空间上定义的某些微分算子可以是 Fredholm 算子。例如,在紧流形上的椭圆型微分算子通常是 Fredholm 算子,其指标与流形的拓扑性质有关,这就是著名的 Atiyah-Singer 指标定理 (Atiyah-Singer Index Theorem) 的研究对象。

    积分算子 (Integral Operator): 某些积分算子,特别是与微分算子相关的 伪微分算子 (pseudodifferential operator),在研究偏微分方程时会作为 Fredholm 算子出现。

    总结 (Summary)

    本节简要介绍了 Fredholm 算子的基本概念和性质。Fredholm 算子是一类比紧算子更广泛的算子,它们在核空间和余核空间都是有限维的。Fredholm 指标是 Fredholm 算子的重要特征,它在算子理论和应用中都具有重要的意义。Fredholm 算子理论是泛函分析中一个深刻而重要的分支,它与拓扑学、几何学以及偏微分方程等领域都有着密切的联系。

    11. chapter 11: 无界线性算子初步 (Introduction to Unbounded Linear Operators)

    11.1 无界算子的定义与例子 (Definition and Examples of Unbounded Operators)

    在前面的章节中,我们主要讨论了有界线性算子 (Bounded Linear Operator)。然而,在泛函分析以及其应用中,特别是在量子力学和偏微分方程的研究中,无界线性算子 (Unbounded Linear Operator) 也扮演着至关重要的角色。本节将介绍无界线性算子的基本概念,并通过一些例子来阐明其特性和重要性。

    定义 11.1.1 (无界线性算子)

    设 \(X\) 和 \(Y\) 是赋范线性空间 (Normed Linear Space)。一个线性算子 \(T: D(T) \subseteq X \rightarrow Y\) 被称为无界线性算子,如果它不是有界线性算子。其中,\(D(T)\) 是 \(T\) 的定义域 (Domain),它是 \(X\) 的一个线性子空间 (Linear Subspace)。

    回顾有界线性算子的定义,一个线性算子 \(T\) 是有界的,当且仅当存在一个常数 \(M \geq 0\),使得对于所有 \(x \in D(T)\),有 \( \|Tx\|_Y \leq M \|x\|_X \)。因此,一个线性算子是无界的,意味着不存在这样的常数 \(M\)。换句话说,对于任意 \(M > 0\),都存在 \(x \in D(T)\) 使得 \( \|Tx\|_Y > M \|x\|_X \)。

    为什么需要研究无界线性算子?

    在有限维空间中,所有的线性算子都是有界的。无界线性算子的概念只有在无限维空间中才有意义。在无限维空间中,无界线性算子的出现是不可避免的,并且在许多物理和数学问题中至关重要。例如:

    量子力学中的算符:在量子力学中,诸如动量算符 (Momentum Operator) 和位置算符 (Position Operator) 等重要的物理量对应的算符通常是无界的。这些算符的无界性与海森堡不确定性原理 (Heisenberg Uncertainty Principle) 等基本物理原理密切相关。

    微分算子:微分运算本身通常导致无界算子。例如,考虑在 \(C[0, 1]\) 空间上的微分算子 \(D = \frac{d}{dt}\),定义域为 \(D(D) = \{f \in C^1[0, 1]\}\)。这个算子是无界的,因为我们可以找到函数序列 \(f_n(t) = \sin(nt)\),其中 \( \|f_n\|_\infty = 1 \),而 \( \|Df_n\|_\infty = \|n \cos(nt)\|_\infty = n \)。当 \(n \rightarrow \infty\) 时,\( \|Df_n\|_\infty \) 可以任意大,即使 \( \|f_n\|_\infty \) 保持不变。

    偏微分方程:偏微分方程理论中,许多重要的算子,如拉普拉斯算子 (Laplacian Operator) 等,在合适的函数空间上被视为无界算子。对这些无界算子的研究是理解和求解偏微分方程的关键。

    例子 11.1.2 (乘法算子)

    设 \(X = Y = L^2[0, 1]\)。定义乘法算子 \(M_f\) 为:
    \[ (M_f g)(t) = f(t) g(t) \]
    其中 \(f\) 是一个定义在 \([0, 1]\) 上的函数,\(D(M_f) = \{g \in L^2[0, 1] : fg \in L^2[0, 1]\}\)。

    考虑 \(f(t) = \frac{1}{t}\) 在 \((0, 1]\) 上,\(f(0) = 1\)。我们来考察 \(M_f\) 是否为 \(L^2[0, 1]\) 上的有界算子。
    取 \(g_n(t) = \begin{cases} \sqrt{n} & 0 < t < \frac{1}{n} \\ 0 & \frac{1}{n} \leq t \leq 1 \end{cases}\)。
    则 \( \|g_n\|_{L^2} = \left( \int_0^{1/n} (\sqrt{n})^2 dt \right)^{1/2} = \left( \int_0^{1/n} n dt \right)^{1/2} = \left( n \cdot \frac{1}{n} \right)^{1/2} = 1 \)。
    而 \( (M_f g_n)(t) = f(t) g_n(t) = \frac{1}{t} g_n(t) = \begin{cases} \frac{\sqrt{n}}{t} & 0 < t < \frac{1}{n} \\ 0 & \frac{1}{n} \leq t \leq 1 \end{cases}\)。
    \[ \|M_f g_n\|_{L^2}^2 = \int_0^{1/n} \left( \frac{\sqrt{n}}{t} \right)^2 dt = \int_0^{1/n} \frac{n}{t^2} dt = n \int_0^{1/n} t^{-2} dt = n \left[ -t^{-1} \right]_0^{1/n} = n \left( -n - (-\infty) \right) = \infty \]
    这个计算有问题,积分下限不能是0。我们重新计算。

    考虑 \(f(t) = \frac{1}{\sqrt{t}}\) 在 \((0, 1]\) 上,\(f(0) = 1\)。
    取 \(g_n(t) = \begin{cases} \sqrt{n} & 0 < t < \frac{1}{n} \\ 0 & \frac{1}{n} \leq t \leq 1 \end{cases}\)。\( \|g_n\|_{L^2} = 1 \)。
    \( (M_f g_n)(t) = f(t) g_n(t) = \frac{1}{\sqrt{t}} g_n(t) = \begin{cases} \frac{\sqrt{n}}{\sqrt{t}} & 0 < t < \frac{1}{n} \\ 0 & \frac{1}{n} \leq t \leq 1 \end{cases}\)。
    \[ \|M_f g_n\|_{L^2}^2 = \int_0^{1/n} \left( \frac{\sqrt{n}}{\sqrt{t}} \right)^2 dt = \int_0^{1/n} \frac{n}{t} dt = n \int_0^{1/n} \frac{1}{t} dt = n \left[ \ln|t| \right]_0^{1/n} = n \left( \ln(\frac{1}{n}) - \lim_{a \rightarrow 0^+} \ln(a) \right) = n (-\ln(n) - (-\infty)) = \infty \]
    仍然有问题。我们换一个函数 \(f(t)\)。

    考虑 \(f(t) = \frac{1}{t^{1/4}}\)。
    \[ \|M_f g_n\|_{L^2}^2 = \int_0^{1/n} \left( \frac{\sqrt{n}}{t^{1/4}} \right)^2 dt = \int_0^{1/n} \frac{n}{t^{1/2}} dt = n \int_0^{1/n} t^{-1/2} dt = n \left[ \frac{t^{1/2}}{1/2} \right]_0^{1/n} = 2n \left[ t^{1/2} \right]_0^{1/n} = 2n \left( (\frac{1}{n})^{1/2} - 0 \right) = 2n \frac{1}{\sqrt{n}} = 2\sqrt{n} \]
    所以 \( \|M_f g_n\|_{L^2} = \sqrt{2} n^{1/4} \)。而 \( \|g_n\|_{L^2} = 1 \)。
    因此,\( \frac{\|M_f g_n\|_{L^2}}{\|g_n\|_{L^2}} = \sqrt{2} n^{1/4} \rightarrow \infty \) 当 \(n \rightarrow \infty\)。
    这表明,当 \(f(t) = \frac{1}{t^{1/4}}\) 时,乘法算子 \(M_f\) 是无界的。

    例子 11.1.3 (微分算子)

    设 \(X = C[0, 1]\) equipped with the supremum norm \( \|\cdot\|_\infty \),\(Y = C[0, 1]\) equipped with the supremum norm \( \|\cdot\|_\infty \)。定义微分算子 \(D\) 为:
    \[ D(f) = f' \]
    定义域为 \(D(D) = C^1[0, 1]\) (在 \([0, 1]\) 上具有连续导数的函数空间)。

    考虑函数序列 \(f_n(t) = \sin(nt)\)。则 \(f_n \in C^1[0, 1]\),且 \( \|f_n\|_\infty = \sup_{t \in [0, 1]} |\sin(nt)| = 1 \)。
    \(D(f_n)(t) = f_n'(t) = n \cos(nt)\)。\( \|D(f_n)\|_\infty = \sup_{t \in [0, 1]} |n \cos(nt)| = n \)。
    因此,\( \frac{\|D(f_n)\|_\infty}{\|f_n\|_\infty} = \frac{n}{1} = n \rightarrow \infty \) 当 \(n \rightarrow \infty\)。
    这表明微分算子 \(D\) 是无界的。

    定义域的重要性

    对于无界线性算子,定义域 \(D(T)\) 的选择至关重要。定义域不仅决定了算子的作用对象,也影响了算子的性质,例如是否可逆、是否有伴随算子等。通常,为了使无界算子具有良好的性质,我们需要仔细选择其定义域。例如,在量子力学中,物理算符的定义域通常需要选择为稠密子空间 (Dense Subspace),以便能够定义伴随算子和进行谱分析。

    总结:无界线性算子是泛函分析中不可或缺的一部分,尤其在无限维空间的应用中。理解其定义、性质和例子,是深入学习泛函分析及其应用的关键一步。

    11.2 稠定算子与伴随算子 (Densely Defined Operators and Adjoint Operators)

    为了进一步研究无界线性算子,特别是为了定义和研究其伴随算子 (Adjoint Operator) 和谱理论 (Spectral Theory),稠定算子 (Densely Defined Operator) 的概念至关重要。本节将介绍稠定算子的定义,并在此基础上引入伴随算子的概念。

    定义 11.2.1 (稠定算子)

    设 \(X\) 和 \(Y\) 是 Hilbert 空间 (Hilbert Space)。一个线性算子 \(T: D(T) \subseteq X \rightarrow Y\) 被称为稠定算子,如果其定义域 \(D(T)\) 在 \(X\) 中是稠密的 (Dense)。即 \( \overline{D(T)} = X \)。

    回忆一下,子集 \(D(T) \subseteq X\) 在 \(X\) 中稠密,意味着对于任意 \(x \in X\) 和任意 \( \epsilon > 0 \),都存在 \(y \in D(T)\) 使得 \( \|x - y\| < \epsilon \)。换句话说,\(X\) 中的每个元素都可以被 \(D(T)\) 中的元素任意逼近。

    为什么需要稠定算子?

    稠定性是定义伴随算子的必要条件。对于稠定算子,我们可以唯一地定义其伴随算子。伴随算子在泛函分析、量子力学和算子理论中都具有核心地位。

    伴随算子的定义

    设 \(T: D(T) \subseteq X \rightarrow Y\) 是一个稠定线性算子,其中 \(X\) 和 \(Y\) 是 Hilbert 空间。我们希望定义 \(T\) 的伴随算子 \(T^*: D(T^*) \subseteq Y \rightarrow X\)。

    对于 \(y \in Y\),如果存在 \(z \in X\),使得对于所有 \(x \in D(T)\),都有
    \[ \langle Tx, y \rangle_Y = \langle x, z \rangle_X \]
    则称 \(y\) 属于 \(T^*\) 的定义域 \(D(T^*)\),并定义 \(T^*y = z\)。

    定理 11.2.2 (伴随算子的存在性和唯一性)

    如果 \(T: D(T) \subseteq X \rightarrow Y\) 是稠定算子,则对于每个 \(y \in D(T^*)\),满足 \( \langle Tx, y \rangle_Y = \langle x, z \rangle_X \) 的 \(z \in X\) 是唯一的。因此,伴随算子 \(T^*\) 是良定义的。

    证明概要:

    假设存在 \(z_1, z_2 \in X\) 都满足条件,则对于所有 \(x \in D(T)\),有 \( \langle x, z_1 \rangle_X = \langle Tx, y \rangle_Y = \langle x, z_2 \rangle_X \)。因此,\( \langle x, z_1 - z_2 \rangle_X = 0 \) 对于所有 \(x \in D(T)\) 成立。由于 \(D(T)\) 在 \(X\) 中稠密,这蕴含着 \(z_1 - z_2 = 0\),即 \(z_1 = z_2\)。因此,\(z\) 是唯一的,\(T^*\) 是良定义的。

    伴随算子的性质

    线性性:\(T^*\) 是线性算子。如果 \(y_1, y_2 \in D(T^*)\) 和 \( \alpha, \beta \in \mathbb{C} \),则 \( \alpha y_1 + \beta y_2 \in D(T^*) \),且 \( T^*(\alpha y_1 + \beta y_2) = \alpha T^*y_1 + \beta T^*y_2 \)。

    闭性:\(T^*\) 是闭算子 (Closed Operator)。即如果 \(y_n \in D(T^*)\) 且 \(y_n \rightarrow y\) in \(Y\) 和 \(T^*y_n \rightarrow z\) in \(X\),则 \(y \in D(T^*)\) 且 \(T^*y = z\)。

    与有界算子的关系:如果 \(T\) 是有界线性算子且定义域为 \(D(T) = X\),则 \(T\) 是稠定的,且其伴随算子 \(T^*\) 与之前定义的伴随算子一致,也是有界的。

    例子 11.2.3 (微分算子的伴随算子)

    考虑 \(X = Y = L^2[0, 1]\)。定义微分算子 \(D = \frac{d}{dt}\),定义域为 \(D(D) = C_c^\infty(0, 1)\) (在 \((0, 1)\) 上具有紧支撑的无穷次可微函数空间)。\(C_c^\infty(0, 1)\) 在 \(L^2[0, 1]\) 中稠密,所以 \(D\) 是稠定算子。

    我们来寻找 \(D\) 的伴随算子 \(D^*\)。对于 \(f \in D(D)\) 和 \(g \in D(D^*)\),我们需要满足 \( \langle Df, g \rangle = \langle f, D^*g \rangle \)。
    \[ \langle Df, g \rangle = \int_0^1 (Df)(t) \overline{g(t)} dt = \int_0^1 f'(t) \overline{g(t)} dt \]
    利用分部积分 (Integration by Parts),由于 \(f \in C_c^\infty(0, 1)\),在边界处 \(f\) 为 0,所以边界项为 0。
    \[ \int_0^1 f'(t) \overline{g(t)} dt = \left[ f(t) \overline{g(t)} \right]_0^1 - \int_0^1 f(t) \overline{g'(t)} dt = - \int_0^1 f(t) \overline{g'(t)} dt = \int_0^1 f(t) \overline{(-g'(t))} dt = \langle f, -g' \rangle \]
    因此,形式上 \(D^*g = -g'\)。为了严格定义 \(D^*\),我们需要确定 \(D(D^*)\)。

    从上述计算可以看出,如果 \(g\) 是可微的,且形式上 \(D^*g = -g'\),则等式 \( \langle Df, g \rangle = \langle f, D^*g \rangle \) 成立。为了精确确定 \(D(D^*)\),我们需要考虑更一般的定义域。

    更精确的定义域需要更细致的分析,通常会涉及到 Sobolev 空间 (Sobolev Space) 的理论。对于 \(D = \frac{d}{dt}\) 在 \(L^2[0, 1]\) 上,如果定义域为 \(D(D) = \{f \in AC[0, 1] : f' \in L^2[0, 1], f(0) = f(1) = 0\}\) (绝对连续函数 (Absolutely Continuous Function) 且导数在 \(L^2\) 中,边界条件为 0),则其伴随算子 \(D^* = -\frac{d}{dt}\),定义域为 \(D(D^*) = \{g \in AC[0, 1] : g' \in L^2[0, 1]\}\) (绝对连续函数且导数在 \(L^2\) 中,没有边界条件)。

    稠定算子的重要性总结

    稠定算子是研究无界算子的基础。稠定性保证了伴随算子的存在性和唯一性,而伴随算子是进一步研究自伴算子、谱理论和量子力学的关键工具。

    11.3 对称算子与自伴算子 (Symmetric Operators and Self-Adjoint Operators)

    对称算子 (Symmetric Operator) 和自伴算子 (Self-Adjoint Operator) 是无界线性算子理论中极其重要的概念,尤其在量子力学中,物理可观测量对应的算符通常被建模为自伴算子。本节将详细介绍对称算子和自伴算子的定义、性质以及它们之间的关系。

    定义 11.3.1 (对称算子)

    设 \(H\) 是 Hilbert 空间,\(T: D(T) \subseteq H \rightarrow H\) 是稠定线性算子。\(T\) 被称为对称算子,如果对于所有 \(x, y \in D(T)\),都有
    \[ \langle Tx, y \rangle = \langle x, Ty \rangle \]
    或者等价地,\(T \subseteq T^*\),即 \(D(T) \subseteq D(T^*)\) 且对于所有 \(x \in D(T)\),\(T^*x = Tx\)。

    定义 11.3.2 (自伴算子)

    设 \(H\) 是 Hilbert 空间,\(T: D(T) \subseteq H \rightarrow H\) 是稠定线性算子。\(T\) 被称为自伴算子,如果 \(T = T^*\),即 \(T\) 是对称的,且 \(D(T) = D(T^*)\)。

    对称性与自伴性的区别

    对称性 \(T \subseteq T^*\) 仅要求 \(D(T) \subseteq D(T^*)\) 且在 \(D(T)\) 上 \(T\) 和 \(T^*\) 的作用效果相同。而自伴性 \(T = T^*\) 则要求更强,不仅要对称,还需要定义域相等,即 \(D(T) = D(T^*)\)。

    对于有界线性算子,对称性与自伴性是等价的。但对于无界线性算子,对称算子不一定是自伴算子,自伴算子一定是对称算子。自伴性比对称性更强,也更重要。

    为什么自伴算子在量子力学中如此重要?

    在量子力学中,物理可观测量(如能量、动量、位置等)对应于 Hilbert 空间上的自伴算子。自伴算子具有以下重要性质,使其成为量子力学中物理可观测量的理想数学模型:

    谱定理:自伴算子满足谱定理 (Spectral Theorem),这意味着我们可以对自伴算子进行谱分解 (Spectral Decomposition),从而分析其本征值 (Eigenvalue) 和本征向量 (Eigenvector),这在量子力学的物理解释中至关重要。

    实本征值:自伴算子的本征值都是实数,这与物理可观测量是实数值的要求相符。

    时间演化:量子力学中的时间演化算符通常与自伴的哈密顿算符 (Hamiltonian Operator) 相关联,通过薛定谔方程 (Schrödinger Equation) 描述系统的演化。

    例子 11.3.3 (实数乘法算子)

    设 \(H = L^2(\mathbb{R})\)。考虑乘法算子 \(M_x\),定义为 \( (M_x f)(x) = x f(x) \),定义域为 \(D(M_x) = \{f \in L^2(\mathbb{R}) : xf(x) \in L^2(\mathbb{R})\}\)。\(D(M_x)\) 在 \(L^2(\mathbb{R})\) 中稠密。

    对于 \(f, g \in D(M_x)\),
    \[ \langle M_x f, g \rangle = \int_{-\infty}^{\infty} (xf(x)) \overline{g(x)} dx = \int_{-\infty}^{\infty} f(x) \overline{(x g(x))} dx = \langle f, M_x g \rangle \]
    因此,\(M_x\) 是对称算子。事实上,可以证明 \(M_x\) 是自伴算子,即 \(M_x = M_x^*\)。

    例子 11.3.4 (动量算符)

    设 \(H = L^2(\mathbb{R})\)。考虑动量算符 \(P = -i \frac{d}{dx}\),定义域为 \(D(P) = C_c^\infty(\mathbb{R})\)。\(D(P)\) 在 \(L^2(\mathbb{R})\) 中稠密,所以 \(P\) 是稠定算子。

    对于 \(f, g \in C_c^\infty(\mathbb{R})\),利用分部积分:
    \[ \langle Pf, g \rangle = \int_{-\infty}^{\infty} (-i f'(x)) \overline{g(x)} dx = -i \int_{-\infty}^{\infty} f'(x) \overline{g(x)} dx = -i \left[ f(x) \overline{g(x)} \right]_{-\infty}^{\infty} - i \int_{-\infty}^{\infty} f(x) \overline{(-g'(x))} dx \]
    由于 \(f, g \in C_c^\infty(\mathbb{R})\),边界项为 0。
    \[ \langle Pf, g \rangle = -i (-\int_{-\infty}^{\infty} f(x) \overline{g'(x)} dx) = i \int_{-\infty}^{\infty} f(x) \overline{g'(x)} dx = \int_{-\infty}^{\infty} f(x) \overline{(-i g'(x))} dx = \langle f, -i \frac{d}{dx} g \rangle = \langle f, Pg \rangle \]
    因此,动量算符 \(P\) 在定义域 \(C_c^\infty(\mathbb{R})\) 上是对称算子。然而,在 \(D(P) = C_c^\infty(\mathbb{R})\) 上,\(P\) 不是自伴算子。为了使其自伴,需要扩大定义域。合适的自伴扩张 (Self-Adjoint Extension) 的定义域通常涉及到傅里叶变换 (Fourier Transform) 和 Sobolev 空间。

    自伴扩张

    一个对称算子 \(T\) 如果 \(T = T^{**}\),则称 \(T\) 是预解子自伴的 (Essentially Self-Adjoint)。预解子自伴算子具有唯一的自伴扩张 \(\overline{T}\) (闭包 (Closure) \(\overline{T}\) 是自伴的)。

    对于动量算符 \(P = -i \frac{d}{dx}\) 在 \(D(P) = C_c^\infty(\mathbb{R})\) 上,它是预解子自伴的,其自伴扩张的定义域可以更精确地描述。

    总结

    对称算子和自伴算子是无界算子理论的核心概念。自伴算子在量子力学中扮演着基础性的角色。理解对称性和自伴性的区别,以及自伴算子的重要性质,对于深入学习泛函分析及其在物理学中的应用至关重要。本节为进一步研究无界算子的谱理论和应用奠定了基础。

    12. chapter 12: 泛函分析的应用 (Applications of Functional Analysis)

    12.1 Sobolev 空间简介 (Introduction to Sobolev Spaces)

    Sobolev 空间 (Sobolev Space) 是泛函分析在偏微分方程 (Partial Differential Equations, PDEs) 领域中最重要的应用之一。它们为研究偏微分方程的解的存在性、唯一性和正则性提供了强大的工具。Sobolev 空间本质上是函数空间,它不仅考虑了函数的取值,还考虑了函数的导数信息,并赋予了合适的范数结构,使其成为 Banach 空间 (Banach Space) 或 Hilbert 空间 (Hilbert Space)。

    12.1.1 弱导数 (Weak Derivatives)

    在经典微积分中,导数是函数变化率的度量。然而,对于许多实际问题中遇到的函数,例如不连续函数或导数不连续的函数,经典导数可能不存在。为了处理这类函数,引入了弱导数 (Weak Derivatives) 的概念。

    设 \(\Omega \subseteq \mathbb{R}^n\) 是一个开集,\(u \in L^1_{loc}(\Omega)\) 是一个局部可积函数。对于给定的多重指标 \(\alpha = (\alpha_1, \ldots, \alpha_n)\),如果存在一个局部可积函数 \(v \in L^1_{loc}(\Omega)\),使得对于所有检验函数 \(\phi \in C_c^\infty(\Omega)\) (即,具有紧支撑的无限次可微函数),满足如下积分等式:
    \[ \int_\Omega u(x) D^\alpha \phi(x) dx = (-1)^{|\alpha|} \int_\Omega v(x) \phi(x) dx \]
    其中 \(D^\alpha = \frac{\partial^{|\alpha|}}{\partial x_1^{\alpha_1} \cdots \partial x_n^{\alpha_n}}\) 是微分算子,\(|\alpha| = \alpha_1 + \cdots + \alpha_n\) 是多重指标的阶数。则称 \(v\) 是 \(u\) 的 \(\alpha\) 阶弱导数,记为 \(D^\alpha u = v\)。

    要点:
    ① 弱导数的定义是基于分部积分公式 (Integration by Parts Formula) 的推广。
    ② 弱导数是唯一的,如果它存在(在几乎处处相等的意义下)。
    ③ 如果函数 \(u\) 具有经典导数 \(D^\alpha u\),且 \(D^\alpha u\) 也是局部可积的,那么弱导数 \(D^\alpha u\) 与经典导数一致。
    ④ 弱导数的概念将导数的定义推广到了更广泛的函数空间,使得我们可以对不一定可微的函数讨论“导数”。

    12.1.2 Sobolev 空间的定义 (Definition of Sobolev Spaces)

    基于弱导数的概念,我们可以定义 Sobolev 空间。对于整数 \(k \geq 0\) 和实数 \(1 \leq p \leq \infty\),Sobolev 空间 \(W^{k,p}(\Omega)\) 定义为:
    \[ W^{k,p}(\Omega) = \{ u \in L^p(\Omega) : D^\alpha u \in L^p(\Omega), \forall |\alpha| \leq k \} \]
    其中 \(D^\alpha u\) 是 \(u\) 的 \(\alpha\) 阶弱导数,\(L^p(\Omega)\) 是在 \(\Omega\) 上的 \(p\) 次可积函数空间。

    在 \(W^{k,p}(\Omega)\) 上,定义范数 (Norm) 为:
    \[ \|u\|_{W^{k,p}(\Omega)} = \left( \sum_{|\alpha| \leq k} \|D^\alpha u\|_{L^p(\Omega)}^p \right)^{1/p}, \quad 1 \leq p < \infty \]
    \[ \|u\|_{W^{k,\infty}(\Omega)} = \max_{|\alpha| \leq k} \|D^\alpha u\|_{L^\infty(\Omega)}, \quad p = \infty \]
    当 \(p=2\) 时,Sobolev 空间 \(W^{k,2}(\Omega)\) 通常记为 \(H^k(\Omega)\),它是一个 Hilbert 空间,其内积 (Inner Product) 定义为:
    \[ (u, v)_{H^k(\Omega)} = \sum_{|\alpha| \leq k} \int_\Omega D^\alpha u(x) \overline{D^\alpha v(x)} dx \]

    关键性质:
    ① \(W^{k,p}(\Omega)\) 在范数 \(\|\cdot\|_{W^{k,p}(\Omega)}\) 下是 Banach 空间。当 \(p=2\) 时,\(H^k(\Omega)\) 是 Hilbert 空间。
    ② \(W^{0,p}(\Omega) = L^p(\Omega)\) 和 \(H^0(\Omega) = L^2(\Omega)\)。
    ③ Sobolev 空间刻画了函数的正则性 (Regularity)。\(k\) 值越大,对函数及其导数的积分性质要求越高,函数就越“光滑”。

    12.1.3 Sobolev 空间的性质 (Properties of Sobolev Spaces)

    Sobolev 空间具有许多重要的性质,这些性质使其在偏微分方程理论中扮演关键角色。

    完备性 (Completeness):\(W^{k,p}(\Omega)\) 在范数 \(\|\cdot\|_{W^{k,p}(\Omega)}\) 下是完备的,因此是 Banach 空间。\(H^k(\Omega)\) 是 Hilbert 空间。完备性保证了在 Sobolev 空间中可以进行极限运算,这对于分析解的存在性至关重要。

    可分性 (Separability):当 \(1 \leq p < \infty\) 时,\(W^{k,p}(\Omega)\) 是可分的。\(H^k(\Omega)\) 也是可分的。可分性在某些逼近理论和数值方法中很有用。

    自反性 (Reflexivity):当 \(1 < p < \infty\) 时,\(W^{k,p}(\Omega)\) 是自反的。特别是,\(H^k(\Omega)\) 是自反的 (因为 Hilbert 空间都是自反的)。自反性在变分方法中用于证明弱解的存在性。

    嵌入定理 (Embedding Theorems):Sobolev 嵌入定理 (Sobolev Embedding Theorem) 和 Rellich-Kondrachov 紧嵌入定理 (Rellich-Kondrachov Compact Embedding Theorem) 描述了不同 Sobolev 空间之间的关系,以及 Sobolev 空间与经典函数空间 (如 \(C^m(\Omega)\)) 之间的关系。这些定理是研究偏微分方程解的正则性的核心工具。

    ▮▮▮▮⚝ Sobolev 嵌入定理: 粗略地说,如果 \(u \in W^{k,p}(\Omega)\),那么在一定的条件下,\(u\) 属于 \(L^q(\Omega)\) 或 \(C^m(\Omega)\),其中 \(q\) 和 \(m\) 取决于 \(k, p, n\)。例如,如果 \(\Omega \subseteq \mathbb{R}^n\) 是 Lipschitz 区域,\(kp > n\),则 \(W^{k,p}(\Omega) \hookrightarrow C^{k - \lfloor n/p \rfloor - 1, \gamma}(\overline{\Omega})\) 对于某个 \(0 < \gamma \leq 1\)。这意味着 Sobolev 空间的函数在一定条件下是 Hölder 连续的。

    ▮▮▮▮⚝ Rellich-Kondrachov 紧嵌入定理: 在适当的条件下,Sobolev 空间到 \(L^q\) 空间的嵌入是紧的。例如,如果 \(\Omega \subseteq \mathbb{R}^n\) 是有界 Lipschitz 区域,\(1 \leq p < n\),\(1 \leq q < \frac{np}{n-p}\),则 \(W^{1,p}(\Omega) \hookrightarrow\hookrightarrow L^q(\Omega)\) 是紧嵌入。紧嵌入在变分方法中用于证明极小化问题的解的存在性。

    迹定理 (Trace Theorem):迹定理描述了 Sobolev 空间中的函数在区域边界上的行为。对于 \(u \in W^{k,p}(\Omega)\),其“迹” (trace) 可以定义在边界 \(\partial \Omega\) 上,并且这个迹属于某个 Sobolev 空间 \(W^{s,p}(\partial \Omega)\),其中 \(s < k - 1/p\)。迹定理允许我们在弱解的框架下处理边值条件。

    12.1.4 Sobolev 空间的例子与应用 (Examples and Applications)

    例子:
    ① 在 \(\Omega = (0, 1)\) 上,函数 \(u(x) = |x - 1/2|\) 属于 \(W^{1,1}(0, 1)\) 和 \(W^{1,p}(0, 1)\) for \(1 \leq p < \infty\),但不属于 \(W^{2,1}(0, 1)\) 或 \(W^{2,p}(0, 1)\) for \(p \geq 1\)。
    ② 分段光滑函数在适当的 Sobolev 空间中。例如,在 \(\Omega = (-1, 1)\) 上,定义 \(u(x) = -x\) for \(x < 0\) 和 \(u(x) = x^2\) for \(x \geq 0\)。则 \(u \in W^{1,p}(-1, 1)\) for all \(1 \leq p \leq \infty\),但 \(u \notin W^{2,p}(-1, 1)\) for any \(p \geq 1\)。

    应用:
    偏微分方程的弱解理论: Sobolev 空间是研究偏微分方程弱解 (Weak Solution) 的自然框架。许多偏微分方程,特别是椭圆型方程,可以通过变分方法在 Sobolev 空间中找到弱解。
    有限元方法 (Finite Element Method):有限元方法是一种重要的数值方法,用于求解偏微分方程。Sobolev 空间理论为有限元方法的收敛性分析提供了理论基础。
    图像处理 (Image Processing) 和计算机视觉 (Computer Vision):Sobolev 空间及其变体 (如 Total Variation 空间) 在图像去噪、图像分割等领域有广泛应用。
    流体力学 (Fluid Mechanics) 和弹性力学 (Elasticity):Sobolev 空间用于描述流体速度场和弹性体的位移场,并用于建立和分析相关的偏微分方程模型。

    Sobolev 空间的引入极大地扩展了偏微分方程的研究范围,使得我们可以处理更广泛的解,并发展出强大的理论和数值方法。

    12.2 椭圆型偏微分方程的变分方法 (Variational Methods for Elliptic PDEs)

    变分方法 (Variational Methods) 是求解偏微分方程,特别是椭圆型偏微分方程 (Elliptic Partial Differential Equations) 的一类重要方法。它基于泛函分析的理论,将偏微分方程的求解问题转化为泛函的极值问题。变分方法不仅提供了理论分析的框架,也为数值求解提供了有效途径,如有限元方法。

    12.2.1 椭圆型偏微分方程简介 (Introduction to Elliptic PDEs)

    椭圆型偏微分方程是一类重要的偏微分方程,广泛出现在物理学、工程学和应用数学的各个领域。典型的椭圆型方程的例子包括 Laplace 方程 (Laplace Equation)、Poisson 方程 (Poisson Equation) 和线性弹性方程 (Linear Elasticity Equations)。

    二阶线性椭圆型方程的一般形式:
    \[ -\sum_{i,j=1}^n \frac{\partial}{\partial x_i} \left( a_{ij}(x) \frac{\partial u}{\partial x_j} \right) + \sum_{i=1}^n b_i(x) \frac{\partial u}{\partial x_i} + c(x) u = f(x), \quad x \in \Omega \]
    其中 \(\Omega \subseteq \mathbb{R}^n\) 是一个开集,系数 \(a_{ij}(x), b_i(x), c(x)\) 和右端项 \(f(x)\) 是给定的函数。椭圆性条件要求矩阵 \((a_{ij}(x))\) 是正定的,即存在常数 \(\lambda > 0\),使得
    \[ \sum_{i,j=1}^n a_{ij}(x) \xi_i \xi_j \geq \lambda |\xi|^2, \quad \forall x \in \Omega, \forall \xi \in \mathbb{R}^n \]

    常见的椭圆型方程:
    Laplace 方程: \(\Delta u = 0\),其中 \(\Delta = \sum_{i=1}^n \frac{\partial^2}{\partial x_i^2}\) 是 Laplace 算子 (Laplace Operator)。描述稳态热传导、静电场等。
    Poisson 方程: \(-\Delta u = f(x)\)。非齐次 Laplace 方程,描述有源项的热传导、电势分布等。
    Helmholtz 方程: \(-\Delta u + \lambda u = f(x)\)。出现在波动问题、量子力学等领域。

    为了完整地确定椭圆型方程的解,通常需要附加边界条件 (Boundary Conditions)。常见的边界条件包括 Dirichlet 边界条件 (Dirichlet Boundary Condition) (给定边界上的函数值) 和 Neumann 边界条件 (Neumann Boundary Condition) (给定边界上的法向导数)。

    12.2.2 边值问题的弱形式 (Weak Formulation of Boundary Value Problems)

    考虑带有 Dirichlet 边界条件的 Poisson 方程:
    \[ \begin{cases} -\Delta u = f & \text{in } \Omega \\ u = 0 & \text{on } \partial \Omega \end{cases} \]
    其中 \(\Omega \subseteq \mathbb{R}^n\) 是有界 Lipschitz 区域,\(f \in L^2(\Omega)\)。为了导出弱形式,我们将方程乘以一个检验函数 \(v \in C_c^\infty(\Omega)\),并在 \(\Omega\) 上积分:
    \[ -\int_\Omega (\Delta u) v dx = \int_\Omega f v dx \]
    利用分部积分公式 (格林公式),并将边界条件 \(v|_{\partial \Omega} = 0\) 考虑进去,我们得到:
    \[ \int_\Omega \nabla u \cdot \nabla v dx = \int_\Omega f v dx \]
    其中 \(\nabla u \cdot \nabla v = \sum_{i=1}^n \frac{\partial u}{\partial x_i} \frac{\partial v}{\partial x_i}\) 是梯度 (Gradient) 的内积。

    弱形式的思想是将检验函数空间扩展到 Sobolev 空间 \(H_0^1(\Omega)\),其中 \(H_0^1(\Omega)\) 是 \(C_c^\infty(\Omega)\) 在 \(H^1(\Omega)\) 中的闭包。弱解 \(u \in H_0^1(\Omega)\) 定义为满足如下变分方程 (Variational Equation) 的函数:
    \[ \int_\Omega \nabla u \cdot \nabla v dx = \int_\Omega f v dx, \quad \forall v \in H_0^1(\Omega) \]

    一般二阶椭圆型方程的弱形式:
    对于更一般的二阶椭圆型方程,可以类似地导出弱形式。例如,对于方程
    \[ -\sum_{i,j=1}^n \frac{\partial}{\partial x_i} \left( a_{ij}(x) \frac{\partial u}{\partial x_j} \right) + c(x) u = f(x) \quad \text{in } \Omega, \quad u = 0 \text{ on } \partial \Omega \]
    其弱形式为:找到 \(u \in H_0^1(\Omega)\),使得
    \[ a(u, v) = \int_\Omega f v dx, \quad \forall v \in H_0^1(\Omega) \]
    其中双线性形式 (Bilinear Form) \(a(u, v)\) 定义为:
    \[ a(u, v) = \int_\Omega \left( \sum_{i,j=1}^n a_{ij}(x) \frac{\partial u}{\partial x_j} \frac{\partial v}{\partial x_i} + c(x) u v \right) dx \]

    12.2.3 变分原理:Ritz-Galerkin 方法与 Lax-Milgram 定理 (Variational Principles: Ritz-Galerkin Method and Lax-Milgram Theorem)

    变分方法的核心思想是将求解偏微分方程的弱形式转化为泛函的极值问题。

    能量泛函 (Energy Functional):对于 Poisson 方程的 Dirichlet 问题,可以定义能量泛函 \(J: H_0^1(\Omega) \to \mathbb{R}\) 为:
    \[ J(v) = \frac{1}{2} \int_\Omega |\nabla v|^2 dx - \int_\Omega f v dx \]
    可以证明,Poisson 方程的弱解 \(u \in H_0^1(\Omega)\) 是能量泛函 \(J(v)\) 的极小值点。反之,能量泛函的极小值点也是 Poisson 方程的弱解。这种将偏微分方程与泛函极值问题联系起来的思想是变分方法的基石。

    Ritz-Galerkin 方法 (Ritz-Galerkin Method):Ritz-Galerkin 方法是一种求解变分问题的数值方法。其基本思想是在有限维子空间 \(V_h \subseteq H_0^1(\Omega)\) 中寻找能量泛函 \(J(v)\) 的极小值点 \(u_h \in V_h\)。通常,\(V_h\) 由有限元基函数 (Finite Element Basis Functions) 张成。Ritz-Galerkin 近似解 \(u_h\) 满足 Galerkin 正交性 (Galerkin Orthogonality):
    \[ a(u_h, v_h) = \int_\Omega f v_h dx, \quad \forall v_h \in V_h \]
    当子空间 \(V_h\) 逼近 \(H_0^1(\Omega)\) 时,Ritz-Galerkin 近似解 \(u_h\) 收敛到真解 \(u\)。

    Lax-Milgram 定理 (Lax-Milgram Theorem):Lax-Milgram 定理是证明线性变分方程解的存在性和唯一性的重要工具。它给出了在 Hilbert 空间中,当双线性形式 \(a(u, v)\) 满足连续性 (Continuity) 和强制性 (Coercivity) 条件时,变分方程 \(a(u, v) = \langle F, v \rangle\) 存在唯一解的条件。

    ▮▮▮▮⚝ 连续性: 存在常数 \(M > 0\),使得 \(|a(u, v)| \leq M \|u\| \|v\|, \quad \forall u, v \in H\)。
    ▮▮▮▮⚝ 强制性: 存在常数 \(\alpha > 0\),使得 \(a(u, u) \geq \alpha \|u\|^2, \quad \forall u \in H\)。

    如果双线性形式 \(a(u, v)\) 在 Hilbert 空间 \(H\) 上满足连续性和强制性,且 \(F \in H'\) (对偶空间),则变分方程 \(a(u, v) = \langle F, v \rangle\) 存在唯一的解 \(u \in H\)。

    对于 Poisson 方程的弱形式,双线性形式 \(a(u, v) = \int_\Omega \nabla u \cdot \nabla v dx\) 在 \(H_0^1(\Omega)\) 上是连续且强制的 (利用 Poincaré 不等式 (Poincaré Inequality)),因此 Lax-Milgram 定理保证了弱解的存在唯一性。

    12.2.4 变分方法的应用 (Applications of Variational Methods)

    变分方法广泛应用于求解各种椭圆型偏微分方程,包括:
    线性椭圆型方程: 如 Poisson 方程、Helmholtz 方程、二阶散度型方程等。变分方法可以证明弱解的存在唯一性,并为数值求解提供理论基础。
    非线性椭圆型方程: 变分方法可以推广到某些非线性椭圆型方程,例如利用极小化方法 (Minimization Methods) 或临界点理论 (Critical Point Theory) 研究非线性方程的解。
    特征值问题 (Eigenvalue Problems):椭圆型算子的特征值问题可以通过变分方法进行研究,例如利用 Ritz 变分原理 (Ritz Variational Principle) 逼近特征值和特征函数。
    最优控制问题 (Optimal Control Problems):变分方法在偏微分方程约束的最优控制问题中也发挥重要作用,例如利用伴随方法 (Adjoint Method) 导出最优性条件。

    变分方法不仅是求解椭圆型方程的有效工具,也是理解偏微分方程解的性质和结构的重要理论框架。

    12.3 泛函分析在量子力学中的应用 (Applications in Quantum Mechanics)

    量子力学 (Quantum Mechanics) 的数学基础深刻地依赖于泛函分析。Hilbert 空间 (Hilbert Space)、线性算子 (Linear Operator) 和谱理论 (Spectral Theory) 等泛函分析的核心概念构成了量子力学的数学语言和工具。

    12.3.1 量子力学的 Hilbert 空间表述 (Hilbert Space Formulation of Quantum Mechanics)

    在量子力学的 Hilbert 空间表述中,系统的状态 (State) 由 Hilbert 空间 \(\mathcal{H}\) 中的单位向量 (或射线) 表示。物理可观测量 (Observable) 由 Hilbert 空间上的自伴算子 (Self-Adjoint Operator) 表示。

    状态空间 (State Space):量子系统的状态空间是一个可分的复 Hilbert 空间 \(\mathcal{H}\)。例如,对于单粒子系统,状态空间可以是 \(L^2(\mathbb{R}^3)\)。状态 \(\psi \in \mathcal{H}\) 必须是归一化的,即 \(\|\psi\| = 1\)。

    可观测量 (Observables):物理可观测量,如位置、动量、能量、角动量等,由 Hilbert 空间 \(\mathcal{H}\) 上的自伴算子表示。自伴算子的谱 (Spectrum) 对应于可观测量可能取值的集合。

    ▮▮▮▮⚝ 位置算符 (Position Operator):在 \(L^2(\mathbb{R}^3)\) 中,位置算符 \(\mathbf{Q} = (Q_1, Q_2, Q_3)\) 定义为 \((Q_j \psi)(x) = x_j \psi(x)\)。
    ▮▮▮▮⚝ 动量算符 (Momentum Operator):动量算符 \(\mathbf{P} = (P_1, P_2, P_3)\) 定义为 \((P_j \psi)(x) = -i \hbar \frac{\partial}{\partial x_j} \psi(x)\),其中 \(\hbar\) 是约化普朗克常数 (Reduced Planck Constant)。动量算符是无界算子 (Unbounded Operator),需要仔细处理其定义域 (Domain)。
    ▮▮▮▮⚝ 哈密顿算符 (Hamiltonian Operator):哈密顿算符 \(H\) 表示系统的总能量。对于非相对论性粒子,哈密顿算符通常具有形式 \(H = \frac{\mathbf{P}^2}{2m} + V(\mathbf{Q})\),其中 \(m\) 是质量,\(V(\mathbf{Q})\) 是势能算符 (Potential Energy Operator)。

    测量 (Measurement):当对系统进行可观测量 \(A\) 的测量时,可能的测量结果是算子 \(A\) 的谱值。如果系统的状态是 \(\psi\),则测量结果为 \(\lambda\) 的概率与 \(\psi\) 在 \(A\) 的对应于特征值 \(\lambda\) 的特征子空间上的投影有关 (Born 规则 (Born Rule))。

    时间演化 (Time Evolution):量子系统的状态随时间演化由 Schrödinger 方程 (Schrödinger Equation) 描述:
    \[ i \hbar \frac{\partial}{\partial t} \psi(t) = H \psi(t) \]
    其中 \(H\) 是哈密顿算符。Schrödinger 方程是一个线性偏微分方程,其解 \(\psi(t)\) 描述了系统在时刻 \(t\) 的状态。

    12.3.2 薛定谔方程及其泛函分析解释 (Schrödinger Equation and its Functional Analytic Interpretation)

    薛定谔方程是量子力学的基本方程,描述了量子系统状态的时间演化。从泛函分析的角度来看,薛定谔方程是一个 Hilbert 空间上的演化方程。

    定态薛定谔方程 (Time-Independent Schrödinger Equation):对于不随时间变化的势能 \(V(\mathbf{Q})\),可以考虑定态解 \(\psi(x, t) = e^{-iEt/\hbar} \psi(x)\)。将此形式代入薛定谔方程,得到定态薛定谔方程:
    \[ H \psi = E \psi \]
    这是一个特征值方程 (Eigenvalue Equation),其中 \(H\) 是哈密顿算符,\(E\) 是能量特征值,\(\psi\) 是对应的特征函数 (Eigenfunction)。定态薛定谔方程的解对应于系统的定态 (Stationary States),即能量确定的状态。

    时间依赖薛定谔方程 (Time-Dependent Schrödinger Equation):时间依赖薛定谔方程描述了系统状态随时间的演化。给定初始状态 \(\psi(0)\),薛定谔方程的解 \(\psi(t)\) 可以通过算子理论来研究。如果哈密顿算符 \(H\) 是自伴的,则可以定义酉演化算子 (Unitary Evolution Operator) \(U(t) = e^{-iHt/\hbar}\),使得 \(\psi(t) = U(t) \psi(0)\)。酉算子 \(U(t)\) 保持 Hilbert 空间中的范数不变,保证了概率守恒。

    谱理论在量子力学中的应用 (Spectral Theory in Quantum Mechanics):谱理论是泛函分析的重要分支,在量子力学中具有核心地位。自伴算子的谱分解 (Spectral Decomposition) 定理允许我们将自伴算子表示为谱测度 (Spectral Measure) 的积分,这为理解可观测量的可能取值和概率分布提供了数学基础。

    ▮▮▮▮⚝ 离散谱 (Discrete Spectrum):对应于束缚态 (Bound States),例如原子中的电子能级。离散谱的特征值是孤立的,特征函数是平方可积的。
    ▮▮▮▮⚝ 连续谱 (Continuous Spectrum):对应于散射态 (Scattering States) 或自由粒子态。连续谱的特征值构成连续统,特征函数不是平方可积的 (严格意义上不是 Hilbert 空间中的向量,而是广义特征函数)。

    12.3.3 量子力学中的算子 (Operators in Quantum Mechanics)

    量子力学中使用的算子具有特殊的性质,例如自伴性、酉性等。这些性质与物理可观测量的实值性、时间演化的幺正性等物理要求密切相关。

    自伴算子 (Self-Adjoint Operators):表示物理可观测量的算子必须是自伴的。自伴算子的特征值是实数,对应于可观测量的可能测量结果。谱定理保证了自伴算子具有谱分解,这使得我们可以分析可观测量的谱性质。

    酉算子 (Unitary Operators):时间演化算子 \(U(t) = e^{-iHt/\hbar}\) 是酉算子。酉算子保持 Hilbert 空间中的内积不变,对应于量子力学中的幺正演化 (Unitary Evolution)。酉算子的谱位于单位圆上。

    无界算子 (Unbounded Operators):位置算符和动量算符是无界算子。无界算子的定义和性质需要更精细的泛函分析处理,例如稠定算子 (Densely Defined Operators)、闭算子 (Closed Operators) 等概念。

    紧算子 (Compact Operators)Fredholm 算子 (Fredholm Operators):紧算子在量子力学的某些问题中出现,例如在研究散射理论 (Scattering Theory) 和多体问题 (Many-Body Problems) 时。Fredholm 算子理论在指标理论 (Index Theory) 和拓扑量子态 (Topological Quantum States) 的研究中发挥作用。

    泛函分析为量子力学提供了严谨的数学框架,使得我们可以精确地描述量子现象,并发展出强大的计算和分析方法。从 Hilbert 空间、算子理论到谱分析,泛函分析的概念和工具已经深入到量子力学的各个方面。

    附录 A:集合论基础 (Basic Set Theory)

    (内容略,此处为附录占位符)

    附录 B:度量空间中的基本定理 (Basic Theorems in Metric Spaces)

    (内容略,此处为附录占位符)