014 《实分析之美:从基础到前沿 (The Beauty of Real Analysis: From Foundations to Frontiers)》
🌟🌟🌟本文案由Gemini 2.0 Flash Thinking Experimental 01-21创作,用来辅助学习知识。🌟🌟🌟
书籍大纲
▮▮▮▮ 1. chapter 1: 预备知识:数学分析的基石 (Preliminaries: The Cornerstone of Mathematical Analysis)
▮▮▮▮▮▮▮ 1.1 集合论基础 (Basic Set Theory)
▮▮▮▮▮▮▮▮▮▮▮ 1.1.1 集合及其运算 (Sets and Operations on Sets)
▮▮▮▮▮▮▮▮▮▮▮ 1.1.2 函数 (Functions)
▮▮▮▮▮▮▮▮▮▮▮ 1.1.3 关系与等价关系 (Relations and Equivalence Relations)
▮▮▮▮▮▮▮ 1.2 逻辑与证明 (Logic and Proofs)
▮▮▮▮▮▮▮▮▮▮▮ 1.2.1 命题逻辑 (Propositional Logic)
▮▮▮▮▮▮▮▮▮▮▮ 1.2.2 谓词逻辑 (Predicate Logic)
▮▮▮▮▮▮▮▮▮▮▮ 1.2.3 数学证明方法 (Methods of Mathematical Proof)
▮▮▮▮▮▮▮ 1.3 实数系统 (The Real Number System)
▮▮▮▮▮▮▮▮▮▮▮ 1.3.1 实数的公理化定义 (Axiomatic Definition of Real Numbers)
▮▮▮▮▮▮▮▮▮▮▮ 1.3.2 有序域与完备性 (Ordered Field and Completeness)
▮▮▮▮▮▮▮▮▮▮▮ 1.3.3 确界原理 (Supremum and Infimum Principle)
▮▮▮▮▮▮▮ 1.4 数学归纳法 (Mathematical Induction)
▮▮▮▮▮▮▮▮▮▮▮ 1.4.1 第一数学归纳法 (First Principle of Mathematical Induction)
▮▮▮▮▮▮▮▮▮▮▮ 1.4.2 第二数学归纳法 (Second Principle of Mathematical Induction)
▮▮▮▮ 2. chapter 2: 序列与极限:无限的逼近 (Sequences and Limits: Approaching Infinity)
▮▮▮▮▮▮▮ 2.1 数列的极限 (Limits of Sequences)
▮▮▮▮▮▮▮▮▮▮▮ 2.1.1 数列极限的定义 (Definition of Sequence Limit)
▮▮▮▮▮▮▮▮▮▮▮ 2.1.2 极限的性质 (Properties of Limits)
▮▮▮▮▮▮▮▮▮▮▮ 2.1.3 极限的唯一性、有界性、保号性 (Uniqueness, Boundedness, and Sign-Preserving Property of Limits)
▮▮▮▮▮▮▮ 2.2 收敛数列的性质 (Properties of Convergent Sequences)
▮▮▮▮▮▮▮▮▮▮▮ 2.2.1 子数列 (Subsequences)
▮▮▮▮▮▮▮▮▮▮▮ 2.2.2 Cauchy 收敛准则 (Cauchy Convergence Criterion)
▮▮▮▮▮▮▮ 2.3 函数的极限 (Limits of Functions)
▮▮▮▮▮▮▮▮▮▮▮ 2.3.1 函数极限的定义 (Definition of Function Limit)
▮▮▮▮▮▮▮▮▮▮▮ 2.3.2 函数极限的性质 (Properties of Function Limits)
▮▮▮▮▮▮▮ 2.4 无穷小与无穷大 (Infinitesimals and Infinitesimals)
▮▮▮▮▮▮▮▮▮▮▮ 2.4.1 无穷小的比较 (Comparison of Infinitesimals)
▮▮▮▮▮▮▮▮▮▮▮ 2.4.2 无穷大 (Infinitesimals)
▮▮▮▮ 3. chapter 3: 连续性:函数图像的连绵不断 (Continuity: Uninterrupted Graphs of Functions)
▮▮▮▮▮▮▮ 3.1 连续函数的定义 (Definition of Continuous Functions)
▮▮▮▮▮▮▮▮▮▮▮ 3.1.1 点连续与区间连续 (Pointwise Continuity and Interval Continuity)
▮▮▮▮▮▮▮▮▮▮▮ 3.1.2 连续性的局部性质 (Local Properties of Continuity)
▮▮▮▮▮▮▮ 3.2 连续函数的性质 (Properties of Continuous Functions)
▮▮▮▮▮▮▮▮▮▮▮ 3.2.1 连续函数的四则运算 (Arithmetic Operations of Continuous Functions)
▮▮▮▮▮▮▮▮▮▮▮ 3.2.2 复合函数的连续性 (Continuity of Composite Functions)
▮▮▮▮▮▮▮ 3.3 闭区间上连续函数的性质 (Properties of Continuous Functions on Closed Intervals)
▮▮▮▮▮▮▮▮▮▮▮ 3.3.1 介值定理 (Intermediate Value Theorem)
▮▮▮▮▮▮▮▮▮▮▮ 3.3.2 最值定理 (Extreme Value Theorem)
▮▮▮▮▮▮▮▮▮▮▮ 3.3.3 一致连续性 (Uniform Continuity)
▮▮▮▮ 4. chapter 4: 微分学:变化率的精妙刻画 (Differential Calculus: Exquisite Description of Rates of Change)
▮▮▮▮▮▮▮ 4.1 导数的概念 (The Concept of Derivative)
▮▮▮▮▮▮▮▮▮▮▮ 4.1.1 导数的定义 (Definition of Derivative)
▮▮▮▮▮▮▮▮▮▮▮ 4.1.2 导数的几何意义与物理意义 (Geometric and Physical Meanings of Derivative)
▮▮▮▮▮▮▮ 4.2 微分法则 (Differentiation Rules)
▮▮▮▮▮▮▮▮▮▮▮ 4.2.1 基本函数的导数 (Derivatives of Elementary Functions)
▮▮▮▮▮▮▮▮▮▮▮ 4.2.2 导数的四则运算 (Arithmetic Operations of Derivatives)
▮▮▮▮▮▮▮▮▮▮▮ 4.2.3 链式法则 (Chain Rule)
▮▮▮▮▮▮▮ 4.3 微分中值定理 (Mean Value Theorems for Derivatives)
▮▮▮▮▮▮▮▮▮▮▮ 4.3.1 Rolle 定理 (Rolle's Theorem)
▮▮▮▮▮▮▮▮▮▮▮ 4.3.2 Lagrange 中值定理 (Lagrange's Mean Value Theorem)
▮▮▮▮▮▮▮▮▮▮▮ 4.3.3 Cauchy 中值定理 (Cauchy's Mean Value Theorem)
▮▮▮▮▮▮▮ 4.4 Taylor 展开 (Taylor Expansion)
▮▮▮▮▮▮▮▮▮▮▮ 4.4.1 Taylor 公式 (Taylor's Formula)
▮▮▮▮▮▮▮▮▮▮▮ 4.4.2 Taylor 展开的应用 (Applications of Taylor Expansion)
▮▮▮▮ 5. chapter 5: 积分学:面积与累积的计算 (Integral Calculus: Calculation of Area and Accumulation)
▮▮▮▮▮▮▮ 5.1 Riemann 积分 (Riemann Integral)
▮▮▮▮▮▮▮▮▮▮▮ 5.1.1 Riemann 和与定积分的定义 (Riemann Sum and Definition of Definite Integral)
▮▮▮▮▮▮▮▮▮▮▮ 5.1.2 可积条件 (Integrability Conditions)
▮▮▮▮▮▮▮ 5.2 积分的性质 (Properties of Integrals)
▮▮▮▮▮▮▮▮▮▮▮ 5.2.1 线性性、单调性、区间可加性 (Linearity, Monotonicity, Interval Additivity)
▮▮▮▮▮▮▮▮▮▮▮ 5.2.2 积分中值定理 (Mean Value Theorem for Integrals)
▮▮▮▮▮▮▮ 5.3 微积分基本定理 (Fundamental Theorem of Calculus)
▮▮▮▮▮▮▮▮▮▮▮ 5.3.1 原函数与不定积分 (Antiderivative and Indefinite Integral)
▮▮▮▮▮▮▮▮▮▮▮ 5.3.2 微积分基本定理 (Fundamental Theorem of Calculus)
▮▮▮▮▮▮▮ 5.4 积分的应用 (Applications of Integrals)
▮▮▮▮▮▮▮▮▮▮▮ 5.4.1 面积计算 (Area Calculation)
▮▮▮▮▮▮▮▮▮▮▮ 5.4.2 体积计算 (Volume Calculation)
▮▮▮▮▮▮▮▮▮▮▮ 5.4.3 物理应用 (Physical Applications)
▮▮▮▮ 6. chapter 6: 级数理论:无限项求和的艺术 (Series Theory: The Art of Summing Infinite Terms)
▮▮▮▮▮▮▮ 6.1 数项级数 (Numerical Series)
▮▮▮▮▮▮▮▮▮▮▮ 6.1.1 级数收敛与发散 (Convergence and Divergence of Series)
▮▮▮▮▮▮▮▮▮▮▮ 6.1.2 收敛判别法 (Convergence Tests)
▮▮▮▮▮▮▮▮▮▮▮▮▮▮▮ 6.1.2.1 正项级数的判别法 (Tests for Series with Positive Terms)
▮▮▮▮▮▮▮▮▮▮▮▮▮▮▮ 6.1.2.2 一般项级数的判别法 (Tests for General Series)
▮▮▮▮▮▮▮ 6.2 函数项级数 (Series of Functions)
▮▮▮▮▮▮▮▮▮▮▮ 6.2.1 函数项级数的收敛域 (Domain of Convergence of Series of Functions)
▮▮▮▮▮▮▮▮▮▮▮ 6.2.2 一致收敛性 (Uniform Convergence)
▮▮▮▮▮▮▮ 6.3 幂级数 (Power Series)
▮▮▮▮▮▮▮▮▮▮▮ 6.3.1 幂级数的收敛半径与收敛域 (Radius and Domain of Convergence of Power Series)
▮▮▮▮▮▮▮▮▮▮▮ 6.3.2 幂级数的性质 (Properties of Power Series)
▮▮▮▮ 7. chapter 7: 多元函数微积分初步 (Introduction to Multivariable Calculus)
▮▮▮▮▮▮▮ 7.1 多元函数的极限与连续性 (Limits and Continuity of Multivariable Functions)
▮▮▮▮▮▮▮ 7.2 偏导数与全微分 (Partial Derivatives and Total Differential)
▮▮▮▮▮▮▮ 7.3 多元复合函数的求导法则 (Chain Rule for Multivariable Functions)
▮▮▮▮▮▮▮ 7.4 多元函数的极值 (Extrema of Multivariable Functions)
▮▮▮▮ 8. chapter 8: 度量空间初步 (Introduction to Metric Spaces)
▮▮▮▮▮▮▮ 8.1 度量空间的概念 (Concept of Metric Space)
▮▮▮▮▮▮▮ 8.2 度量空间中的基本拓扑概念 (Basic Topological Concepts in Metric Spaces)
▮▮▮▮▮▮▮▮▮▮▮ 8.2.1 开集与闭集 (Open Sets and Closed Sets)
▮▮▮▮▮▮▮▮▮▮▮ 8.2.2 收敛与完备性 (Convergence and Completeness)
▮▮▮▮▮▮▮▮▮▮▮ 8.2.3 紧致性 (Compactness)
▮▮▮▮ 9. chapter 9: 实分析的前沿与展望 (Frontiers and Prospects of Real Analysis)
▮▮▮▮▮▮▮ 9.1 Lebesgue 测度与积分简介 (Introduction to Lebesgue Measure and Integration)
▮▮▮▮▮▮▮ 9.2 实分析在现代数学中的地位与作用 (Status and Role of Real Analysis in Modern Mathematics)
▮▮▮▮▮▮▮ 9.3 实分析的未来发展趋势 (Future Development Trends of Real Analysis)
1. chapter 1: 预备知识:数学分析的基石 (Preliminaries: The Cornerstone of Mathematical Analysis)
1.1 集合论基础 (Basic Set Theory)
1.1.1 集合及其运算 (Sets and Operations on Sets)
在数学分析的宏伟殿堂中,集合论 (Set Theory) 犹如基石,为我们构建严谨的数学体系奠定基础。集合是数学中最基本、最原始的概念之一,它是由一些对象 (objects) 汇集而成的整体。这些对象被称为集合的元素 (elements) 或成员 (members)。
① 集合的定义 (Definition of Set):
集合是由一些确定的、彼此不同的对象汇集而成的整体。 “确定的”意味着对于任何一个对象,我们都能明确判断它是否属于这个集合;“彼此不同的”意味着集合中的元素是互异的。
② 集合的表示方法 (Representation of Sets):
⚝ 列举法 (Roster Method):将集合的所有元素一一列举出来,并用花括号 {}
括起来。例如,自然数集合 \( \mathbb{N} \) 的前几个元素可以表示为 {1, 2, 3, ...}
,英文字母的前五个元音字母集合可以表示为 {a, e, i, o, u}
。
⚝ 描述法 (Set-builder Notation):用谓词概括集合中元素的共同属性。形式为 {x | P(x)}
,表示由所有满足性质 \( P(x) \) 的元素 \( x \) 组成的集合。例如,所有正偶数集合可以表示为 {x | x 是正整数且 x 能被 2 整除}
或 {x | x = 2n, n \in \mathbb{N}}
。
③ 常用数集及其记号 (Common Number Sets and Notations):
⚝ 自然数集 (Natural Numbers):\( \mathbb{N} = \{1, 2, 3, ...\} \) (有些定义包含 0,本书采用不包含 0 的定义).
⚝ 整数集 (Integers):\( \mathbb{Z} = \{..., -2, -1, 0, 1, 2, ...\} \).
⚝ 有理数集 (Rational Numbers):\( \mathbb{Q} = \{\frac{p}{q} | p, q \in \mathbb{Z}, q \neq 0\} \).
⚝ 实数集 (Real Numbers):\( \mathbb{R} \) (所有有理数和无理数的集合).
⚝ 复数集 (Complex Numbers):\( \mathbb{C} = \{a + bi | a, b \in \mathbb{R}, i^2 = -1\} \).
④ 集合的基本关系 (Basic Relations between Sets):
⚝ 属于关系 (Membership):若元素 \( a \) 在集合 \( A \) 中,记作 \( a \in A \),读作 “\( a \) 属于 \( A \)” 或 “\( a \) 是 \( A \) 的元素”。若元素 \( a \) 不在集合 \( A \) 中,记作 \( a \notin A \)。
⚝ 包含关系 (Inclusion):若集合 \( A \) 的所有元素都是集合 \( B \) 的元素,则称 \( A \) 是 \( B \) 的子集 (subset),记作 \( A \subseteq B \) 或 \( B \supseteq A \),读作 “\( A \) 包含于 \( B \)” 或 “\( B \) 包含 \( A \)”。
▮▮▮▮ⓐ 若 \( A \subseteq B \) 且 \( A \neq B \),则称 \( A \) 是 \( B \) 的真子集 (proper subset),记作 \( A \subsetneq B \) 或 \( B \supsetneq A \)。
▮▮▮▮ⓑ 集合相等 (Equality of Sets):若 \( A \subseteq B \) 且 \( B \subseteq A \),则称集合 \( A \) 与集合 \( B \) 相等 (equal),记作 \( A = B \)。
▮▮▮▮ⓒ 空集 (Empty Set):不含任何元素的集合称为空集 (empty set),记作 \( \emptyset \)。空集是任何集合的子集,即对于任意集合 \( A \),都有 \( \emptyset \subseteq A \)。
⑤ 集合的运算 (Operations on Sets):
⚝ 并集 (Union):两个集合 \( A \) 和 \( B \) 的并集 (union) 记作 \( A \cup B \),定义为由所有属于 \( A \) 或属于 \( B \) 的元素组成的集合,即 \( A \cup B = \{x | x \in A 或 x \in B\} \)。
⚝ 交集 (Intersection):两个集合 \( A \) 和 \( B \) 的交集 (intersection) 记作 \( A \cap B \),定义为由所有既属于 \( A \) 又属于 \( B \) 的元素组成的集合,即 \( A \cap B = \{x | x \in A 且 x \in B\} \)。
▮▮▮▮ⓐ 若 \( A \cap B = \emptyset \),则称集合 \( A \) 和 \( B \) 不相交 (disjoint)。
⚝ 差集 (Difference):集合 \( A \) 与集合 \( B \) 的差集 (difference) 记作 \( A \setminus B \) 或 \( A - B \),定义为由所有属于 \( A \) 但不属于 \( B \) 的元素组成的集合,即 \( A \setminus B = \{x | x \in A 且 x \notin B\} \)。
⚝ 补集 (Complement):若给定一个全集 (universal set) \( U \) (在讨论问题时,我们常常需要事先指定一个范围,这个范围就叫做全集),对于集合 \( A \subseteq U \),\( A \) 在 \( U \) 中的补集 (complement) 记作 \( \complement_U A \) 或 \( A^c \),定义为 \( \complement_U A = U \setminus A = \{x | x \in U 且 x \notin A\} \)。
⚝ 笛卡尔积 (Cartesian Product):两个集合 \( A \) 和 \( B \) 的笛卡尔积 (Cartesian product) 记作 \( A \times B \),定义为由所有有序对 \( (a, b) \) 组成的集合,其中 \( a \in A, b \in B \),即 \( A \times B = \{(a, b) | a \in A, b \in B\} \)。
⑥ 集合运算的性质 (Properties of Set Operations):
设 \( A, B, C \) 为集合,则有:
⚝ 交换律 (Commutative Laws):\( A \cup B = B \cup A \),\( A \cap B = B \cap A \).
⚝ 结合律 (Associative Laws):\( (A \cup B) \cup C = A \cup (B \cup C) \),\( (A \cap B) \cap C = A \cap (B \cap C) \).
⚝ 分配律 (Distributive Laws):\( A \cup (B \cap C) = (A \cup B) \cap (A \cup C) \),\( A \cap (B \cup C) = (A \cap B) \cup (A \cap C) \).
⚝ 德摩根律 (De Morgan's Laws):\( \complement_U (A \cup B) = (\complement_U A) \cap (\complement_U B) \),\( \complement_U (A \cap B) = (\complement_U A) \cup (\complement_U B) \).
理解集合及其运算是深入学习数学分析的先决条件。它不仅为我们提供了描述数学对象的语言,也为后续的函数、关系等概念的学习奠定了坚实的基础。
1.1.2 函数 (Functions)
函数 (Function) 是数学分析中最重要的概念之一,它描述了集合之间元素的一种特殊对应关系。从朴素的观点来看,函数就像一个“黑箱子”,你给它一个输入,它就会按照一定的规则给你一个输出。
① 函数的定义 (Definition of Function):
设 \( A \) 和 \( B \) 是两个非空集合。一个从 \( A \) 到 \( B \) 的函数 (function) \( f \) 是指一种对应法则 (correspondence rule),使得对于 \( A \) 中的每一个元素 (each element) \( x \),在 \( B \) 中都存在唯一确定 (uniquely determined) 的元素 \( y \) 与之对应。记作 \( f: A \to B \),其中 \( y \) 称为 \( x \) 在 \( f \) 下的像 (image),记作 \( y = f(x) \),\( x \) 称为 \( y \) 的原像 (preimage)。集合 \( A \) 称为函数 \( f \) 的定义域 (domain),集合 \( B \) 称为函数 \( f \) 的陪域 (codomain)。值域 (range) 是指所有像的集合,记作 \( f(A) = \{f(x) | x \in A\} \),值域是陪域 \( B \) 的子集,即 \( f(A) \subseteq B \)。
② 函数的表示方法 (Representation of Functions):
⚝ 解析式法 (Analytical Method):用数学公式来表示函数关系,例如 \( f(x) = x^2 + 1 \),\( g(x) = \sin(x) \)。
⚝ 表格法 (Tabular Method):用表格列出一些自变量与函数值的对应关系。
⚝ 图像法 (Graphical Method):在坐标系中用曲线或点表示函数关系。
⚝ 分段函数 (Piecewise Function):在定义域的不同部分用不同的解析式来表示函数。
③ 函数的类型 (Types of Functions):
⚝ 单射 (Injective Function) 或 一一映射 (One-to-one Function):若对于任意 \( x_1, x_2 \in A \),当 \( x_1 \neq x_2 \) 时,有 \( f(x_1) \neq f(x_2) \),则称函数 \( f: A \to B \) 为单射 (injective)。等价的说法是,若 \( f(x_1) = f(x_2) \),则必有 \( x_1 = x_2 \)。
⚝ 满射 (Surjective Function) 或 到上映射 (Onto Function):若对于任意 \( y \in B \),都存在 \( x \in A \),使得 \( f(x) = y \),即值域 \( f(A) = B \),则称函数 \( f: A \to B \) 为满射 (surjective)。
⚝ 双射 (Bijective Function) 或 一一对应 (One-to-one Correspondence):若函数 \( f: A \to B \) 既是单射又是满射,则称 \( f \) 为双射 (bijective)。双射函数建立了定义域和值域之间元素的一一对应关系。
⚝ 恒等函数 (Identity Function):设 \( A \) 为集合,定义函数 \( I_A: A \to A \),使得对于任意 \( x \in A \),都有 \( I_A(x) = x \),则称 \( I_A \) 为 \( A \) 上的恒等函数 (identity function)。
⚝ 常值函数 (Constant Function):设 \( c \in B \) 为常数,定义函数 \( f: A \to B \),使得对于任意 \( x \in A \),都有 \( f(x) = c \),则称 \( f \) 为常值函数 (constant function)。
④ 函数的运算 (Operations on Functions):
⚝ 复合函数 (Composite Function):设 \( f: A \to B \) 和 \( g: B \to C \) 是两个函数,则可以定义复合函数 (composite function) \( g \circ f: A \to C \),对于任意 \( x \in A \),\( (g \circ f)(x) = g(f(x)) \)。注意复合函数的顺序,\( g \circ f \) 表示先应用 \( f \),再应用 \( g \)。
⚝ 反函数 (Inverse Function):若函数 \( f: A \to B \) 是双射,则存在反函数 (inverse function) \( f^{-1}: B \to A \),使得对于任意 \( x \in A \) 和 \( y \in B \),\( y = f(x) \) 当且仅当 \( x = f^{-1}(y) \)。并且有 \( f^{-1} \circ f = I_A \) 和 \( f \circ f^{-1} = I_B \)。
函数是数学分析的核心研究对象。理解函数的定义、类型和运算,是后续学习极限、连续、微分、积分等概念的关键。
1.1.3 关系与等价关系 (Relations and Equivalence Relations)
关系 (Relation) 描述了集合元素之间的联系。等价关系 (Equivalence Relation) 是一种特殊而重要的关系,它在集合上定义了一种“等价”的概念,并将集合划分为互不相交的等价类。
① 关系的定义 (Definition of Relation):
设 \( A \) 和 \( B \) 是两个集合。从 \( A \) 到 \( B \) 的一个关系 (relation) \( R \) 是指 \( A \times B \) 的一个子集,即 \( R \subseteq A \times B \)。若 \( (x, y) \in R \),则称 \( x \) 与 \( y \) 具有关系 \( R \),记作 \( xRy \)。若 \( A = B \),则称 \( R \) 是 \( A \) 上的关系。
② 关系的表示方法 (Representation of Relations):
⚝ 集合表示法 (Set Representation):将关系表示为有序对的集合。例如,设 \( A = \{1, 2, 3\} \),\( B = \{a, b, c\} \),关系 \( R = \{(1, a), (2, b), (3, c)\} \) 表示 \( A \) 到 \( B \) 的一个关系。
⚝ 矩阵表示法 (Matrix Representation):当 \( A \) 和 \( B \) 是有限集时,可以用矩阵来表示关系。
⚝ 图表示法 (Graph Representation):用图的顶点表示集合元素,边表示元素之间的关系。
③ 等价关系 (Equivalence Relation):
设 \( A \) 是一个非空集合,\( \sim \) 是 \( A \) 上的一个关系。如果关系 \( \sim \) 满足以下三个性质,则称 \( \sim \) 为 \( A \) 上的等价关系 (equivalence relation):
⚝ 自反性 (Reflexivity):对于任意 \( x \in A \),都有 \( x \sim x \)。
⚝ 对称性 (Symmetry):对于任意 \( x, y \in A \),若 \( x \sim y \),则 \( y \sim x \)。
⚝ 传递性 (Transitivity):对于任意 \( x, y, z \in A \),若 \( x \sim y \) 且 \( y \sim z \),则 \( x \sim z \)。
④ 等价类与商集 (Equivalence Classes and Quotient Set):
设 \( \sim \) 是集合 \( A \) 上的一个等价关系。对于任意 \( x \in A \),定义 \( x \) 的等价类 (equivalence class) \( [x] \) 为所有与 \( x \) 等价的元素的集合,即 \( [x] = \{y \in A | y \sim x\} \)。
⚝ 等价类的性质 (Properties of Equivalence Classes):
▮▮▮▮ⓐ 对于任意 \( x \in A \),\( x \in [x] \) (自反性保证等价类非空).
▮▮▮▮ⓑ 对于任意 \( x, y \in A \),要么 \( [x] = [y] \),要么 \( [x] \cap [y] = \emptyset \)。
▮▮▮▮ⓒ \( \bigcup_{x \in A} [x] = A \)。
⚝ 商集 (Quotient Set):由 \( A \) 中所有不同的等价类构成的集合称为 \( A \) 关于等价关系 \( \sim \) 的商集 (quotient set),记作 \( A/\sim = \{[x] | x \in A\} \)。商集 \( A/\sim \) 是 \( A \) 的一个划分 (partition),即将 \( A \) 分解为互不相交的子集的并。
⑤ 例子 (Examples):
⚝ 模 \( n \) 同余关系 (Congruence modulo \( n \)):在整数集 \( \mathbb{Z} \) 上,对于给定的正整数 \( n \),定义关系 \( \equiv_n \) 为:\( a \equiv_n b \) 当且仅当 \( n \) 整除 \( a - b \),即 \( a - b = kn \) 对某个整数 \( k \) 成立。模 \( n \) 同余关系是 \( \mathbb{Z} \) 上的等价关系。其等价类称为同余类 (congruence classes) 或剩余类 (residue classes),共有 \( n \) 个不同的等价类,分别为 \( [0], [1], ..., [n-1] \)。商集 \( \mathbb{Z}/\equiv_n \) 记作 \( \mathbb{Z}_n \) 或 \( \mathbb{Z}/n\mathbb{Z} \)。
⚝ 实数相等关系 (Equality of Real Numbers):在实数集 \( \mathbb{R} \) 上,相等关系 \( = \) 是一个等价关系。每个实数的等价类就是它自身,即 \( [x] = \{x\} \)。商集 \( \mathbb{R}/= \) 可以看作是 \( \mathbb{R} \) 本身。
等价关系和等价类的概念在数学的各个分支中都有广泛的应用,尤其在抽象代数和拓扑学中扮演着重要的角色。在实分析中,等价关系也常用于构造新的数学对象和简化问题。
1.2 逻辑与证明 (Logic and Proofs)
1.2.1 命题逻辑 (Propositional Logic)
命题逻辑 (Propositional Logic) 是研究以命题 (proposition) 为基本单位进行推理的逻辑系统。命题是一个具有真假意义的陈述句。命题逻辑关注命题之间的逻辑关系 (logical relations),以及如何通过已知的命题推导出新的命题。
① 命题与真值 (Propositions and Truth Values):
命题 (proposition) 是一个陈述句,它要么为真 (True),要么为假 (False),但不能既真又假。真或假称为命题的真值 (truth value)。
⚝ 简单命题 (Simple Proposition):不能再分解为更简单命题的命题,例如 “2 是偶数”。
⚝ 复合命题 (Compound Proposition):由简单命题通过逻辑联结词 (logical connectives) 组合而成的命题,例如 “2 是偶数 且 3 是奇数”。
② 逻辑联结词 (Logical Connectives):
⚝ 否定 (Negation):用符号 \( \neg \) 或 \( \lnot \) 表示,读作 “非 (not)”。若 \( p \) 是一个命题,则 \( \neg p \) 表示 “非 \( p \)” 或 “\( p \) 的否定”。若 \( p \) 为真,则 \( \neg p \) 为假;若 \( p \) 为假,则 \( \neg p \) 为真。
⚝ 合取 (Conjunction):用符号 \( \land \) 表示,读作 “与 (and)”。若 \( p \) 和 \( q \) 是两个命题,则 \( p \land q \) 表示 “\( p \) 且 \( q \)”。当且仅当 \( p \) 和 \( q \) 都为真时,\( p \land q \) 为真,否则为假。
⚝ 析取 (Disjunction):用符号 \( \lor \) 表示,读作 “或 (or)”。若 \( p \) 和 \( q \) 是两个命题,则 \( p \lor q \) 表示 “\( p \) 或 \( q \)”。当 \( p \) 和 \( q \) 中至少有一个为真时,\( p \lor q \) 为真,当 \( p \) 和 \( q \) 都为假时,\( p \lor q \) 为假 (相容或)。
⚝ 蕴含 (Implication) 或 条件 (Conditional):用符号 \( \to \) 或 \( \Rightarrow \) 表示,读作 “如果...则... (if...then...)”。若 \( p \) 和 \( q \) 是两个命题,则 \( p \to q \) 表示 “如果 \( p \) 则 \( q \)”。当 \( p \) 为真且 \( q \) 为假时,\( p \to q \) 为假,在其他情况下都为真 (material implication)。\( p \) 称为前件 (antecedent),\( q \) 称为后件 (consequent)。
⚝ 双条件 (Biconditional) 或 等价 (Equivalence):用符号 \( \leftrightarrow \) 或 \( \Leftrightarrow \) 表示,读作 “当且仅当 (if and only if)”。若 \( p \) 和 \( q \) 是两个命题,则 \( p \leftrightarrow q \) 表示 “\( p \) 当且仅当 \( q \)”。当 \( p \) 和 \( q \) 真值相同时 (都为真或都为假),\( p \leftrightarrow q \) 为真,否则为假。
③ 真值表 (Truth Table):
真值表是表示复合命题真值与构成它的简单命题真值之间关系的表格。
\( p \) | \( q \) | \( \neg p \) | \( p \land q \) | \( p \lor q \) | \( p \to q \) | \( p \leftrightarrow q \) |
---|---|---|---|---|---|---|
真 (T) | 真 (T) | 假 (F) | 真 (T) | 真 (T) | 真 (T) | 真 (T) |
真 (T) | 假 (F) | 假 (F) | 假 (F) | 真 (T) | 假 (F) | 假 (F) |
假 (F) | 真 (T) | 真 (T) | 假 (F) | 真 (T) | 真 (T) | 假 (F) |
假 (F) | 假 (F) | 真 (T) | 假 (F) | 假 (F) | 真 (T) | 真 (T) |
④ 逻辑等价 (Logical Equivalence):
如果两个复合命题 \( P \) 和 \( Q \) 具有相同的真值表,则称 \( P \) 和 \( Q \) 逻辑等价 (logically equivalent),记作 \( P \equiv Q \) 或 \( P \Leftrightarrow Q \)。逻辑等价表示两个命题在逻辑意义上是相同的。
⚝ 常见的逻辑等价式 (Common Logical Equivalences):
▮▮▮▮ⓐ 双重否定律 (Double Negation Law):\( \neg (\neg p) \equiv p \).
▮▮▮▮ⓑ 德摩根律 (De Morgan's Laws):\( \neg (p \land q) \equiv (\neg p) \lor (\neg q) \),\( \neg (p \lor q) \equiv (\neg p) \land (\neg q) \).
▮▮▮▮ⓒ 蕴含等价式 (Implication Equivalences):\( p \to q \equiv \neg p \lor q \equiv \neg q \to \neg p \).
▮▮▮▮ⓓ 分配律 (Distributive Laws):\( p \land (q \lor r) \equiv (p \land q) \lor (p \land r) \),\( p \lor (q \land r) \equiv (p \lor q) \land (p \lor r) \).
命题逻辑是数学证明的基础工具。理解命题逻辑的规则和等价式,能够帮助我们进行严谨的逻辑推理和证明。
1.2.2 谓词逻辑 (Predicate Logic)
谓词逻辑 (Predicate Logic) 是对命题逻辑的扩展,它不仅研究命题之间的关系,还深入到命题的内部结构,分析命题的主语 (subject) 和谓语 (predicate),以及量词 (quantifiers) 对命题真值的影响。谓词逻辑能够表达更复杂的数学陈述和推理。
① 谓词 (Predicate):
谓词 (predicate) 是一个陈述句,其中包含变量 (variables),当变量被赋予具体的值后,谓词就变成一个命题,具有真值。谓词通常用带有变量的符号表示,例如 \( P(x) \) 表示 “\( x \) 是偶数”,\( Q(x, y) \) 表示 “\( x < y \)”。
② 量词 (Quantifiers):
量词 (quantifier) 是用来表示谓词适用范围的词语,主要有两种量词:
⚝ 全称量词 (Universal Quantifier):用符号 \( \forall \) 表示,读作 “对于所有 (for all)”、“对于每一个 (for every)”。\( \forall x P(x) \) 表示 “对于所有的 \( x \),\( P(x) \) 都成立”。
⚝ 存在量词 (Existential Quantifier):用符号 \( \exists \) 表示,读作 “存在 (there exists)”、“至少有一个 (there is at least one)”。\( \exists x P(x) \) 表示 “存在一个 \( x \),使得 \( P(x) \) 成立”。
③ 辖域与自由变量、约束变量 (Scope and Free/Bound Variables):
量词的作用范围称为辖域 (scope)。在量词辖域内的变量称为约束变量 (bound variable),在量词辖域外的变量称为自由变量 (free variable)。例如,在 \( \forall x (P(x) \to Q(x, y)) \) 中,\( x \) 是约束变量,\( y \) 是自由变量。
④ 谓词公式 (Predicate Formula):
由谓词、逻辑联结词和量词组成的表达式称为谓词公式 (predicate formula)。谓词公式可以表达复杂的数学命题。
⑤ 量词的否定 (Negation of Quantifiers):
⚝ \( \neg (\forall x P(x)) \equiv \exists x (\neg P(x)) \)。“并非所有 \( x \) 都满足 \( P(x) \)” 等价于 “存在某个 \( x \) 不满足 \( P(x) \)”。
⚝ \( \neg (\exists x P(x)) \equiv \forall x (\neg P(x)) \)。“不存在 \( x \) 满足 \( P(x) \)” 等价于 “所有 \( x \) 都不满足 \( P(x) \)”。
⑥ 例子 (Examples):
⚝ “所有实数都大于 -1” 可以表示为 \( \forall x \in \mathbb{R} (x > -1) \)。 (这是一个假命题)
⚝ “存在一个整数,它的平方等于 4” 可以表示为 \( \exists x \in \mathbb{Z} (x^2 = 4) \)。 (这是一个真命题)
⚝ “对于任意实数 \( x \),都存在一个整数 \( n \),使得 \( n > x \)” 可以表示为 \( \forall x \in \mathbb{R} \exists n \in \mathbb{Z} (n > x) \)。 (阿基米德性质,这是一个真命题)
谓词逻辑是数学语言的基础,它提供了精确表达数学概念和定理的工具。在实分析中,我们经常使用谓词逻辑来定义极限、连续、可导、可积等重要概念,并进行严谨的数学证明。
1.2.3 数学证明方法 (Methods of Mathematical Proof)
数学证明 (Mathematical Proof) 是用逻辑推理的方式,从已知的公理 (axioms)、定义 (definitions) 和定理 (theorems) 出发,推导出新的定理 (theorems) 或结论 (conclusions) 的过程。数学证明是确保数学知识可靠性的根本途径。
① 直接证明 (Direct Proof):
直接证明 (direct proof) 是从假设 (hypothesis) \( p \) 出发,运用逻辑推理规则,直接推导出结论 (conclusion) \( q \) 的方法。通常用于证明蕴含式 \( p \to q \)。
⚝ 步骤 (Steps):
▮▮▮▮ⓐ 假设 \( p \) 为真。
▮▮▮▮ⓑ 运用已知的定义、公理、定理和逻辑推理规则。
▮▮▮▮ⓒ 推导出 \( q \) 为真。
⚝ 例子 (Example):证明 “如果 \( n \) 是偶数,那么 \( n^2 \) 是偶数”。
▮▮▮▮ⓐ 假设 \( n \) 是偶数,则存在整数 \( k \),使得 \( n = 2k \)。
▮▮▮▮ⓑ 那么 \( n^2 = (2k)^2 = 4k^2 = 2(2k^2) \)。
▮▮▮▮ⓒ 由于 \( 2k^2 \) 是整数,所以 \( n^2 \) 是 2 的倍数,即 \( n^2 \) 是偶数。
② 反证法 (Proof by Contradiction):
反证法 (proof by contradiction) 是先假设结论 \( q \) 不成立 (即 \( \neg q \) 为真),然后从假设 \( p \) 和 \( \neg q \) 出发,运用逻辑推理,推导出矛盾 (contradiction),从而证明原命题 \( p \to q \) 为真的方法。矛盾通常表现为 \( r \land \neg r \) 的形式,其中 \( r \) 是某个命题。
⚝ 步骤 (Steps):
▮▮▮▮ⓐ 假设 \( p \to q \) 不为真,即假设 \( p \) 为真且 \( q \) 为假 (即 \( \neg q \) 为真)。
▮▮▮▮ⓑ 从假设 \( p \) 和 \( \neg q \) 出发,运用已知的定义、公理、定理和逻辑推理规则。
▮▮▮▮ⓒ 推导出一个矛盾,例如 \( r \land \neg r \)。
▮▮▮▮ⓓ 由于导出矛盾,说明假设 \( p \land \neg q \) 是错误的,因此 \( \neg (p \land \neg q) \equiv \neg p \lor q \equiv p \to q \) 为真。
⚝ 例子 (Example):证明 “\( \sqrt{2} \) 是无理数”。
▮▮▮▮ⓐ 假设 \( \sqrt{2} \) 是有理数,则存在互质的整数 \( p \) 和 \( q \) ( \( q \neq 0 \) ),使得 \( \sqrt{2} = \frac{p}{q} \)。
▮▮▮▮ⓑ 两边平方得到 \( 2 = \frac{p^2}{q^2} \),即 \( p^2 = 2q^2 \)。因此 \( p^2 \) 是偶数,从而 \( p \) 也是偶数。设 \( p = 2k \),代入得到 \( (2k)^2 = 2q^2 \),即 \( 4k^2 = 2q^2 \),化简得 \( 2k^2 = q^2 \)。因此 \( q^2 \) 是偶数,从而 \( q \) 也是偶数。
▮▮▮▮ⓒ 这样 \( p \) 和 \( q \) 都是偶数,与 “\( p \) 和 \( q \) 互质” 矛盾。
▮▮▮▮ⓓ 因此假设 “\( \sqrt{2} \) 是有理数” 是错误的,所以 \( \sqrt{2} \) 是无理数。
③ 反证法 (Proof by Contrapositive):
反证法 (proof by contrapositive) 是通过证明原命题的逆否命题 (contrapositive) \( \neg q \to \neg p \) 为真,来证明原命题 \( p \to q \) 为真的方法。因为 \( p \to q \equiv \neg q \to \neg p \)。
⚝ 步骤 (Steps):
▮▮▮▮ⓐ 考虑原命题 \( p \to q \) 的逆否命题 \( \neg q \to \neg p \)。
▮▮▮▮ⓑ 假设 \( \neg q \) 为真。
▮▮▮▮ⓒ 运用已知的定义、公理、定理和逻辑推理规则。
▮▮▮▮ⓓ 推导出 \( \neg p \) 为真。
▮▮▮▮ⓔ 由于证明了 \( \neg q \to \neg p \) 为真,所以原命题 \( p \to q \) 也为真。
⚝ 例子 (Example):证明 “如果 \( n^2 \) 是偶数,那么 \( n \) 是偶数”。
▮▮▮▮ⓐ 原命题是 \( p \to q \),其中 \( p \) 是 “\( n^2 \) 是偶数”,\( q \) 是 “\( n \) 是偶数”。逆否命题是 \( \neg q \to \neg p \),即 “如果 \( n \) 不是偶数,那么 \( n^2 \) 不是偶数”,也就是 “如果 \( n \) 是奇数,那么 \( n^2 \) 是奇数”。
▮▮▮▮ⓑ 假设 \( n \) 是奇数,则存在整数 \( k \),使得 \( n = 2k + 1 \)。
▮▮▮▮ⓒ 那么 \( n^2 = (2k + 1)^2 = 4k^2 + 4k + 1 = 2(2k^2 + 2k) + 1 \)。
▮▮▮▮ⓓ 由于 \( 2k^2 + 2k \) 是整数,所以 \( n^2 \) 是奇数。
▮▮▮▮ⓔ 因此,逆否命题 “如果 \( n \) 是奇数,那么 \( n^2 \) 是奇数” 为真,所以原命题 “如果 \( n^2 \) 是偶数,那么 \( n \) 是偶数” 也为真。
④ 数学归纳法 (Mathematical Induction):
数学归纳法 (mathematical induction) 是一种证明关于自然数 \( \mathbb{N} \) 的命题的方法,常用于证明形如 “对于所有自然数 \( n \),命题 \( P(n) \) 成立” 的陈述。数学归纳法分为第一数学归纳法 (first principle of mathematical induction) 和 第二数学归纳法 (second principle of mathematical induction)。将在后续 1.4 节详细介绍。
掌握这些基本的证明方法,是进行数学分析学习和研究的关键。在实分析的学习过程中,我们将大量运用这些方法来证明各种定理和性质。
1.3 实数系统 (The Real Number System)
1.3.1 实数的公理化定义 (Axiomatic Definition of Real Numbers)
实数系统 (Real Number System) 是数学分析的基石。为了严谨地研究实数,我们需要从公理 (axioms) 出发,对实数进行公理化定义 (axiomatic definition)。公理化方法用一组最基本的性质 (公理) 来刻画实数,所有关于实数的性质都可以从这些公理逻辑地推导出来。
① 域的公理 (Field Axioms):
实数集 \( \mathbb{R} \) 在加法 \( + \) 和乘法 \( \cdot \) 运算下构成一个域 (field),满足以下公理:
⚝ 加法公理 (Axioms for Addition):
▮▮▮▮ⓐ 加法交换律 (Commutativity of Addition):对于任意 \( a, b \in \mathbb{R} \),\( a + b = b + a \)。
▮▮▮▮ⓑ 加法结合律 (Associativity of Addition):对于任意 \( a, b, c \in \mathbb{R} \),\( (a + b) + c = a + (b + c) \).
▮▮▮▮ⓒ 加法单位元 (Additive Identity):存在元素 \( 0 \in \mathbb{R} \),使得对于任意 \( a \in \mathbb{R} \),\( a + 0 = a \)。\( 0 \) 称为零元素 (zero element)。
▮▮▮▮ⓓ 加法逆元 (Additive Inverse):对于任意 \( a \in \mathbb{R} \),存在元素 \( -a \in \mathbb{R} \),使得 \( a + (-a) = 0 \)。\( -a \) 称为 \( a \) 的负元素 (negative element)。
⚝ 乘法公理 (Axioms for Multiplication):
▮▮▮▮ⓐ 乘法交换律 (Commutativity of Multiplication):对于任意 \( a, b \in \mathbb{R} \),\( a \cdot b = b \cdot a \)。
▮▮▮▮ⓑ 乘法结合律 (Associativity of Multiplication):对于任意 \( a, b, c \in \mathbb{R} \),\( (a \cdot b) \cdot c = a \cdot (b \cdot c) \).
▮▮▮▮ⓒ 乘法单位元 (Multiplicative Identity):存在元素 \( 1 \in \mathbb{R} \),\( 1 \neq 0 \),使得对于任意 \( a \in \mathbb{R} \),\( a \cdot 1 = a \)。\( 1 \) 称为单位元素 (unit element)。
▮▮▮▮ⓓ 乘法逆元 (Multiplicative Inverse):对于任意 \( a \in \mathbb{R} \),若 \( a \neq 0 \),则存在元素 \( a^{-1} \in \mathbb{R} \),使得 \( a \cdot a^{-1} = 1 \)。\( a^{-1} \) 称为 \( a \) 的倒数 (reciprocal) 或逆元素 (inverse element)。
⚝ 分配律 (Distributive Law):对于任意 \( a, b, c \in \mathbb{R} \),\( a \cdot (b + c) = (a \cdot b) + (a \cdot c) \).
② 有序域的公理 (Order Axioms for Ordered Field):
实数集 \( \mathbb{R} \) 上存在一个序关系 (order relation) \( < \) (小于),满足以下公理,使得 \( (\mathbb{R}, +, \cdot, <) \) 成为一个有序域 (ordered field):
⚝ 序的相容性 (Compatibility of Order with Field Operations):
▮▮▮▮ⓐ 加法保序性 (Compatibility with Addition):对于任意 \( a, b, c \in \mathbb{R} \),若 \( a < b \),则 \( a + c < b + c \).
▮▮▮▮ⓑ 乘法保序性 (Compatibility with Multiplication):对于任意 \( a, b, c \in \mathbb{R} \),若 \( a < b \) 且 \( c > 0 \),则 \( a \cdot c < b \cdot c \).
⚝ 三歧性 (Trichotomy):对于任意 \( a, b \in \mathbb{R} \),以下三种关系有且仅有一种成立:\( a < b \),\( a = b \),\( a > b \)。
③ 完备性公理 (Completeness Axiom):
完备性公理 (completeness axiom) 是实数系统区别于有理数系统的关键公理,它保证了实数轴的 “连续性”,没有 “空隙”。有多种等价形式的完备性公理,最常用的是确界原理 (supremum principle),将在 1.3.3 节详细介绍。这里先给出一种等价形式:区间套定理 (nested interval theorem)。
⚝ 区间套定理 (Nested Interval Theorem):设 \( \{[a_n, b_n]\}_{n=1}^\infty \) 是一个闭区间套,即对于每个 \( n \in \mathbb{N} \),\( [a_{n+1}, b_{n+1}] \subseteq [a_n, b_n] \),且区间长度 \( (b_n - a_n) \to 0 \) (当 \( n \to \infty \) 时)。则存在唯一的实数 \( \xi \),使得 \( \xi \in \bigcap_{n=1}^\infty [a_n, b_n] \)。
实数的公理化定义为我们提供了一个严谨的框架来研究实数及其性质。域的公理保证了实数可以进行加减乘除运算,有序域的公理引入了大小关系,完备性公理则保证了实数轴的连续性,使得极限理论和数学分析成为可能。
1.3.2 有序域与完备性 (Ordered Field and Completeness)
有序域 (Ordered Field) 是既是域又是有序集的代数结构,且域运算与序关系相容。实数集 \( \mathbb{R} \) 是一个有序域,有理数集 \( \mathbb{Q} \) 也是一个有序域。完备性 (Completeness) 是有序域的一个重要性质,它区分了实数域 \( \mathbb{R} \) 和有理数域 \( \mathbb{Q} \)。实数域是完备的有序域,而有理数域是不完备的有序域。
① 有序域 (Ordered Field):
一个域 \( F \) 称为有序域 (ordered field),如果 \( F \) 上定义了一个全序关系 \( < \),满足:
⚝ 加法保序性 (Compatibility with Addition):对于任意 \( a, b, c \in F \),若 \( a < b \),则 \( a + c < b + c \).
⚝ 乘法保序性 (Compatibility with Multiplication):对于任意 \( a, b, c \in F \),若 \( a < b \) 且 \( c > 0 \),则 \( a \cdot c < b \cdot c \).
② 有理数域 \( \mathbb{Q} \) 是有序域 (Rational Field \( \mathbb{Q} \) is an Ordered Field):
有理数集 \( \mathbb{Q} \) 满足域的公理和有序域的公理,因此 \( \mathbb{Q} \) 是一个有序域。有理数的大小关系 \( < \) 是自然定义的。
③ 完备性 (Completeness):
完备性 (completeness) 是有序域的一个关键性质,它有多种等价的描述方式,例如确界原理、区间套定理、柯西序列收敛定理等。完备性保证了有序域中 “没有空隙”,可以进行极限运算。
⚝ 有理数域 \( \mathbb{Q} \) 的不完备性 (Incompleteness of Rational Field \( \mathbb{Q} \)):
有理数域 \( \mathbb{Q} \) 是不完备的。例如,考虑有理数序列 \( \{x_n\} \) 定义为 \( x_1 = 1 \),\( x_{n+1} = \frac{1}{2}(x_n + \frac{2}{x_n}) \)。这个序列是有理数序列,且在实数域 \( \mathbb{R} \) 中收敛到 \( \sqrt{2} \)。但是 \( \sqrt{2} \) 是无理数,所以这个序列在有理数域 \( \mathbb{Q} \) 中不收敛。这说明有理数域存在收敛序列,其极限不在有理数域中,即有理数域 “有空隙”,是不完备的。
⚝ 实数域 \( \mathbb{R} \) 的完备性 (Completeness of Real Field \( \mathbb{R} \)):
实数域 \( \mathbb{R} \) 是完备的。完备性公理 (例如确界原理或区间套定理) 正是实数系统的公理之一,保证了实数域的完备性。实数域的完备性是建立数学分析理论的基础。
④ 完备性的重要性 (Importance of Completeness):
完备性是实数系统最重要的性质之一,它使得实数域能够支持极限、连续、微分、积分等数学分析的核心概念。
⚝ 极限存在性 (Existence of Limits):完备性保证了有界单调序列必有极限,柯西序列必收敛,这是极限理论的基础。
⚝ 连续性 (Continuity):完备性是证明闭区间上连续函数的介值定理、最值定理、一致连续性定理等重要定理的关键。
⚝ 微分与积分 (Differentiation and Integration):完备性保证了微分中值定理、微积分基本定理等重要定理的成立,为微积分理论奠定了基础。
完备性是实数系统区别于有理数系统的本质特征,也是实分析理论得以建立和发展的基石。
1.3.3 确界原理 (Supremum and Infimum Principle)
确界原理 (Supremum and Infimum Principle) 是实数完备性的重要体现,也是实分析中最基本、最重要的原理之一。确界原理保证了实数集上某些特殊子集的确界 (上确界和下确界) 的存在性。
① 上界与下界 (Upper Bound and Lower Bound):
设 \( S \subseteq \mathbb{R} \) 是实数集的子集。
⚝ 上界 (Upper Bound):若存在实数 \( M \),使得对于任意 \( x \in S \),都有 \( x \leq M \),则称 \( M \) 是集合 \( S \) 的一个上界 (upper bound)。若集合 \( S \) 存在上界,则称 \( S \) 是有上界的 (bounded above)。
⚝ 下界 (Lower Bound):若存在实数 \( m \),使得对于任意 \( x \in S \),都有 \( x \geq m \),则称 \( m \) 是集合 \( S \) 的一个下界 (lower bound)。若集合 \( S \) 存在下界,则称 \( S \) 是有下界的 (bounded below)。
⚝ 有界集 (Bounded Set):若集合 \( S \) 既有上界又有下界,则称 \( S \) 是有界集 (bounded set)。
② 上确界 (Supremum) 与 下确界 (Infimum):
设 \( S \subseteq \mathbb{R} \) 是有上界的非空集合。
⚝ 上确界 (Supremum) 或 最小上界 (Least Upper Bound):若实数 \( \alpha \) 满足:
▮▮▮▮ⓐ \( \alpha \) 是 \( S \) 的上界 (即对于任意 \( x \in S \),\( x \leq \alpha \));
▮▮▮▮ⓑ 对于任意 \( S \) 的上界 \( M \),都有 \( \alpha \leq M \) (即 \( \alpha \) 是所有上界中最小的)。
则称 \( \alpha \) 是集合 \( S \) 的上确界 (supremum),记作 \( \alpha = \sup S \) 或 \( \alpha = \text{lub} S \)。
设 \( S \subseteq \mathbb{R} \) 是有下界的非空集合。
⚝ 下确界 (Infimum) 或 最大下界 (Greatest Lower Bound):若实数 \( \beta \) 满足:
▮▮▮▮ⓐ \( \beta \) 是 \( S \) 的下界 (即对于任意 \( x \in S \),\( x \geq \beta \));
▮▮▮▮ⓑ 对于任意 \( S \) 的下界 \( m \),都有 \( \beta \geq m \) (即 \( \beta \) 是所有下界中最大的)。
则称 \( \beta \) 是集合 \( S \) 的下确界 (infimum),记作 \( \beta = \inf S \) 或 \( \beta = \text{glb} S \)。
③ 确界原理 (Supremum Principle):
确界原理 (supremum principle) 或 最小上界原理 (least upper bound principle):任何有上界的非空实数集必有上确界。
⚝ 等价形式:下确界原理 (Infimum Principle):任何有下界的非空实数集必有下确界。下确界原理可以由上确界原理推导出来。
④ 确界原理的应用 (Applications of Supremum Principle):
确界原理是实分析中证明许多重要定理的基础,例如:
⚝ 单调有界定理 (Monotone Convergence Theorem):有界单调数列必有极限。证明单调有界数列极限存在性时,需要用到确界原理来确定极限值。
⚝ 闭区间套定理 (Nested Interval Theorem):可以用确界原理证明区间套定理。
⚝ 实数完备性的其他等价形式 (Other Equivalent Forms of Completeness):确界原理、区间套定理、柯西序列收敛定理等都是实数完备性的等价描述。
确界原理是实数完备性的核心体现,它保证了实数轴的 “连续性”,为极限理论和数学分析奠定了坚实的基础。
1.4 数学归纳法 (Mathematical Induction)
1.4.1 第一数学归纳法 (First Principle of Mathematical Induction)
第一数学归纳法 (First Principle of Mathematical Induction) 是一种重要的数学证明方法,用于证明关于自然数 \( \mathbb{N} \) 的命题。它基于自然数的良序性 (well-ordering property),即自然数集的任何非空子集都有最小元素。
① 第一数学归纳法的原理 (Principle of First Mathematical Induction):
设 \( P(n) \) 是一个关于自然数 \( n \) 的命题。如果要证明对于所有自然数 \( n \),\( P(n) \) 都成立,需要完成以下两个步骤:
⚝ 基础步骤 (Base Case):证明当 \( n = 1 \) 时,\( P(1) \) 成立。 (有时基础步骤也可以从 \( n = 0 \) 或其他自然数开始)
⚝ 归纳步骤 (Inductive Step):假设对于某个自然数 \( k \),\( P(k) \) 成立 (称为归纳假设 (inductive hypothesis)),证明 \( P(k+1) \) 也成立。
如果基础步骤和归纳步骤都完成,则可以断定对于所有自然数 \( n \),\( P(n) \) 都成立。
② 第一数学归纳法的逻辑 (Logic of First Mathematical Induction):
数学归纳法的逻辑可以用多米诺骨牌效应来形象地理解。基础步骤相当于推倒第一张多米诺骨牌,归纳步骤相当于保证如果第 \( k \) 张骨牌倒下,那么第 \( k+1 \) 张骨牌也会倒下。一旦第一张骨牌倒下,并且骨牌之间满足传递性,那么所有的骨牌都会依次倒下。
③ 例子 (Examples):
⚝ 例 1:证明对于所有自然数 \( n \),\( 1 + 2 + ... + n = \frac{n(n+1)}{2} \)。
▮▮▮▮ⓐ 基础步骤 (Base Case):当 \( n = 1 \) 时,左边 \( = 1 \),右边 \( = \frac{1(1+1)}{2} = 1 \),左右相等,\( P(1) \) 成立。
▮▮▮▮ⓑ 归纳步骤 (Inductive Step):假设对于某个自然数 \( k \),\( P(k) \) 成立,即 \( 1 + 2 + ... + k = \frac{k(k+1)}{2} \)。要证明 \( P(k+1) \) 也成立,即 \( 1 + 2 + ... + (k+1) = \frac{(k+1)(k+2)}{2} \)。
▮▮▮▮▮▮▮▮从左边出发:\( 1 + 2 + ... + (k+1) = (1 + 2 + ... + k) + (k+1) \)。
▮▮▮▮▮▮▮▮根据归纳假设,\( 1 + 2 + ... + k = \frac{k(k+1)}{2} \)。
▮▮▮▮▮▮▮▮所以 \( (1 + 2 + ... + k) + (k+1) = \frac{k(k+1)}{2} + (k+1) = (k+1)(\frac{k}{2} + 1) = (k+1)\frac{k+2}{2} = \frac{(k+1)(k+2)}{2} \)。
▮▮▮▮▮▮▮▮推导出右边,因此 \( P(k+1) \) 成立。
▮▮▮▮ⓒ 根据数学归纳法原理,对于所有自然数 \( n \),\( 1 + 2 + ... + n = \frac{n(n+1)}{2} \) 都成立。
⚝ 例 2:证明对于所有自然数 \( n \),\( n < 2^n \)。
▮▮▮▮ⓐ 基础步骤 (Base Case):当 \( n = 1 \) 时,左边 \( = 1 \),右边 \( = 2^1 = 2 \),\( 1 < 2 \),\( P(1) \) 成立。
▮▮▮▮ⓑ 归纳步骤 (Inductive Step):假设对于某个自然数 \( k \),\( P(k) \) 成立,即 \( k < 2^k \)。要证明 \( P(k+1) \) 也成立,即 \( k+1 < 2^{k+1} \)。
▮▮▮▮▮▮▮▮由于 \( k < 2^k \) (归纳假设),所以 \( k+1 \leq 2^k + 1 \)。
▮▮▮▮▮▮▮▮当 \( k \geq 1 \) 时,\( 1 \leq 2^k \),所以 \( 2^k + 1 \leq 2^k + 2^k = 2 \cdot 2^k = 2^{k+1} \)。
▮▮▮▮▮▮▮▮因此 \( k+1 \leq 2^k + 1 \leq 2^{k+1} \),即 \( k+1 < 2^{k+1} \)。\( P(k+1) \) 成立。
▮▮▮▮ⓒ 根据数学归纳法原理,对于所有自然数 \( n \),\( n < 2^n \) 都成立。
第一数学归纳法是最常用的归纳法形式,适用于许多关于自然数的命题的证明。
1.4.2 第二数学归纳法 (Second Principle of Mathematical Induction)
第二数学归纳法 (Second Principle of Mathematical Induction),也称为强归纳法 (Strong Induction) 或 完全归纳法 (Complete Induction),是第一数学归纳法的另一种形式。与第一数学归纳法不同,第二数学归纳法在归纳步骤中假设对于所有小于等于 \( k \) 的自然数命题都成立,然后证明对于 \( k+1 \) 命题也成立。
① 第二数学归纳法的原理 (Principle of Second Mathematical Induction):
设 \( P(n) \) 是一个关于自然数 \( n \) 的命题。如果要证明对于所有自然数 \( n \),\( P(n) \) 都成立,需要完成以下两个步骤:
⚝ 基础步骤 (Base Case):证明当 \( n = 1 \) 时,\( P(1) \) 成立。 (同样,基础步骤可以根据具体情况调整起始值)
⚝ 归纳步骤 (Inductive Step):假设对于所有小于等于 \( k \) 的自然数 \( j \) ( \( 1 \leq j \leq k \) ),\( P(j) \) 都成立 (称为强归纳假设 (strong inductive hypothesis)),证明 \( P(k+1) \) 也成立。
如果基础步骤和归纳步骤都完成,则可以断定对于所有自然数 \( n \),\( P(n) \) 都成立。
② 第二数学归纳法的逻辑 (Logic of Second Mathematical Induction):
第二数学归纳法与第一数学归纳法的逻辑类似,但归纳假设更强。在证明 \( P(k+1) \) 时,可以使用 \( P(1), P(2), ..., P(k) \) 中所有已知的结论,而不仅仅是 \( P(k) \)。
③ 适用情况 (Applicable Scenarios):
第二数学归纳法在某些情况下比第一数学归纳法更方便使用,特别是当证明 \( P(k+1) \) 的成立需要用到 \( P(1), P(2), ..., P(k) \) 中多个命题的成立时。例如,证明与递归定义 (recursive definition) 或 分情况讨论 (case-by-case analysis) 有关的命题时,第二数学归纳法往往更有效。
④ 例子 (Examples):
⚝ 例 1:证明任何大于 1 的整数都可以分解为素数的乘积。
▮▮▮▮ⓐ 基础步骤 (Base Case):当 \( n = 2 \) 时,2 是素数,可以分解为素数乘积 (自身),\( P(2) \) 成立。
▮▮▮▮ⓑ 归纳步骤 (Inductive Step):假设对于所有小于等于 \( k \) 的整数 \( j \) ( \( 2 \leq j \leq k \) ),\( P(j) \) 都成立,即 \( j \) 可以分解为素数乘积。要证明 \( P(k+1) \) 也成立,即 \( k+1 \) 可以分解为素数乘积。
▮▮▮▮▮▮▮▮考虑 \( k+1 \)。如果 \( k+1 \) 是素数,则 \( k+1 \) 本身就是素数乘积。如果 \( k+1 \) 是合数,则存在整数 \( a, b \),\( 1 < a, b < k+1 \),使得 \( k+1 = a \cdot b \)。由于 \( a, b \leq k \),根据强归纳假设,\( P(a) \) 和 \( P(b) \) 都成立,即 \( a \) 和 \( b \) 都可以分解为素数乘积。因此 \( k+1 = a \cdot b \) 也可以分解为素数乘积。
▮▮▮▮▮▮▮▮所以 \( P(k+1) \) 成立。
▮▮▮▮ⓒ 根据第二数学归纳法原理,任何大于 1 的整数都可以分解为素数的乘积。
⚝ 例 2:斐波那契数列 (Fibonacci Sequence) 定义为 \( F_1 = 1, F_2 = 1, F_n = F_{n-1} + F_{n-2} \) ( \( n \geq 3 \) )。证明对于所有自然数 \( n \),\( F_n < 2^n \)。
▮▮▮▮ⓐ 基础步骤 (Base Cases):当 \( n = 1 \) 时,\( F_1 = 1 < 2^1 = 2 \),\( P(1) \) 成立。当 \( n = 2 \) 时,\( F_2 = 1 < 2^2 = 4 \),\( P(2) \) 成立。需要验证两个基础情况,因为递推关系是二阶的。
▮▮▮▮ⓑ 归纳步骤 (Inductive Step):假设对于所有小于等于 \( k \) 的自然数 \( j \) ( \( 1 \leq j \leq k \) ),\( P(j) \) 都成立,即 \( F_j < 2^j \)。要证明 \( P(k+1) \) 也成立,即 \( F_{k+1} < 2^{k+1} \)。 (假设 \( k \geq 2 \))
▮▮▮▮▮▮▮▮根据斐波那契数列的定义,\( F_{k+1} = F_k + F_{k-1} \)。
▮▮▮▮▮▮▮▮根据强归纳假设,\( F_k < 2^k \) 且 \( F_{k-1} < 2^{k-1} \)。
▮▮▮▮▮▮▮▮所以 \( F_{k+1} = F_k + F_{k-1} < 2^k + 2^{k-1} = 2^{k-1}(2 + 1) = 3 \cdot 2^{k-1} \)。
▮▮▮▮▮▮▮▮当 \( k \geq 1 \) 时,\( 3 < 4 = 2^2 \),所以 \( 3 \cdot 2^{k-1} < 2^2 \cdot 2^{k-1} = 2^{k+1} \)。
▮▮▮▮▮▮▮▮因此 \( F_{k+1} < 2^{k+1} \)。\( P(k+1) \) 成立。
▮▮▮▮ⓒ 根据第二数学归纳法原理,对于所有自然数 \( n \),\( F_n < 2^n \) 都成立。
第二数学归纳法是第一数学归纳法的有力补充,在解决某些问题时更加灵活和方便。选择使用哪种归纳法取决于具体问题的特点。
2. chapter 2: 序列与极限:无限的逼近 (Sequences and Limits: Approaching Infinity)
2.1 数列的极限 (Limits of Sequences)
2.1.1 数列极限的定义 (Definition of Sequence Limit)
在数学分析的广阔天地中,序列 (sequence) 犹如一条长河,奔流不息地延伸向无穷远方。而数列的极限 (limit of sequence) 概念,则如同灯塔,指引我们探寻这条长河最终的归宿。直观上,数列极限描述了当数列的项数无限增大时,数列项趋近于某个特定数值的现象。为了精确地刻画这种“趋近”,我们需要严格的数学定义。
定义 2.1.1 (数列极限的 ε-N 定义):
设 \(\{a_n\}\) 为实数数列,\(L\) 为实数。若对于任意给定的正数 \(\epsilon > 0\),总存在正整数 \(N\),使得当 \(n > N\) 时,都有 \(|a_n - L| < \epsilon\) 成立,则称数列 \(\{a_n\}\) 收敛 (converges) 于 \(L\),记作 \(\lim_{n \to \infty} a_n = L\) 或 \(a_n \to L\) (\(n \to \infty\)),\(L\) 称为数列 \(\{a_n\}\) 的极限 (limit)。若不存在这样的实数 \(L\),则称数列 \(\{a_n\}\) 发散 (diverges)。
解读 ε-N 定义:
⚝ \(\epsilon\) 的任意性: \(\epsilon\) 可以是任意小的正数,这体现了“任意接近”的思想。无论 \(\epsilon\) 多么小,数列最终都能进入到 \(L\) 的 \(\epsilon\) 邻域内。
⚝ \(N\) 的存在性: 对于每一个 \(\epsilon\),都存在一个对应的 \(N\),表明从数列的第 \(N+1\) 项开始,之后的所有项都落在 \(L\) 的 \(\epsilon\) 邻域内。\(N\) 的存在性保证了数列最终会稳定地趋近于 \(L\)。
⚝ \(|a_n - L| < \epsilon\): 这表示数列的项 \(a_n\) 与极限 \(L\) 之间的距离小于 \(\epsilon\),即 \(a_n\) 充分接近 \(L\)。
几何解释:
在数轴上,数列 \(\{a_n\}\) 收敛于 \(L\) 意味着:以 \(L\) 为中心,任意给定一个半径为 \(\epsilon\) 的开区间 \((L-\epsilon, L+\epsilon)\),总可以找到一个项数 \(N\),使得数列 \(\{a_n\}\) 从第 \(N+1\) 项开始的所有项都落在这个开区间内。
例 2.1.1: 证明 \(\lim_{n \to \infty} \frac{1}{n} = 0\)。
证明:
要证 \(\lim_{n \to \infty} \frac{1}{n} = 0\),即要证明对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(n > N\) 时,有 \(|\frac{1}{n} - 0| < \epsilon\)。
对于给定的 \(\epsilon > 0\),我们希望 \(|\frac{1}{n}| < \epsilon\),即 \(\frac{1}{n} < \epsilon\),也就是 \(n > \frac{1}{\epsilon}\)。
因此,我们只需取 \(N = \lfloor \frac{1}{\epsilon} \rfloor\) (向下取整)或 \(N\) 为任何大于 \(\frac{1}{\epsilon}\) 的正整数,例如 \(N = \lceil \frac{1}{\epsilon} \rceil\) (向上取整)。
当 \(n > N\) 时,必有 \(n > \frac{1}{\epsilon}\),从而 \(\frac{1}{n} < \epsilon\),即 \(|\frac{1}{n} - 0| < \epsilon\)。
所以,根据数列极限的定义,\(\lim_{n \to \infty} \frac{1}{n} = 0\)。
例 2.1.2: 证明 \(\lim_{n \to \infty} c = c\) (其中 \(c\) 为常数)。
证明:
要证 \(\lim_{n \to \infty} c = c\),即要证明对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(n > N\) 时,有 \(|c - c| < \epsilon\)。
对于任意 \(\epsilon > 0\),我们考虑 \(|c - c| = |0| = 0\)。由于 \(0 < \epsilon\) 恒成立,因此对于任意正整数 \(N\),当 \(n > N\) 时,都有 \(|c - c| = 0 < \epsilon\)。
所以,根据数列极限的定义,\(\lim_{n \to \infty} c = c\)。
2.1.2 极限的性质 (Properties of Limits)
极限作为描述数列最终行为的重要概念,自然拥有许多重要的性质,这些性质为我们研究和计算极限提供了便利的工具。
定理 2.1.2 (极限的四则运算):
设 \(\lim_{n \to \infty} a_n = A\),\(\lim_{n \to \infty} b_n = B\)。则:
① \(\lim_{n \to \infty} (a_n \pm b_n) = \lim_{n \to \infty} a_n \pm \lim_{n \to \infty} b_n = A \pm B\);
② \(\lim_{n \to \infty} (a_n \cdot b_n) = (\lim_{n \to \infty} a_n) \cdot (\lim_{n \to \infty} b_n) = A \cdot B\);
③ 若 \(B \neq 0\),则 \(\lim_{n \to \infty} \frac{a_n}{b_n} = \frac{\lim_{n \to \infty} a_n}{\lim_{n \to \infty} b_n} = \frac{A}{B}\);
④ \(\lim_{n \to \infty} c \cdot a_n = c \cdot \lim_{n \to \infty} a_n = c \cdot A\) (其中 \(c\) 为常数)。
证明 (以 ① 为例,其余类似):
要证 \(\lim_{n \to \infty} (a_n + b_n) = A + B\),即要证明对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(n > N\) 时,有 \(|(a_n + b_n) - (A + B)| < \epsilon\)。
由于 \(\lim_{n \to \infty} a_n = A\),对于 \(\frac{\epsilon}{2} > 0\),存在 \(N_1\),当 \(n > N_1\) 时,\(|a_n - A| < \frac{\epsilon}{2}\)。
由于 \(\lim_{n \to \infty} b_n = B\),对于 \(\frac{\epsilon}{2} > 0\),存在 \(N_2\),当 \(n > N_2\) 时,\(|b_n - B| < \frac{\epsilon}{2}\)。
取 \(N = \max\{N_1, N_2\}\)。当 \(n > N\) 时,\(n > N_1\) 且 \(n > N_2\),因此 \(|a_n - A| < \frac{\epsilon}{2}\) 且 \(|b_n - B| < \frac{\epsilon}{2}\)。
则 \(|(a_n + b_n) - (A + B)| = |(a_n - A) + (b_n - B)| \leq |a_n - A| + |b_n - B| < \frac{\epsilon}{2} + \frac{\epsilon}{2} = \epsilon\)。
所以,根据数列极限的定义,\(\lim_{n \to \infty} (a_n + b_n) = A + B\)。
定理 2.1.3 (复合函数的极限):
设函数 \(f\) 在点 \(A\) 处连续,且 \(\lim_{n \to \infty} a_n = A\)。则 \(\lim_{n \to \infty} f(a_n) = f(\lim_{n \to \infty} a_n) = f(A)\)。
例 2.1.3: 计算 \(\lim_{n \to \infty} \sin(\frac{1}{n})\)。
解:
我们已知 \(\lim_{n \to \infty} \frac{1}{n} = 0\),且函数 \(f(x) = \sin(x)\) 在 \(x = 0\) 处连续。
根据复合函数的极限性质,\(\lim_{n \to \infty} \sin(\frac{1}{n}) = \sin(\lim_{n \to \infty} \frac{1}{n}) = \sin(0) = 0\)。
定理 2.1.4 (夹逼定理/迫敛定理):
设有数列 \(\{a_n\}\),\(\{b_n\}\),\(\{c_n\}\)。若存在正整数 \(N_0\),当 \(n > N_0\) 时,有 \(b_n \leq a_n \leq c_n\),且 \(\lim_{n \to \infty} b_n = \lim_{n \to \infty} c_n = L\),则 \(\lim_{n \to \infty} a_n = L\)。
几何解释:
如果数列 \(\{a_n\}\) 被数列 \(\{b_n\}\) 和 \(\{c_n\}\) 从下方和上方“夹住”,并且 \(\{b_n\}\) 和 \(\{c_n\}\) 都收敛于同一个极限 \(L\),那么 \(\{a_n\}\) 也必然收敛于 \(L\)。
例 2.1.4: 计算 \(\lim_{n \to \infty} \frac{\sin(n)}{n}\)。
解:
我们知道 \( -1 \leq \sin(n) \leq 1 \)。当 \(n > 0\) 时,有 \(-\frac{1}{n} \leq \frac{\sin(n)}{n} \leq \frac{1}{n}\)。
令 \(b_n = -\frac{1}{n}\),\(c_n = \frac{1}{n}\),\(a_n = \frac{\sin(n)}{n}\)。
我们已知 \(\lim_{n \to \infty} -\frac{1}{n} = 0\),\(\lim_{n \to \infty} \frac{1}{n} = 0\)。
根据夹逼定理,\(\lim_{n \to \infty} \frac{\sin(n)}{n} = 0\)。
2.1.3 极限的唯一性、有界性、保号性 (Uniqueness, Boundedness, and Sign-Preserving Property of Limits)
除了四则运算和夹逼定理,收敛数列还具有一些重要的基本性质,如极限的唯一性、有界性和保号性。
定理 2.1.5 (极限的唯一性):
若数列 \(\{a_n\}\) 收敛,则其极限唯一。
证明 (反证法):
假设数列 \(\{a_n\}\) 收敛于两个不同的极限 \(L_1\) 和 \(L_2\),且 \(L_1 \neq L_2\)。不妨设 \(L_1 < L_2\)。
取 \(\epsilon = \frac{L_2 - L_1}{2} > 0\)。
由于 \(\lim_{n \to \infty} a_n = L_1\),存在 \(N_1\),当 \(n > N_1\) 时,\(|a_n - L_1| < \epsilon\),即 \(L_1 - \epsilon < a_n < L_1 + \epsilon\)。
由于 \(\lim_{n \to \infty} a_n = L_2\),存在 \(N_2\),当 \(n > N_2\) 时,\(|a_n - L_2| < \epsilon\),即 \(L_2 - \epsilon < a_n < L_2 + \epsilon\)。
取 \(N = \max\{N_1, N_2\}\)。当 \(n > N\) 时,上述两个不等式同时成立。
则有 \(a_n < L_1 + \epsilon = L_1 + \frac{L_2 - L_1}{2} = \frac{L_1 + L_2}{2}\)。
同时有 \(a_n > L_2 - \epsilon = L_2 - \frac{L_2 - L_1}{2} = \frac{L_1 + L_2}{2}\)。
因此,我们得到 \(a_n < \frac{L_1 + L_2}{2} < a_n\),矛盾!
所以,极限必须唯一。
定理 2.1.6 (收敛数列的有界性):
收敛数列必有界。
证明:
设 \(\lim_{n \to \infty} a_n = L\)。取 \(\epsilon = 1\)。
根据数列极限的定义,存在正整数 \(N\),当 \(n > N\) 时,\(|a_n - L| < 1\),即 \(L - 1 < a_n < L + 1\)。
这意味着当 \(n > N\) 时,数列 \(\{a_n\}\) 的项是有界的。
对于前 \(N\) 项 \(a_1, a_2, \dots, a_N\),它们是有限个实数,因此也存在最大值和最小值。
令 \(M_1 = \max\{|a_1|, |a_2|, \dots, |a_N|, |L-1|, |L+1|\}\)。
则对于任意 \(n \in \mathbb{N}^+\),都有 \(|a_n| \leq M_1\)。
因此,数列 \(\{a_n\}\) 有界。
注意: 有界数列不一定收敛。例如,数列 \(\{ (-1)^n \}\) 是有界的(界为 1),但它是发散的。
定理 2.1.7 (极限的保号性):
若 \(\lim_{n \to \infty} a_n = A\),且 \(A > 0\) (或 \(A < 0\)),则存在正整数 \(N\),当 \(n > N\) 时,有 \(a_n > 0\) (或 \(a_n < 0\))。
证明 (以 \(A > 0\) 为例):
取 \(\epsilon = \frac{A}{2} > 0\)。
由于 \(\lim_{n \to \infty} a_n = A\),存在正整数 \(N\),当 \(n > N\) 时,\(|a_n - A| < \epsilon = \frac{A}{2}\),即 \(A - \frac{A}{2} < a_n < A + \frac{A}{2}\),也就是 \(\frac{A}{2} < a_n < \frac{3A}{2}\)。
由于 \(\frac{A}{2} > 0\),所以当 \(n > N\) 时,\(a_n > 0\)。
推论 2.1.8 (保序性):
若 \(\lim_{n \to \infty} a_n = A\),\(\lim_{n \to \infty} b_n = B\),且存在正整数 \(N_0\),当 \(n > N_0\) 时,有 \(a_n \geq b_n\),则 \(A \geq B\)。
证明 (反证法):
假设 \(A < B\)。令 \(c_n = a_n - b_n\),则 \(\lim_{n \to \infty} c_n = A - B < 0\)。
根据极限的保号性,存在正整数 \(N_1\),当 \(n > N_1\) 时,\(c_n < 0\),即 \(a_n - b_n < 0\),也就是 \(a_n < b_n\)。
这与条件 “当 \(n > N_0\) 时,有 \(a_n \geq b_n\)” 矛盾 (取 \(n > \max\{N_0, N_1\}\) 即可)。
所以,\(A \geq B\)。
2.2 收敛数列的性质 (Properties of Convergent Sequences)
2.2.1 子数列 (Subsequences)
子数列 (subsequence) 是从原数列中抽取部分项,并保持原有顺序所构成的新数列。子数列的概念在研究数列的收敛性时非常有用。
定义 2.2.1 (子数列):
设 \(\{a_n\}\) 为数列,\(\{n_k\}\) 为严格递增的正整数列,则 \(\{a_{n_k}\}\) 称为 \(\{a_n\}\) 的一个子数列。其中 \(n_1 < n_2 < n_3 < \dots < n_k < \dots\)。
例 2.2.1:
数列 \(\{a_n\} = \{1, 2, 3, 4, 5, \dots\}\)。
取 \(\{n_k\} = \{2, 4, 6, 8, \dots\}\),则子数列 \(\{a_{n_k}\} = \{a_2, a_4, a_6, a_8, \dots\} = \{2, 4, 6, 8, \dots\}\)。
取 \(\{n_k\} = \{1, 3, 5, 7, \dots\}\),则子数列 \(\{a_{n_k}\} = \{a_1, a_3, a_5, a_7, \dots\} = \{1, 3, 5, 7, \dots\}\)。
定理 2.2.2 (子数列的收敛性):
若数列 \(\{a_n\}\) 收敛于 \(L\),则其任一子数列 \(\{a_{n_k}\}\) 也收敛于 \(L\)。
证明:
由于 \(\lim_{n \to \infty} a_n = L\),对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(n > N\) 时,\(|a_n - L| < \epsilon\)。
因为 \(\{n_k\}\) 是严格递增的正整数列,所以对于任意正整数 \(k\),都有 \(n_k \geq k\)。
因此,当 \(k > N\) 时,必有 \(n_k \geq k > N\),从而 \(|a_{n_k} - L| < \epsilon\)。
这表明子数列 \(\{a_{n_k}\}\) 也收敛于 \(L\)。
推论 2.2.3:
若数列 \(\{a_n\}\) 有两个子数列分别收敛于不同的极限,则数列 \(\{a_n\}\) 发散。
例 2.2.2: 判断数列 \(\{ (-1)^n \}\) 的收敛性。
解:
考虑子数列 \(\{a_{2k}\} = \{(-1)^{2k}\} = \{1, 1, 1, \dots\}\),\(\lim_{k \to \infty} a_{2k} = 1\)。
考虑子数列 \(\{a_{2k-1}\} = \{(-1)^{2k-1}\} = \{-1, -1, -1, \dots\}\),\(\lim_{k \to \infty} a_{2k-1} = -1\)。
由于存在两个子数列收敛于不同的极限 (1 和 -1),因此数列 \(\{ (-1)^n \}\) 发散。
2.2.2 Cauchy 收敛准则 (Cauchy Convergence Criterion)
Cauchy 收敛准则 (Cauchy convergence criterion) 提供了一种判断数列收敛性的重要方法,它只依赖于数列自身项之间的关系,而无需预先知道极限值。这在很多情况下非常方便,尤其是在我们不知道极限值,或者极限值难以直接计算时。
定义 2.2.4 (Cauchy 数列):
设 \(\{a_n\}\) 为数列。若对于任意给定的 \(\epsilon > 0\),总存在正整数 \(N\),使得当 \(m > N\) 且 \(n > N\) 时,都有 \(|a_m - a_n| < \epsilon\) 成立,则称数列 \(\{a_n\}\) 为 Cauchy 数列 (Cauchy sequence)。
Cauchy 收敛准则 (定理 2.2.5):
实数数列 \(\{a_n\}\) 收敛的充分必要条件是 \(\{a_n\}\) 为 Cauchy 数列。
证明 (必要性):
若数列 \(\{a_n\}\) 收敛于 \(L\),则对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(n > N\) 时,\(|a_n - L| < \frac{\epsilon}{2}\)。
当 \(m > N\) 且 \(n > N\) 时,
\(|a_m - a_n| = |(a_m - L) - (a_n - L)| \leq |a_m - L| + |a_n - L| < \frac{\epsilon}{2} + \frac{\epsilon}{2} = \epsilon\)。
因此,\(\{a_n\}\) 是 Cauchy 数列。
证明 (充分性):
(证明充分性需要用到实数完备性,此处略去详细证明,仅给出证明思路)
若 \(\{a_n\}\) 是 Cauchy 数列,首先可以证明 Cauchy 数列是有界的。
根据有界数列必有收敛子列的 Bolzano-Weierstrass 定理 (波尔查诺-魏尔斯特拉斯定理),\(\{a_n\}\) 存在收敛子数列 \(\{a_{n_k}\}\),设 \(\lim_{k \to \infty} a_{n_k} = L\)。
再利用 Cauchy 数列的性质,可以证明原数列 \(\{a_n\}\) 也收敛于 \(L\)。
Cauchy 收敛准则的应用意义:
Cauchy 收敛准则将数列的收敛性问题转化为数列项之间的关系问题,避免了对极限值的预先了解。这在理论分析和实际应用中都非常重要。
例 2.2.3: 证明数列 \(a_n = 1 + \frac{1}{2} + \frac{1}{2^2} + \dots + \frac{1}{2^{n-1}}\) 收敛。
证明:
考虑 \(m > n\)。
\(|a_m - a_n| = |(1 + \frac{1}{2} + \dots + \frac{1}{2^{m-1}}) - (1 + \frac{1}{2} + \dots + \frac{1}{2^{n-1}})| = |\frac{1}{2^n} + \frac{1}{2^{n+1}} + \dots + \frac{1}{2^{m-1}}|\)
\( = \frac{1}{2^n} (1 + \frac{1}{2} + \dots + \frac{1}{2^{m-n-1}}) = \frac{1}{2^n} \cdot \frac{1 - (\frac{1}{2})^{m-n}}{1 - \frac{1}{2}} = \frac{1}{2^n} \cdot \frac{1 - (\frac{1}{2})^{m-n}}{\frac{1}{2}} = \frac{1}{2^{n-1}} (1 - (\frac{1}{2})^{m-n}) < \frac{1}{2^{n-1}}\)。
对于任意 \(\epsilon > 0\),要使 \(|a_m - a_n| < \epsilon\),只需 \(\frac{1}{2^{n-1}} < \epsilon\),即 \(2^{n-1} > \frac{1}{\epsilon}\),也就是 \(n-1 > \log_2(\frac{1}{\epsilon})\),\(n > 1 + \log_2(\frac{1}{\epsilon})\)。
取 \(N = \lceil 1 + \log_2(\frac{1}{\epsilon}) \rceil\)。当 \(m > n > N\) 时,\(|a_m - a_n| < \frac{1}{2^{n-1}} < \epsilon\)。
因此,\(\{a_n\}\) 是 Cauchy 数列,根据 Cauchy 收敛准则,\(\{a_n\}\) 收敛。
2.3 函数的极限 (Limits of Functions)
2.3.1 函数极限的定义 (Definition of Function Limit)
数列极限描述了当自变量 \(n\) 趋于无穷大时,数列项的趋近行为。而函数极限 (limit of function) 则描述了当自变量 \(x\) 趋于某个特定值 (可以是有限值,也可以是无穷大) 时,函数值的趋近行为。
定义 2.3.1 (函数极限的 \(\epsilon-\delta\) 定义):
设函数 \(f\) 定义在点 \(x_0\) 的某个去心邻域内 (即 \(x_0\) 可以不是 \(f\) 的定义域中的点)。若对于任意给定的 \(\epsilon > 0\),总存在 \(\delta > 0\),使得当 \(0 < |x - x_0| < \delta\) 时,都有 \(|f(x) - A| < \epsilon\) 成立,则称当 \(x\) 趋于 \(x_0\) 时,函数 \(f(x)\) 的极限为 \(A\),记作 \(\lim_{x \to x_0} f(x) = A\)。
解读 \(\epsilon-\delta\) 定义:
⚝ \(\epsilon\) 的任意性: \(\epsilon\) 可以是任意小的正数,表示函数值 \(f(x)\) 可以任意接近极限值 \(A\)。
⚝ \(\delta\) 的存在性: 对于每一个 \(\epsilon\),都存在一个对应的 \(\delta\),表示当自变量 \(x\) 在 \(x_0\) 的 \(\delta\) 去心邻域内时,函数值 \(f(x)\) 落在 \(A\) 的 \(\epsilon\) 邻域内。
⚝ \(0 < |x - x_0| < \delta\): 表示 \(x\) 在 \(x_0\) 的 \(\delta\) 去心邻域内,即 \(x\) 接近 \(x_0\),但不等于 \(x_0\)。
⚝ \(|f(x) - A| < \epsilon\): 表示函数值 \(f(x)\) 接近 \(A\)。
几何解释:
对于任意给定的以 \(A\) 为中心,半径为 \(\epsilon\) 的水平带状区域 \((A-\epsilon, A+\epsilon)\),总可以找到一个以 \(x_0\) 为中心,半径为 \(\delta\) 的竖直带状区域 \((x_0-\delta, x_0+\delta)\) (不包含 \(x_0\) 这条竖线),使得函数 \(f\) 在竖直带状区域内的图像都落在水平带状区域内。
例 2.3.1: 证明 \(\lim_{x \to 2} (2x + 1) = 5\)。
证明:
要证 \(\lim_{x \to 2} (2x + 1) = 5\),即要证明对于任意 \(\epsilon > 0\),存在 \(\delta > 0\),使得当 \(0 < |x - 2| < \delta\) 时,有 \(|(2x + 1) - 5| < \epsilon\)。
我们先化简 \(|(2x + 1) - 5| = |2x - 4| = 2|x - 2|\)。
要使 \(2|x - 2| < \epsilon\),只需 \(|x - 2| < \frac{\epsilon}{2}\)。
因此,我们可以取 \(\delta = \frac{\epsilon}{2}\)。
当 \(0 < |x - 2| < \delta = \frac{\epsilon}{2}\) 时,\(|(2x + 1) - 5| = 2|x - 2| < 2 \cdot \frac{\epsilon}{2} = \epsilon\)。
所以,根据函数极限的定义,\(\lim_{x \to 2} (2x + 1) = 5\)。
单侧极限:
除了双侧极限,还有单侧极限,分别从左侧和右侧趋近。
⚝ 左极限: \(\lim_{x \to x_0^-} f(x) = A\),表示当 \(x\) 从 \(x_0\) 的左侧趋近于 \(x_0\) 时,\(f(x)\) 趋近于 \(A\)。定义为:对于任意 \(\epsilon > 0\),存在 \(\delta > 0\),使得当 \(x_0 - \delta < x < x_0\) 时,\(|f(x) - A| < \epsilon\)。
⚝ 右极限: \(\lim_{x \to x_0^+} f(x) = A\),表示当 \(x\) 从 \(x_0\) 的右侧趋近于 \(x_0\) 时,\(f(x)\) 趋近于 \(A\)。定义为:对于任意 \(\epsilon > 0\),存在 \(\delta > 0\),使得当 \(x_0 < x < x_0 + \delta\) 时,\(|f(x) - A| < \epsilon\)。
定理 2.3.2 (函数极限存在的充要条件):
\(\lim_{x \to x_0} f(x) = A\) 存在的充要条件是 \(\lim_{x \to x_0^-} f(x) = \lim_{x \to x_0^+} f(x) = A\)。即左极限和右极限都存在且相等。
2.3.2 函数极限的性质 (Properties of Function Limits)
函数极限也具有类似于数列极限的性质,例如四则运算、复合函数极限、夹逼定理等。
定理 2.3.3 (函数极限的四则运算):
设 \(\lim_{x \to x_0} f(x) = A\),\(\lim_{x \to x_0} g(x) = B\)。则:
① \(\lim_{x \to x_0} [f(x) \pm g(x)] = A \pm B\);
② \(\lim_{x \to x_0} [f(x) \cdot g(x)] = A \cdot B\);
③ 若 \(B \neq 0\),则 \(\lim_{x \to x_0} \frac{f(x)}{g(x)} = \frac{A}{B}\);
④ \(\lim_{x \to x_0} c \cdot f(x) = c \cdot A\) (其中 \(c\) 为常数)。
定理 2.3.4 (复合函数的极限):
设 \(\lim_{x \to x_0} g(x) = A\),且 \(\lim_{y \to A} f(y) = f(A)\) (即 \(f\) 在 \(A\) 处连续)。则 \(\lim_{x \to x_0} f(g(x)) = f(\lim_{x \to x_0} g(x)) = f(A)\)。
定理 2.3.5 (函数极限的夹逼定理):
若在 \(x_0\) 的某个去心邻域内,有 \(g(x) \leq f(x) \leq h(x)\),且 \(\lim_{x \to x_0} g(x) = \lim_{x \to x_0} h(x) = L\),则 \(\lim_{x \to x_0} f(x) = L\)。
例 2.3.2: 计算 \(\lim_{x \to 0} \frac{\sin(x)}{x}\)。
解:
这是一个重要的极限,通常使用几何方法或夹逼定理来证明 \(\lim_{x \to 0} \frac{\sin(x)}{x} = 1\)。
利用夹逼定理:当 \(x \to 0\) 时,有不等式 \(\cos(x) \leq \frac{\sin(x)}{x} \leq \frac{1}{\cos(x)}\) (当 \(x\) 接近 0 时,\(\cos(x) > 0\))。
由于 \(\lim_{x \to 0} \cos(x) = 1\),\(\lim_{x \to 0} \frac{1}{\cos(x)} = \frac{1}{1} = 1\)。
根据夹逼定理,\(\lim_{x \to 0} \frac{\sin(x)}{x} = 1\)。
2.4 无穷小与无穷大 (Infinitesimals and Infinitesimals)
无穷小 (infinitesimal) 和 无穷大 (infinitesimal) 是极限概念的另一种表达方式,它们描述了变量在极限过程中趋于零或无穷大的趋势。
2.4.1 无穷小的比较 (Comparison of Infinitesimals)
定义 2.4.1 (无穷小):
若 \(\lim_{x \to x_0} f(x) = 0\) (或 \(\lim_{x \to \infty} f(x) = 0\)),则称 \(f(x)\) 为当 \(x \to x_0\) (或 \(x \to \infty\)) 时的无穷小。
无穷小的阶:
设 \(\alpha(x)\) 和 \(\beta(x)\) 都是当 \(x \to x_0\) (或 \(x \to \infty\)) 时的无穷小,且 \(\beta(x) \neq 0\)。
⚝ 若 \(\lim_{x \to x_0} \frac{\alpha(x)}{\beta(x)} = 0\),则称 \(\alpha(x)\) 是比 \(\beta(x)\) 高阶的无穷小,记作 \(\alpha(x) = o(\beta(x))\)。
⚝ 若 \(\lim_{x \to x_0} \frac{\alpha(x)}{\beta(x)} = \infty\),则称 \(\beta(x)\) 是比 \(\alpha(x)\) 高阶的无穷小。
⚝ 若 \(\lim_{x \to x_0} \frac{\alpha(x)}{\beta(x)} = c \neq 0\) (常数),则称 \(\alpha(x)\) 与 \(\beta(x)\) 是同阶无穷小。特别地,当 \(c = 1\) 时,称 \(\alpha(x)\) 与 \(\beta(x)\) 是等价无穷小,记作 \(\alpha(x) \sim \beta(x)\)。
⚝ 若 \(\lim_{x \to x_0} \frac{\alpha(x)}{(\beta(x))^k} = c \neq 0\) (常数),则称 \(\alpha(x)\) 是关于 \(\beta(x)\) 的 \(k\) 阶无穷小。
常用等价无穷小 (当 \(x \to 0\) 时):
① \(\sin(x) \sim x\)
② \(\tan(x) \sim x\)
③ \(\arcsin(x) \sim x\)
④ \(\arctan(x) \sim x\)
⑤ \(1 - \cos(x) \sim \frac{1}{2}x^2\)
⑥ \(e^x - 1 \sim x\)
⑦ \(\ln(1 + x) \sim x\)
⑧ \((1 + x)^a - 1 \sim ax\)
例 2.4.1: 计算 \(\lim_{x \to 0} \frac{\tan(x) - \sin(x)}{x^3}\)。
解:
当 \(x \to 0\) 时,\(\tan(x) \sim x\),\(\sin(x) \sim x\)。直接代换会得到 \(\frac{0}{0}\) 型不定式。
利用等价无穷小和 Taylor 展开:
\(\tan(x) = x + \frac{x^3}{3} + o(x^3)\),\(\sin(x) = x - \frac{x^3}{6} + o(x^3)\)。
\(\tan(x) - \sin(x) = (x + \frac{x^3}{3} + o(x^3)) - (x - \frac{x^3}{6} + o(x^3)) = \frac{x^3}{3} + \frac{x^3}{6} + o(x^3) = \frac{1}{2}x^3 + o(x^3)\)。
\(\lim_{x \to 0} \frac{\tan(x) - \sin(x)}{x^3} = \lim_{x \to 0} \frac{\frac{1}{2}x^3 + o(x^3)}{x^3} = \lim_{x \to 0} (\frac{1}{2} + \frac{o(x^3)}{x^3}) = \frac{1}{2}\)。
2.4.2 无穷大 (Infinitesimals)
定义 2.4.2 (无穷大):
若对于任意给定的 \(M > 0\) (无论多么大),总存在 \(\delta > 0\) (或 \(X > 0\)),使得当 \(0 < |x - x_0| < \delta\) (或 \(x > X\)) 时,都有 \(|f(x)| > M\) 成立,则称当 \(x \to x_0\) (或 \(x \to \infty\)) 时,\(f(x)\) 为无穷大,记作 \(\lim_{x \to x_0} f(x) = \infty\) (或 \(\lim_{x \to \infty} f(x) = \infty\))。
注意:
⚝ 无穷大不是一个确定的数,而是一种极限状态,表示函数值趋于无限增大。
⚝ 若 \(\lim_{x \to x_0} f(x) = \infty\),则 \(\lim_{x \to x_0} \frac{1}{f(x)} = 0\)。反之,若 \(\lim_{x \to x_0} f(x) = 0\),且在 \(x_0\) 的去心邻域内 \(f(x) \neq 0\),则 \(\lim_{x \to x_0} \frac{1}{f(x)} = \infty\)。无穷小与无穷大互为倒数关系。
例 2.4.2: 证明 \(\lim_{x \to 0} \frac{1}{x^2} = \infty\)。
证明:
对于任意给定的 \(M > 0\),要使 \(|\frac{1}{x^2}| > M\),即 \(\frac{1}{x^2} > M\),也就是 \(x^2 < \frac{1}{M}\),\(|x| < \frac{1}{\sqrt{M}}\)。
取 \(\delta = \frac{1}{\sqrt{M}}\)。当 \(0 < |x - 0| < \delta = \frac{1}{\sqrt{M}}\) 时,\(|\frac{1}{x^2}| = \frac{1}{x^2} > M\)。
所以,根据无穷大的定义,\(\lim_{x \to 0} \frac{1}{x^2} = \infty\)。
总结:
本章我们深入探讨了序列极限和函数极限的概念、性质和计算方法。从严格的 \(\epsilon-N\) 和 \(\epsilon-\delta\) 定义出发,我们学习了极限的四则运算、夹逼定理、复合函数极限等重要性质,并介绍了 Cauchy 收敛准则这一判断数列收敛性的有力工具。最后,我们还介绍了无穷小和无穷大的概念,以及无穷小的比较方法,为后续更深入的实分析学习打下了坚实的基础。
3. chapter 3: 连续性:函数图像的连绵不断 (Continuity: Uninterrupted Graphs of Functions)
3.1 连续函数的定义 (Definition of Continuous Functions)
3.1.1 点连续与区间连续 (Pointwise Continuity and Interval Continuity)
在数学分析中,连续性 (Continuity) 是函数的一个核心性质,它描述了函数图像的“连绵不断”的特性,即在定义域内,函数值不会发生突变。直观上,一个连续函数的图像可以一笔画成,而不需要提起笔。本节我们将从点连续 (Pointwise Continuity) 和 区间连续 (Interval Continuity) 两个方面来深入探讨连续函数的定义。
点连续 (Pointwise Continuity)
对于函数 \( f: D \to \mathbb{R} \),其中 \( D \subseteq \mathbb{R} \),我们首先定义函数在某一点 \( x_0 \in D \) 处连续的概念。
定义 3.1.1 (点连续的 \( \varepsilon-\delta \) 定义):
设函数 \( f: D \to \mathbb{R} \),\( x_0 \in D \) 是定义域 \( D \) 的一个点。称函数 \( f \) 在点 \( x_0 \) 处连续 (continuous),是指对于任意给定的 \( \varepsilon > 0 \),总存在 \( \delta > 0 \),使得对于所有 \( x \in D \) 且满足 \( |x - x_0| < \delta \) 时,都有 \( |f(x) - f(x_0)| < \varepsilon \) 成立。
\[ \forall \varepsilon > 0, \exists \delta > 0, \forall x \in D, (|x - x_0| < \delta \implies |f(x) - f(x_0)| < \varepsilon) \]
这个定义也被称为 \( \varepsilon-\delta \) 语言,是刻画函数连续性的精确数学语言。它表达的含义是:当自变量 \( x \) 在 \( x_0 \) 附近充分接近时(即 \( |x - x_0| < \delta \)),函数值 \( f(x) \) 就会在 \( f(x_0) \) 附近任意小的范围内(即 \( |f(x) - f(x_0)| < \varepsilon \))。
例 3.1.1 证明函数 \( f(x) = x^2 \) 在任意点 \( x_0 \in \mathbb{R} \) 处连续。
证明:
对于任意给定的 \( \varepsilon > 0 \) 和任意点 \( x_0 \in \mathbb{R} \),我们需要找到一个 \( \delta > 0 \),使得当 \( |x - x_0| < \delta \) 时,有 \( |f(x) - f(x_0)| = |x^2 - x_0^2| < \varepsilon \)。
我们有 \( |x^2 - x_0^2| = |x - x_0| |x + x_0| \)。为了控制 \( |x + x_0| \),我们假设 \( |x - x_0| < 1 \),则 \( |x| = |x - x_0 + x_0| \le |x - x_0| + |x_0| < 1 + |x_0| \),从而 \( |x + x_0| \le |x| + |x_0| < 1 + 2|x_0| \)。
因此,当 \( |x - x_0| < 1 \) 时,\( |x^2 - x_0^2| = |x - x_0| |x + x_0| < |x - x_0| (1 + 2|x_0|) \)。
为了使 \( |x^2 - x_0^2| < \varepsilon \),我们只需要 \( |x - x_0| (1 + 2|x_0|) \le \varepsilon \),即 \( |x - x_0| \le \frac{\varepsilon}{1 + 2|x_0|} \)。
所以,我们可以取 \( \delta = \min\{1, \frac{\varepsilon}{1 + 2|x_0|}\} \)。当 \( |x - x_0| < \delta \) 时,就有 \( |x^2 - x_0^2| < \varepsilon \)。因此,函数 \( f(x) = x^2 \) 在任意点 \( x_0 \in \mathbb{R} \) 处连续。
注 3.1.1:
当 \( x_0 = 0 \) 时,证明可以更简单。对于 \( f(x) = x^2 \) 在 \( x_0 = 0 \) 处连续,只需对于任意 \( \varepsilon > 0 \),取 \( \delta = \sqrt{\varepsilon} \),当 \( |x - 0| = |x| < \delta = \sqrt{\varepsilon} \) 时,有 \( |f(x) - f(0)| = |x^2 - 0| = |x|^2 < (\sqrt{\varepsilon})^2 = \varepsilon \)。
用极限定义点连续
点连续性也可以用极限的语言来描述。
定义 3.1.2 (用极限定义点连续):
设函数 \( f: D \to \mathbb{R} \),\( x_0 \in D \) 是定义域 \( D \) 的一个聚点(极限点)。称函数 \( f \) 在点 \( x_0 \) 处连续,是指
\[ \lim_{x \to x_0} f(x) = f(x_0) \]
即函数在 \( x_0 \) 处的极限存在,且极限值等于函数在 \( x_0 \) 处的函数值。
如果 \( x_0 \) 是孤立点,即存在 \( x_0 \) 的邻域不包含 \( D \) 中除 \( x_0 \) 以外的点,那么我们约定函数 \( f \) 在孤立点 \( x_0 \) 处总是连续的。因为此时条件 “对于所有 \( x \in D \) 且满足 \( |x - x_0| < \delta \) 时” 仅当 \( x = x_0 \) 时成立,而 \( |f(x_0) - f(x_0)| = 0 < \varepsilon \) 总是成立的。
区间连续 (Interval Continuity)
了解了点连续的概念后,我们可以自然地定义 区间连续 (Interval Continuity)。
定义 3.1.3 (区间连续):
设函数 \( f: D \to \mathbb{R} \),\( I \subseteq D \) 是一个区间。称函数 \( f \) 在区间 \( I \) 上连续 (continuous),是指 \( f \) 在区间 \( I \) 上的每一点都连续。
例如,我们说函数 \( f(x) = x^2 \) 在 \( \mathbb{R} \) 上连续,就是指它在 \( \mathbb{R} \) 上的每一点都连续,这已在例 3.1.1 中证明。
单侧连续 (One-sided Continuity)
在某些情况下,我们还需要考虑 单侧连续 (One-sided Continuity) 的概念,例如在区间的端点处。
定义 3.1.4 (左连续与右连续):
设函数 \( f: [a, b] \to \mathbb{R} \),\( x_0 \in [a, b] \)。
① 若对于任意 \( \varepsilon > 0 \),存在 \( \delta > 0 \),使得对于所有 \( x \in [a, b] \) 且满足 \( x_0 - \delta < x \le x_0 \) 时,都有 \( |f(x) - f(x_0)| < \varepsilon \) 成立,则称 \( f \) 在 \( x_0 \) 处左连续 (left-continuous)。
② 若对于任意 \( \varepsilon > 0 \),存在 \( \delta > 0 \),使得对于所有 \( x \in [a, b] \) 且满足 \( x_0 \le x < x_0 + \delta \) 时,都有 \( |f(x) - f(x_0)| < \varepsilon \) 成立,则称 \( f \) 在 \( x_0 \) 处右连续 (right-continuous)。
用极限的语言,函数 \( f \) 在 \( x_0 \) 处左连续是指 \( \lim_{x \to x_0^-} f(x) = f(x_0) \),右连续是指 \( \lim_{x \to x_0^+} f(x) = f(x_0) \)。
定理 3.1.1 (点连续与单侧连续的关系):
函数 \( f \) 在点 \( x_0 \) 处连续当且仅当 \( f \) 在 \( x_0 \) 处既左连续又右连续。
证明:
这个定理是显然的,因为极限 \( \lim_{x \to x_0} f(x) \) 存在且等于 \( A \) 的充要条件是左极限 \( \lim_{x \to x_0^-} f(x) \) 和右极限 \( \lim_{x \to x_0^+} f(x) \) 都存在且都等于 \( A \)。因此,\( \lim_{x \to x_0} f(x) = f(x_0) \) 等价于 \( \lim_{x \to x_0^-} f(x) = f(x_0) \) 且 \( \lim_{x \to x_0^+} f(x) = f(x_0) \)。
3.1.2 连续性的局部性质 (Local Properties of Continuity)
局部性质 (Local Properties) 是指函数在某点或某点附近所具有的性质。连续性就是一个典型的局部性质。本节将介绍连续性的几个重要的局部性质。
定理 3.1.2 (局部有界性):
若函数 \( f \) 在点 \( x_0 \) 处连续,则 \( f \) 在 \( x_0 \) 的某个邻域内有界。
证明:
因为 \( f \) 在 \( x_0 \) 处连续,根据定义,对于 \( \varepsilon = 1 \),存在 \( \delta > 0 \),使得当 \( |x - x_0| < \delta \) 时,有 \( |f(x) - f(x_0)| < 1 \)。
根据绝对值不等式,我们有 \( |f(x)| = |f(x) - f(x_0) + f(x_0)| \le |f(x) - f(x_0)| + |f(x_0)| < 1 + |f(x_0)| \)。
令 \( M = 1 + |f(x_0)| \),则对于 \( x \in (x_0 - \delta, x_0 + \delta) \),都有 \( |f(x)| < M \)。
这表明 \( f \) 在邻域 \( (x_0 - \delta, x_0 + \delta) \) 内有界,界为 \( M \)。
注 3.1.2:
局部有界性是连续函数的必要条件,但不是充分条件。即如果函数在某点连续,则它在该点附近有界;反之,即使函数在某点附近有界,它在该点也可能不连续。例如,函数
\[ f(x) = \begin{cases} \sin(\frac{1}{x}), & x \ne 0 \\ 0, & x = 0 \end{cases} \]
在 \( x = 0 \) 附近的任何邻域内都是有界的(因为 \( |\sin(\frac{1}{x})| \le 1 \)),但在 \( x = 0 \) 处不连续(因为 \( \lim_{x \to 0} \sin(\frac{1}{x}) \) 不存在)。
定理 3.1.3 (局部保号性):
若函数 \( f \) 在点 \( x_0 \) 处连续,且 \( f(x_0) > 0 \) (或 \( f(x_0) < 0 \)),则存在 \( x_0 \) 的某个邻域,使得在该邻域内,\( f(x) \) 的符号与 \( f(x_0) \) 的符号相同,即 \( f(x) > 0 \) (或 \( f(x) < 0 \))。
证明:
假设 \( f(x_0) > 0 \)。取 \( \varepsilon = \frac{f(x_0)}{2} > 0 \)。由于 \( f \) 在 \( x_0 \) 处连续,存在 \( \delta > 0 \),使得当 \( |x - x_0| < \delta \) 时,有 \( |f(x) - f(x_0)| < \varepsilon = \frac{f(x_0)}{2} \)。
根据绝对值不等式,我们有 \( -\frac{f(x_0)}{2} < f(x) - f(x_0) < \frac{f(x_0)}{2} \),即 \( f(x_0) - \frac{f(x_0)}{2} < f(x) < f(x_0) + \frac{f(x_0)}{2} \),从而 \( \frac{f(x_0)}{2} < f(x) < \frac{3f(x_0)}{2} \)。
因为 \( f(x_0) > 0 \),所以 \( f(x) > \frac{f(x_0)}{2} > 0 \)。
因此,在邻域 \( (x_0 - \delta, x_0 + \delta) \) 内,\( f(x) > 0 \),符号与 \( f(x_0) \) 相同。
对于 \( f(x_0) < 0 \) 的情况,证明类似,只需取 \( \varepsilon = -\frac{f(x_0)}{2} > 0 \) 即可。
注 3.1.3:
局部保号性说明,如果函数在某点连续且函数值不为零,那么在该点附近,函数值与该点的函数值同号。这个性质在分析函数的性质,例如判断函数的零点是否存在,以及研究不等式等方面非常有用。
3.2 连续函数的性质 (Properties of Continuous Functions)
3.2.1 连续函数的四则运算 (Arithmetic Operations of Continuous Functions)
连续函数具有良好的运算性质,本节将讨论连续函数经过四则运算后,其连续性是否仍然保持。
定理 3.2.1 (连续函数的四则运算):
设函数 \( f \) 和 \( g \) 在点 \( x_0 \) 处连续,\( c \) 为常数,则以下函数在 \( x_0 \) 处也连续:
① \( f + g \) (和函数)
② \( f - g \) (差函数)
③ \( c f \) (常数倍函数)
④ \( f \cdot g \) (积函数)
⑤ \( \frac{f}{g} \) (商函数),当 \( g(x_0) \ne 0 \) 时
证明:
我们利用极限的性质来证明这些结论。由于 \( f \) 和 \( g \) 在 \( x_0 \) 处连续,根据定义 3.1.2,有 \( \lim_{x \to x_0} f(x) = f(x_0) \) 和 \( \lim_{x \to x_0} g(x) = g(x_0) \)。
① 和函数 \( f + g \):
根据极限的加法性质,我们有
\[ \lim_{x \to x_0} (f(x) + g(x)) = \lim_{x \to x_0} f(x) + \lim_{x \to x_0} g(x) = f(x_0) + g(x_0) = (f + g)(x_0) \]
因此,\( f + g \) 在 \( x_0 \) 处连续。
② 差函数 \( f - g \):
证明与和函数类似,利用极限的减法性质。
③ 常数倍函数 \( c f \):
根据极限的常数倍性质,我们有
\[ \lim_{x \to x_0} (c f(x)) = c \lim_{x \to x_0} f(x) = c f(x_0) = (c f)(x_0) \]
因此,\( c f \) 在 \( x_0 \) 处连续。
④ 积函数 \( f \cdot g \):
根据极限的乘法性质,我们有
\[ \lim_{x \to x_0} (f(x) \cdot g(x)) = \lim_{x \to x_0} f(x) \cdot \lim_{x \to x_0} g(x) = f(x_0) \cdot g(x_0) = (f \cdot g)(x_0) \]
因此,\( f \cdot g \) 在 \( x_0 \) 处连续。
⑤ 商函数 \( \frac{f}{g} \) (当 \( g(x_0) \ne 0 \) 时):
由于 \( g(x_0) \ne 0 \),根据局部保号性(定理 3.1.3),存在 \( x_0 \) 的某个邻域,使得在该邻域内 \( g(x) \ne 0 \),从而 \( \frac{f}{g} \) 在该邻域内有定义。
根据极限的除法性质(当分母的极限不为零时),我们有
\[ \lim_{x \to x_0} \frac{f(x)}{g(x)} = \frac{\lim_{x \to x_0} f(x)}{\lim_{x \to x_0} g(x)} = \frac{f(x_0)}{g(x_0)} = (\frac{f}{g})(x_0) \]
因此,\( \frac{f}{g} \) 在 \( x_0 \) 处连续。
推论 3.2.1 (多项式函数和有理函数的连续性):
① 多项式函数 (Polynomial Function) \( P(x) = a_n x^n + a_{n-1} x^{n-1} + \cdots + a_1 x + a_0 \) 在 \( \mathbb{R} \) 上处处连续。
② 有理函数 (Rational Function) \( R(x) = \frac{P(x)}{Q(x)} \),其中 \( P(x) \) 和 \( Q(x) \) 都是多项式函数,在 \( Q(x) \ne 0 \) 的点处连续。
证明:
① 常数函数 \( f(x) = c \) 和 幂函数 \( g(x) = x \) 显然在 \( \mathbb{R} \) 上处处连续(根据 \( \varepsilon-\delta \) 定义容易证明)。根据定理 3.2.1 的 ③ 和 ④,\( a_k x^k \) 在 \( \mathbb{R} \) 上连续,再根据定理 3.2.1 的 ①,多项式函数 \( P(x) \) 是若干个连续函数的和,因此在 \( \mathbb{R} \) 上处处连续。
② 有理函数 \( R(x) = \frac{P(x)}{Q(x)} \) 是两个多项式函数的商。在 \( Q(x) \ne 0 \) 的点 \( x_0 \) 处,由于 \( P(x) \) 和 \( Q(x) \) 在 \( x_0 \) 处连续,且 \( Q(x_0) \ne 0 \),根据定理 3.2.1 的 ⑤,\( R(x) = \frac{P(x)}{Q(x)} \) 在 \( x_0 \) 处连续。
3.2.2 复合函数的连续性 (Continuity of Composite Functions)
复合函数 (Composite Function) 是将一个函数的输出作为另一个函数的输入而形成的函数。本节讨论复合函数的连续性。
定理 3.2.2 (复合函数的连续性):
设函数 \( g \) 在点 \( x_0 \) 处连续,函数 \( f \) 在点 \( y_0 = g(x_0) \) 处连续。则复合函数 \( (f \circ g)(x) = f(g(x)) \) 在点 \( x_0 \) 处连续。
证明:
要证 \( f \circ g \) 在 \( x_0 \) 处连续,即要证对于任意 \( \varepsilon > 0 \),存在 \( \delta > 0 \),使得当 \( |x - x_0| < \delta \) 时,有 \( |f(g(x)) - f(g(x_0))| < \varepsilon \)。
由于 \( f \) 在 \( y_0 = g(x_0) \) 处连续,对于任意给定的 \( \varepsilon > 0 \),存在 \( \delta_1 > 0 \),使得当 \( |y - y_0| < \delta_1 \) 时,有 \( |f(y) - f(y_0)| < \varepsilon \)。
又由于 \( g \) 在 \( x_0 \) 处连续,对于上述 \( \delta_1 > 0 \),存在 \( \delta > 0 \),使得当 \( |x - x_0| < \delta \) 时,有 \( |g(x) - g(x_0)| < \delta_1 \)。
现在,取任意 \( x \) 满足 \( |x - x_0| < \delta \)。令 \( y = g(x) \) 和 \( y_0 = g(x_0) \)。则由 \( g \) 的连续性知 \( |y - y_0| = |g(x) - g(x_0)| < \delta_1 \)。再由 \( f \) 的连续性知,当 \( |y - y_0| < \delta_1 \) 时,有 \( |f(y) - f(y_0)| < \varepsilon \),即 \( |f(g(x)) - f(g(x_0))| < \varepsilon \)。
因此,对于任意 \( \varepsilon > 0 \),存在 \( \delta > 0 \),使得当 \( |x - x_0| < \delta \) 时,有 \( |f(g(x)) - f(g(x_0))| < \varepsilon \)。这表明复合函数 \( f \circ g \) 在点 \( x_0 \) 处连续。
例 3.2.1 证明函数 \( h(x) = \sin(x^2) \) 在 \( \mathbb{R} \) 上连续。
证明:
令 \( g(x) = x^2 \) 和 \( f(y) = \sin(y) \)。我们已知 \( g(x) = x^2 \) 在 \( \mathbb{R} \) 上连续(例 3.1.1),并且三角函数 \( f(y) = \sin(y) \) 在 \( \mathbb{R} \) 上也连续(可以用 \( \varepsilon-\delta \) 定义证明,或利用极限性质)。
根据复合函数的连续性定理(定理 3.2.2),复合函数 \( h(x) = f(g(x)) = \sin(x^2) \) 在 \( \mathbb{R} \) 上连续。
3.3 闭区间上连续函数的性质 (Properties of Continuous Functions on Closed Intervals)
在实分析中,闭区间上的连续函数具有一些非常重要的特殊性质,这些性质在理论和应用上都起着关键作用。本节将介绍闭区间上连续函数的三个基本定理:介值定理 (Intermediate Value Theorem),最值定理 (Extreme Value Theorem) 和 一致连续性定理 (Uniform Continuity Theorem)。
3.3.1 介值定理 (Intermediate Value Theorem)
介值定理 (Intermediate Value Theorem) 描述了连续函数在闭区间上取值的“连续性”,即函数值会“连续地”从一个值变到另一个值,不会跳跃。
定理 3.3.1 (介值定理):
设函数 \( f: [a, b] \to \mathbb{R} \) 在闭区间 \( [a, b] \) 上连续,且 \( f(a) \ne f(b) \)。对于介于 \( f(a) \) 和 \( f(b) \) 之间的任意值 \( C \),即 \( \min\{f(a), f(b)\} \le C \le \max\{f(a), f(b)\} \),至少存在一点 \( \xi \in [a, b] \),使得 \( f(\xi) = C \)。
几何解释:
介值定理的几何意义非常直观。如果一个连续函数在区间端点取不同的值,那么函数图像在 \( [a, b] \) 上从 \( (a, f(a)) \) 到 \( (b, f(b)) \) 的连线上,必然会穿过任何介于 \( y = f(a) \) 和 \( y = f(b) \) 之间的水平线 \( y = C \)。
证明思路:
介值定理的证明通常使用二分法 (Bisection Method) 和确界原理 (Supremum Principle)。我们不妨设 \( f(a) < f(b) \),且 \( f(a) < C < f(b) \)。我们需要找到一点 \( \xi \in [a, b] \) 使得 \( f(\xi) = C \)。
证明:
不妨设 \( f(a) < C < f(b) \) (若 \( f(b) < f(a) \),证明类似)。
令 \( S = \{x \in [a, b] \mid f(x) \le C\} \)。由于 \( f(a) < C \),所以 \( a \in S \),即 \( S \) 非空。又 \( S \subseteq [a, b] \),所以 \( S \) 有上界 \( b \)。根据确界原理,\( S \) 存在上确界,记为 \( \xi = \sup S \)。由于 \( a \in S \) 且 \( b \) 是上界,所以 \( a \le \xi \le b \),即 \( \xi \in [a, b] \)。
下面我们证明 \( f(\xi) = C \)。我们用反证法证明 \( f(\xi) \ne C \) 会导致矛盾。
① 假设 \( f(\xi) < C \)。由于 \( f \) 在 \( \xi \) 处连续,根据局部保号性(定理 3.1.3),存在 \( \delta > 0 \),使得对于 \( x \in (\xi - \delta, \xi + \delta) \cap [a, b] \),都有 \( f(x) < C \)。因此,存在 \( \xi' \in (\xi, \xi + \delta) \cap [a, b] \),使得 \( \xi' > \xi \) 且 \( f(\xi') < C \),即 \( \xi' \in S \)。这与 \( \xi = \sup S \) 是 \( S \) 的上确界矛盾,因为 \( \xi' \) 是 \( S \) 中比 \( \xi \) 更大的元素。
② 假设 \( f(\xi) > C \)。由于 \( f \) 在 \( \xi \) 处连续,根据局部保号性,存在 \( \delta > 0 \),使得对于 \( x \in (\xi - \delta, \xi + \delta) \cap [a, b] \),都有 \( f(x) > C \)。这意味着在 \( (\xi - \delta, \xi + \delta) \cap [a, b] \) 中的点都不属于 \( S \)。因此,\( \xi - \delta \) 是 \( S \) 的一个上界,且 \( \xi - \delta < \xi \)。这与 \( \xi = \sup S \) 是 \( S \) 的最小上界矛盾。
综上,\( f(\xi) < C \) 和 \( f(\xi) > C \) 都不成立,因此必有 \( f(\xi) = C \)。
推论 3.3.1 (零点存在定理):
设函数 \( f: [a, b] \to \mathbb{R} \) 在闭区间 \( [a, b] \) 上连续,且 \( f(a) \cdot f(b) < 0 \),即 \( f(a) \) 和 \( f(b) \) 异号,则在开区间 \( (a, b) \) 内至少存在一点 \( \xi \),使得 \( f(\xi) = 0 \)。
证明:
由于 \( f(a) \cdot f(b) < 0 \),所以 \( f(a) \) 和 \( f(b) \) 异号,不妨设 \( f(a) < 0 \) 和 \( f(b) > 0 \)。取 \( C = 0 \),由于 \( f(a) < 0 < f(b) \),根据介值定理(定理 3.3.1),存在 \( \xi \in [a, b] \),使得 \( f(\xi) = 0 \)。由于 \( f(a) \ne 0 \) 和 \( f(b) \ne 0 \),所以 \( \xi \ne a \) 且 \( \xi \ne b \),因此 \( \xi \in (a, b) \)。
3.3.2 最值定理 (Extreme Value Theorem)
最值定理 (Extreme Value Theorem) 保证了闭区间上的连续函数一定能够取得最大值和最小值。
定理 3.3.2 (最值定理):
设函数 \( f: [a, b] \to \mathbb{R} \) 在闭区间 \( [a, b] \) 上连续,则 \( f \) 在 \( [a, b] \) 上一定能取得最大值和最小值,即存在 \( x_{\max}, x_{\min} \in [a, b] \),使得对于任意 \( x \in [a, b] \),都有 \( f(x_{\min}) \le f(x) \le f(x_{\max}) \)。
证明思路:
最值定理的证明通常分为两步:首先证明闭区间上的连续函数是有界的,然后证明函数能够达到其上确界和下确界。
证明:
第一步:证明 \( f \) 在 \( [a, b] \) 上有界。
假设 \( f \) 在 \( [a, b] \) 上无界。则对于任意正整数 \( n \),存在 \( x_n \in [a, b] \),使得 \( |f(x_n)| > n \)。这样我们得到一个序列 \( \{x_n\}_{n=1}^\infty \) 在闭区间 \( [a, b] \) 中。根据致密性定理 (Bolzano-Weierstrass Theorem),\( \{x_n\} \) 存在收敛子序列 \( \{x_{k_n}\} \),设 \( \lim_{n \to \infty} x_{k_n} = x_0 \)。由于 \( [a, b] \) 是闭集,所以 \( x_0 \in [a, b] \)。
因为 \( f \) 在 \( x_0 \) 处连续,所以 \( \lim_{n \to \infty} f(x_{k_n}) = f(x_0) \)。这意味着子序列 \( \{f(x_{k_n})\} \) 收敛,因此 \( \{f(x_{k_n})\} \) 有界。但是,由于 \( k_n \ge n \),所以 \( |f(x_{k_n})| > k_n \ge n \),当 \( n \to \infty \) 时,\( |f(x_{k_n})| \to \infty \),这与 \( \{f(x_{k_n})\} \) 有界矛盾。因此,\( f \) 在 \( [a, b] \) 上有界。
第二步:证明 \( f \) 能取得最大值和最小值。
由于 \( f \) 在 \( [a, b] \) 上有界,所以函数值集合 \( \{f(x) \mid x \in [a, b]\} \) 有上确界和下确界。令 \( M = \sup\{f(x) \mid x \in [a, b]\} \)。我们需要证明存在 \( x_{\max} \in [a, b] \),使得 \( f(x_{\max}) = M \)。
根据上确界的定义,对于任意正整数 \( n \),\( M - \frac{1}{n} \) 不是上界,所以存在 \( x_n \in [a, b] \),使得 \( f(x_n) > M - \frac{1}{n} \)。这样我们得到一个序列 \( \{x_n\}_{n=1}^\infty \) 在 \( [a, b] \) 中。同样根据致密性定理,\( \{x_n\} \) 存在收敛子序列 \( \{x_{k_n}\} \),设 \( \lim_{n \to \infty} x_{k_n} = x_{\max} \in [a, b] \)。
由于 \( f \) 在 \( x_{\max} \) 处连续,所以 \( \lim_{n \to \infty} f(x_{k_n}) = f(x_{\max}) \)。
另一方面,对于每个 \( n \),有 \( f(x_{k_n}) > M - \frac{1}{k_n} \)。令 \( n \to \infty \),得到 \( \lim_{n \to \infty} f(x_{k_n}) \ge M \)。又因为对于所有 \( x \in [a, b] \),\( f(x) \le M \),所以对于子序列 \( \{x_{k_n}\} \),也有 \( f(x_{k_n}) \le M \),从而 \( \lim_{n \to \infty} f(x_{k_n}) \le M \)。
因此,\( \lim_{n \to \infty} f(x_{k_n}) = M \)。结合 \( \lim_{n \to \infty} f(x_{k_n}) = f(x_{\max}) \),我们得到 \( f(x_{\max}) = M \)。
同理可证,函数 \( f \) 在 \( [a, b] \) 上能取得最小值。
注 3.3.1:
最值定理强调了两个条件:① 闭区间 \( [a, b] \);② 连续函数 \( f \)。如果缺少其中任何一个条件,最值定理的结论都可能不成立。例如,函数 \( f(x) = x \) 在开区间 \( (0, 1) \) 上连续,但既没有最大值也没有最小值。函数 \( f(x) = \begin{cases} x, & x \in [0, 1) \\ 0, & x = 1 \end{cases} \) 在闭区间 \( [0, 1] \) 上不是连续函数,也没有最大值。
3.3.3 一致连续性 (Uniform Continuity)
一致连续性 (Uniform Continuity) 是比点连续性更强的概念。点连续性是针对定义域内每一点而言的,而一致连续性是对整个定义域而言的。
定义 3.3.2 (一致连续性):
设函数 \( f: D \to \mathbb{R} \),其中 \( D \subseteq \mathbb{R} \)。称函数 \( f \) 在 \( D \) 上一致连续 (uniformly continuous),是指对于任意给定的 \( \varepsilon > 0 \),总存在 \( \delta > 0 \),使得对于任意 \( x_1, x_2 \in D \),只要 \( |x_1 - x_2| < \delta \),就有 \( |f(x_1) - f(x_2)| < \varepsilon \) 成立。
\[ \forall \varepsilon > 0, \exists \delta > 0, \forall x_1, x_2 \in D, (|x_1 - x_2| < \delta \implies |f(x_1) - f(x_2)| < \varepsilon) \]
比较点连续与一致连续:
⚝ 点连续:对于每个 \( x_0 \in D \) 和每个 \( \varepsilon > 0 \),存在 \( \delta > 0 \) (依赖于 \( x_0 \) 和 \( \varepsilon \)),使得对于所有 \( x \in D \),当 \( |x - x_0| < \delta \) 时,\( |f(x) - f(x_0)| < \varepsilon \)。
⚝ 一致连续:对于每个 \( \varepsilon > 0 \),存在 \( \delta > 0 \) (只依赖于 \( \varepsilon \),不依赖于 \( x_1, x_2 \)),使得对于所有 \( x_1, x_2 \in D \),当 \( |x_1 - x_2| < \delta \) 时,\( |f(x_1) - f(x_2)| < \varepsilon \)。
一致连续性比点连续性更强,因为对于一致连续性,\( \delta \) 的选取只依赖于 \( \varepsilon \),而与具体的点无关。
定理 3.3.3 (闭区间上连续函数的一致连续性):
若函数 \( f \) 在闭区间 \( [a, b] \) 上连续,则 \( f \) 在 \( [a, b] \) 上一致连续。
证明思路:
一致连续性定理的证明通常使用反证法和致密性定理。假设 \( f \) 在 \( [a, b] \) 上不是一致连续的,则存在 \( \varepsilon_0 > 0 \),使得对于任意 \( \delta > 0 \),都存在 \( x_1, x_2 \in [a, b] \),满足 \( |x_1 - x_2| < \delta \) 但 \( |f(x_1) - f(x_2)| \ge \varepsilon_0 \)。
证明:
假设 \( f \) 在 \( [a, b] \) 上不是一致连续的。则存在 \( \varepsilon_0 > 0 \),使得对于任意 \( n \in \mathbb{N}^+ \),取 \( \delta_n = \frac{1}{n} \),都存在 \( x_n, y_n \in [a, b] \),满足 \( |x_n - y_n| < \frac{1}{n} \) 但 \( |f(x_n) - f(y_n)| \ge \varepsilon_0 \)。
这样我们得到两个序列 \( \{x_n\}_{n=1}^\infty \) 和 \( \{y_n\}_{n=1}^\infty \) 在闭区间 \( [a, b] \) 中。根据致密性定理,\( \{x_n\} \) 存在收敛子序列 \( \{x_{k_n}\} \),设 \( \lim_{n \to \infty} x_{k_n} = x_0 \in [a, b] \)。
由于 \( |x_{k_n} - y_{k_n}| < \frac{1}{k_n} \),当 \( n \to \infty \) 时,\( \frac{1}{k_n} \to 0 \),所以 \( \lim_{n \to \infty} (x_{k_n} - y_{k_n}) = 0 \),即 \( \lim_{n \to \infty} y_{k_n} = \lim_{n \to \infty} x_{k_n} = x_0 \)。
由于 \( f \) 在 \( x_0 \) 处连续,所以 \( \lim_{n \to \infty} f(x_{k_n}) = f(x_0) \) 和 \( \lim_{n \to \infty} f(y_{k_n}) = f(x_0) \)。
因此,\( \lim_{n \to \infty} (f(x_{k_n}) - f(y_{k_n})) = \lim_{n \to \infty} f(x_{k_n}) - \lim_{n \to \infty} f(y_{k_n}) = f(x_0) - f(x_0) = 0 \)。
但是,对于所有 \( n \),都有 \( |f(x_{k_n}) - f(y_{k_n})| \ge \varepsilon_0 \),所以 \( \lim_{n \to \infty} |f(x_{k_n}) - f(y_{k_n})| \ge \varepsilon_0 > 0 \)。这与 \( \lim_{n \to \infty} (f(x_{k_n}) - f(y_{k_n})) = 0 \) 矛盾。
因此,假设不成立,即 \( f \) 在 \( [a, b] \) 上是一致连续的。
例 3.3.1 函数 \( f(x) = x^2 \) 在 \( [0, 1] \) 上一致连续。
例 3.3.2 函数 \( f(x) = \frac{1}{x} \) 在 \( (0, 1] \) 上不是一致连续的。虽然 \( f(x) = \frac{1}{x} \) 在 \( (0, 1] \) 上每一点都连续,但由于定义域不是闭区间,所以不一定一致连续。实际上,当 \( x \) 趋近于 0 时,函数斜率趋于无穷大,导致一致连续性不成立。
4. chapter 4: 微分学:变化率的精妙刻画 (Differential Calculus: Exquisite Description of Rates of Change)
4.1 导数的概念 (The Concept of Derivative)
4.1.1 导数的定义 (Definition of Derivative)
导数是微分学的核心概念,它描述了函数在某一点附近变化的快慢。从几何上看,导数代表了函数图像在该点切线的斜率;从物理上看,导数可以表示瞬时变化率,例如速度、加速度等。
定义 4.1.1 (导数的定义):设函数 \( f \) 在点 \( x_0 \) 的某个邻域内有定义。如果极限
\[ \lim_{x \to x_0} \frac{f(x) - f(x_0)}{x - x_0} = A \]
存在,则称函数 \( f \) 在点 \( x_0 \) 处可导 (differentiable),并称此极限值 \( A \) 为函数 \( f \) 在点 \( x_0 \) 处的导数 (derivative),记作 \( f'(x_0) \) 或 \( \frac{df}{dx}\Big|_{x=x_0} \) 或 \( \left. \frac{d}{dx} f(x) \right|_{x=x_0} \)。
如果极限不存在,则称函数 \( f \) 在点 \( x_0 \) 处不可导 (non-differentiable)。
等价定义:令 \( \Delta x = x - x_0 \),则 \( x = x_0 + \Delta x \)。当 \( x \to x_0 \) 时,\( \Delta x \to 0 \)。导数的定义也可以写成:
\[ f'(x_0) = \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \]
或令 \( \Delta y = f(x) - f(x_0) = f(x_0 + \Delta x) - f(x_0) \),则导数又可以表示为:
\[ f'(x_0) = \lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} \]
单侧导数 (One-sided Derivatives):
① 左导数 (Left Derivative):
\[ f'_{-}(x_0) = \lim_{x \to x_0^-} \frac{f(x) - f(x_0)}{x - x_0} = \lim_{\Delta x \to 0^-} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \]
② 右导数 (Right Derivative):
\[ f'_{+}(x_0) = \lim_{x \to x_0^+} \frac{f(x) - f(x_0)}{x - x_0} = \lim_{\Delta x \to 0^+} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \]
函数 \( f \) 在点 \( x_0 \) 处可导的充要条件 (necessary and sufficient condition) 是左导数 \( f'_{-}(x_0) \) 和右导数 \( f'_{+}(x_0) \) 都存在且相等,即 \( f'_{-}(x_0) = f'_{+}(x_0) \)。
例 4.1.1:求函数 \( f(x) = x^2 \) 在 \( x = 2 \) 处的导数。
解:根据导数的定义,
\[ f'(2) = \lim_{x \to 2} \frac{f(x) - f(2)}{x - 2} = \lim_{x \to 2} \frac{x^2 - 2^2}{x - 2} = \lim_{x \to 2} \frac{(x - 2)(x + 2)}{x - 2} = \lim_{x \to 2} (x + 2) = 4 \]
所以,\( f'(2) = 4 \)。
例 4.1.2:讨论函数 \( f(x) = |x| \) 在 \( x = 0 \) 处的可导性。
解:分别计算左导数和右导数。
① 左导数:
\[ f'_{-}(0) = \lim_{x \to 0^-} \frac{f(x) - f(0)}{x - 0} = \lim_{x \to 0^-} \frac{|x| - |0|}{x} = \lim_{x \to 0^-} \frac{-x}{x} = -1 \]
② 右导数:
\[ f'_{+}(0) = \lim_{x \to 0^+} \frac{f(x) - f(0)}{x - 0} = \lim_{x \to 0^+} \frac{|x| - |0|}{x} = \lim_{x \to 0^+} \frac{x}{x} = 1 \]
由于 \( f'_{-}(0) = -1 \neq 1 = f'_{+}(0) \),所以函数 \( f(x) = |x| \) 在 \( x = 0 \) 处不可导。
4.1.2 导数的几何意义与物理意义 (Geometric and Physical Meanings of Derivative)
导数具有深刻的几何意义和物理意义,理解这些意义有助于我们更好地应用导数解决实际问题。
① 几何意义 (Geometric Meaning):
函数 \( f(x) \) 在点 \( x_0 \) 处的导数 \( f'(x_0) \) 表示函数图像在点 \( (x_0, f(x_0)) \) 处的切线 (tangent line) 的斜率。
考虑函数 \( y = f(x) \) 的图像。在点 \( P(x_0, f(x_0)) \) 附近取一点 \( Q(x_0 + \Delta x, f(x_0 + \Delta x)) \)。连接 \( P \) 和 \( Q \) 的直线 \( PQ \) 的斜率为:
\[ k_{PQ} = \frac{f(x_0 + \Delta x) - f(x_0)}{(x_0 + \Delta x) - x_0} = \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \]
当 \( \Delta x \to 0 \) 时,点 \( Q \) 沿着曲线趋近于点 \( P \),直线 \( PQ \) 趋近于曲线在点 \( P \) 处的切线。因此,切线的斜率 \( k \) 为:
\[ k = \lim_{\Delta x \to 0} k_{PQ} = \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} = f'(x_0) \]
切线方程为:\( y - f(x_0) = f'(x_0)(x - x_0) \)。
② 物理意义 (Physical Meaning):
导数可以表示瞬时变化率 (instantaneous rate of change)。
例如,设 \( s(t) \) 表示物体在时刻 \( t \) 的位置(位移)。则在时间间隔 \( [t_0, t_0 + \Delta t] \) 内,物体的平均速度为:
\[ \bar{v} = \frac{s(t_0 + \Delta t) - s(t_0)}{(t_0 + \Delta t) - t_0} = \frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t} \]
当 \( \Delta t \to 0 \) 时,平均速度趋近于物体在时刻 \( t_0 \) 的瞬时速度 (instantaneous velocity) \( v(t_0) \):
\[ v(t_0) = \lim_{\Delta t \to 0} \frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t} = s'(t_0) \]
类似地,如果 \( v(t) \) 表示物体在时刻 \( t \) 的速度,则其导数 \( a(t) = v'(t) \) 表示物体在时刻 \( t \) 的瞬时加速度 (instantaneous acceleration)。
总而言之,导数描述了函数值随自变量变化的快慢程度,是分析变化和运动的重要工具。
4.2 微分法则 (Differentiation Rules)
为了更方便地求导,我们需要掌握一些基本的微分法则 (differentiation rules)。这些法则可以帮助我们快速计算复杂函数的导数,而无需每次都使用导数的定义。
4.2.1 基本函数的导数 (Derivatives of Elementary Functions)
以下列出一些基本初等函数 (elementary functions) 的导数公式,这些公式是微分学的基础。
① 常数函数 (Constant Function):若 \( f(x) = C \) (C 为常数),则 \( f'(x) = 0 \)。
\[ \frac{d}{dx}(C) = 0 \]
② 幂函数 (Power Function):若 \( f(x) = x^\mu \) ( \( \mu \) 为实数),则 \( f'(x) = \mu x^{\mu - 1} \)。
\[ \frac{d}{dx}(x^\mu) = \mu x^{\mu - 1} \]
特别地,当 \( \mu = n \) 为正整数时,\( \frac{d}{dx}(x^n) = n x^{n - 1} \)。当 \( \mu = -1 \) 时,\( \frac{d}{dx}(\frac{1}{x}) = -\frac{1}{x^2} \)。当 \( \mu = \frac{1}{2} \) 时,\( \frac{d}{dx}(\sqrt{x}) = \frac{1}{2\sqrt{x}} \)。
③ 指数函数 (Exponential Function):
▮▮▮▮⚝ 若 \( f(x) = e^x \),则 \( f'(x) = e^x \)。
\[ \frac{d}{dx}(e^x) = e^x \]
▮▮▮▮⚝ 若 \( f(x) = a^x \) ( \( a > 0, a \neq 1 \) ),则 \( f'(x) = a^x \ln a \)。
\[ \frac{d}{dx}(a^x) = a^x \ln a \]
④ 对数函数 (Logarithmic Function):
▮▮▮▮⚝ 若 \( f(x) = \ln x \) ( \( x > 0 \) ),则 \( f'(x) = \frac{1}{x} \)。
\[ \frac{d}{dx}(\ln x) = \frac{1}{x} \]
▮▮▮▮⚝ 若 \( f(x) = \log_a x \) ( \( a > 0, a \neq 1, x > 0 \) ),则 \( f'(x) = \frac{1}{x \ln a} \)。
\[ \frac{d}{dx}(\log_a x) = \frac{1}{x \ln a} \]
⑤ 三角函数 (Trigonometric Functions):
▮▮▮▮⚝ \( \frac{d}{dx}(\sin x) = \cos x \)
▮▮▮▮⚝ \( \frac{d}{dx}(\cos x) = -\sin x \)
▮▮▮▮⚝ \( \frac{d}{dx}(\tan x) = \sec^2 x = \frac{1}{\cos^2 x} \)
▮▮▮▮⚝ \( \frac{d}{dx}(\cot x) = -\csc^2 x = -\frac{1}{\sin^2 x} \)
▮▮▮▮⚝ \( \frac{d}{dx}(\sec x) = \sec x \tan x \)
▮▮▮▮⚝ \( \frac{d}{dx}(\csc x) = -\csc x \cot x \)
⑥ 反三角函数 (Inverse Trigonometric Functions):
▮▮▮▮⚝ \( \frac{d}{dx}(\arcsin x) = \frac{1}{\sqrt{1 - x^2}} \) ( \( |x| < 1 \) )
▮▮▮▮⚝ \( \frac{d}{dx}(\arccos x) = -\frac{1}{\sqrt{1 - x^2}} \) ( \( |x| < 1 \) )
▮▮▮▮⚝ \( \frac{d}{dx}(\arctan x) = \frac{1}{1 + x^2} \)
▮▮▮▮⚝ \( \frac{d}{dx}(\text{arccot } x) = -\frac{1}{1 + x^2} \)
这些基本导数公式可以通过导数的定义推导出来,是进行更复杂函数求导的基础。
4.2.2 导数的四则运算 (Arithmetic Operations of Derivatives)
利用导数的四则运算,我们可以求由基本初等函数经过加、减、乘、除运算得到的函数的导数。
设函数 \( u(x) \) 和 \( v(x) \) 在点 \( x \) 处可导,\( C \) 为常数。
① 常数倍法则 (Constant Multiple Rule):
\[ \frac{d}{dx}(C u(x)) = C \frac{d}{dx}(u(x)) = C u'(x) \]
② 加法法则 (Sum Rule):
\[ \frac{d}{dx}(u(x) + v(x)) = \frac{d}{dx}(u(x)) + \frac{d}{dx}(v(x)) = u'(x) + v'(x) \]
③ 减法法则 (Difference Rule):
\[ \frac{d}{dx}(u(x) - v(x)) = \frac{d}{dx}(u(x)) - \frac{d}{dx}(v(x)) = u'(x) - v'(x) \]
④ 乘法法则 (Product Rule) (Leibniz's rule):
\[ \frac{d}{dx}(u(x) v(x)) = u'(x) v(x) + u(x) v'(x) \]
⑤ 除法法则 (Quotient Rule) (当 \( v(x) \neq 0 \) 时):
\[ \frac{d}{dx}\left(\frac{u(x)}{v(x)}\right) = \frac{u'(x) v(x) - u(x) v'(x)}{[v(x)]^2} \]
例 4.2.1:求函数 \( f(x) = 3x^4 - 5\sin x + 2e^x - 7 \) 的导数。
解:利用常数倍法则、加减法法则以及基本函数的导数公式,
\[ \begin{aligned} f'(x) &= \frac{d}{dx}(3x^4 - 5\sin x + 2e^x - 7) \\ &= \frac{d}{dx}(3x^4) - \frac{d}{dx}(5\sin x) + \frac{d}{dx}(2e^x) - \frac{d}{dx}(7) \\ &= 3\frac{d}{dx}(x^4) - 5\frac{d}{dx}(\sin x) + 2\frac{d}{dx}(e^x) - 0 \\ &= 3(4x^3) - 5(\cos x) + 2(e^x) \\ &= 12x^3 - 5\cos x + 2e^x \end{aligned} \]
例 4.2.2:求函数 \( f(x) = x^2 \cos x \) 的导数。
解:利用乘法法则,设 \( u(x) = x^2 \),\( v(x) = \cos x \)。则 \( u'(x) = 2x \),\( v'(x) = -\sin x \)。
\[ \begin{aligned} f'(x) &= \frac{d}{dx}(x^2 \cos x) \\ &= u'(x) v(x) + u(x) v'(x) \\ &= (2x) (\cos x) + (x^2) (-\sin x) \\ &= 2x \cos x - x^2 \sin x \end{aligned} \]
例 4.2.3:求函数 \( f(x) = \frac{\sin x}{x} \) ( \( x \neq 0 \) ) 的导数。
解:利用除法法则,设 \( u(x) = \sin x \),\( v(x) = x \)。则 \( u'(x) = \cos x \),\( v'(x) = 1 \)。
\[ \begin{aligned} f'(x) &= \frac{d}{dx}\left(\frac{\sin x}{x}\right) \\ &= \frac{u'(x) v(x) - u(x) v'(x)}{[v(x)]^2} \\ &= \frac{(\cos x) (x) - (\sin x) (1)}{x^2} \\ &= \frac{x \cos x - \sin x}{x^2} \end{aligned} \]
4.2.3 链式法则 (Chain Rule)
链式法则 (chain rule) 是求复合函数 (composite function) 导数的重要法则。复合函数是由两个或多个函数复合而成的函数,例如 \( f(x) = \sin(x^2) \) 可以看作是由 \( u(x) = x^2 \) 和 \( g(u) = \sin u \) 复合而成,即 \( f(x) = g(u(x)) \)。
定理 4.2.1 (链式法则):设函数 \( u = g(x) \) 在点 \( x \) 处可导,函数 \( y = f(u) \) 在点 \( u = g(x) \) 处可导,则复合函数 \( y = f(g(x)) \) 在点 \( x \) 处可导,且其导数为:
\[ \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = f'(u) \cdot g'(x) = f'(g(x)) \cdot g'(x) \]
或者,如果记 \( y = f(u) \),\( u = g(x) \),则 \( \frac{d}{dx} f(g(x)) = f'(g(x)) \cdot g'(x) \)。
理解链式法则:链式法则可以理解为“层层求导,逐层相乘”。从外层函数开始,逐层向内求导,并将每层导数相乘。
例 4.2.4:求函数 \( f(x) = \sin(x^2) \) 的导数。
解:设 \( u = g(x) = x^2 \),\( y = f(u) = \sin u \)。则 \( \frac{du}{dx} = 2x \),\( \frac{dy}{du} = \cos u \)。根据链式法则,
\[ \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = (\cos u) \cdot (2x) = \cos(x^2) \cdot 2x = 2x \cos(x^2) \]
例 4.2.5:求函数 \( f(x) = e^{\cos x} \) 的导数。
解:设 \( u = g(x) = \cos x \),\( y = f(u) = e^u \)。则 \( \frac{du}{dx} = -\sin x \),\( \frac{dy}{du} = e^u \)。根据链式法则,
\[ \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = (e^u) \cdot (-\sin x) = e^{\cos x} \cdot (-\sin x) = -\sin x \cdot e^{\cos x} \]
例 4.2.6:求函数 \( f(x) = (\ln x)^3 \) 的导数。
解:设 \( u = g(x) = \ln x \),\( y = f(u) = u^3 \)。则 \( \frac{du}{dx} = \frac{1}{x} \),\( \frac{dy}{du} = 3u^2 \)。根据链式法则,
\[ \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = (3u^2) \cdot \left(\frac{1}{x}\right) = 3(\ln x)^2 \cdot \frac{1}{x} = \frac{3(\ln x)^2}{x} \]
链式法则是微分学中非常重要的工具,它使得我们可以处理各种复杂的复合函数求导问题。
4.3 微分中值定理 (Mean Value Theorems for Derivatives)
微分中值定理 (mean value theorems for derivatives) 是微分学中的一组核心定理,它们揭示了函数导数与函数值之间的重要关系,是连接局部性质(导数)与整体性质(函数值)的桥梁。微分中值定理主要包括 Rolle 定理、Lagrange 中值定理和 Cauchy 中值定理。
4.3.1 Rolle 定理 (Rolle's Theorem)
Rolle 定理 (Rolle's Theorem) 是微分中值定理的基础,它描述了在特定条件下,函数导数在区间内某一点必然取值为零。
定理 4.3.1 (Rolle 定理):如果函数 \( f \) 满足以下条件:
① 在闭区间 \( [a, b] \) 上连续 (continuous);
② 在开区间 \( (a, b) \) 内可导 (differentiable);
③ \( f(a) = f(b) \);
那么,在开区间 \( (a, b) \) 内至少存在一点 \( \xi \),使得 \( f'(\xi) = 0 \)。
几何解释 (Geometric Interpretation):如果连续曲线 \( y = f(x) \) 的端点高度相同(\( f(a) = f(b) \)),且曲线光滑(在 \( (a, b) \) 内可导),那么曲线在 \( (a, b) \) 内至少存在一点,该点处的切线是水平的(斜率为 0,即 \( f'(\xi) = 0 \))。
证明思路 (Proof Idea):
考虑函数 \( f \) 在 \( [a, b] \) 上的最大值和最小值。由于 \( f \) 在闭区间上连续,根据最值定理,\( f \) 在 \( [a, b] \) 上必能取得最大值和最小值。
⚝ 情况一:如果 \( f \) 在 \( [a, b] \) 上是常数函数,即 \( f(x) = C \) (常数),则 \( f'(x) = 0 \) 对所有 \( x \in (a, b) \) 成立,定理显然成立。
⚝ 情况二:如果 \( f \) 不是常数函数,由于 \( f(a) = f(b) \),则 \( f \) 在 \( (a, b) \) 内至少能取得最大值或最小值之一,设在点 \( \xi \in (a, b) \) 取得极值(最大值或最小值)。由于 \( f \) 在 \( (a, b) \) 内可导,根据费马定理(内点极值定理),\( f'(\xi) = 0 \)。
例 4.3.1:验证函数 \( f(x) = x^2 - 3x + 2 \) 在区间 \( [1, 2] \) 上满足 Rolle 定理的条件,并求出满足定理结论的点 \( \xi \)。
解:
① \( f(x) = x^2 - 3x + 2 \) 是多项式函数,在 \( [1, 2] \) 上连续。
② \( f'(x) = 2x - 3 \),在 \( (1, 2) \) 内可导。
③ \( f(1) = 1^2 - 3(1) + 2 = 0 \),\( f(2) = 2^2 - 3(2) + 2 = 0 \),所以 \( f(1) = f(2) \)。
函数 \( f(x) \) 满足 Rolle 定理的三个条件。根据 Rolle 定理,存在 \( \xi \in (1, 2) \) 使得 \( f'(\xi) = 0 \)。
令 \( f'(\xi) = 2\xi - 3 = 0 \),解得 \( \xi = \frac{3}{2} \)。显然 \( \xi = \frac{3}{2} \in (1, 2) \)。
4.3.2 Lagrange 中值定理 (Lagrange's Mean Value Theorem)
Lagrange 中值定理 (Lagrange's Mean Value Theorem) 是微分学中最基本、最重要的定理之一,它将区间端点函数值的差与区间内某点的导数值联系起来。Lagrange 中值定理可以看作是 Rolle 定理的推广。
定理 4.3.2 (Lagrange 中值定理):如果函数 \( f \) 满足以下条件:
① 在闭区间 \( [a, b] \) 上连续 (continuous);
② 在开区间 \( (a, b) \) 内可导 (differentiable);
那么,在开区间 \( (a, b) \) 内至少存在一点 \( \xi \),使得
\[ f'( \xi ) = \frac{f(b) - f(a)}{b - a} \]
或等价地,\( f(b) - f(a) = f'(\xi)(b - a) \)。
几何解释 (Geometric Interpretation):在连续曲线 \( y = f(x) \) 上,至少存在一点 \( (\xi, f(\xi)) \),使得该点处的切线斜率 \( f'(\xi) \) 等于连接曲线两端点 \( (a, f(a)) \) 和 \( (b, f(b)) \) 的弦的斜率 \( \frac{f(b) - f(a)}{b - a} \)。也就是说,曲线上至少存在一点切线平行于弦 \( AB \)。
证明思路 (Proof Idea):
构造辅助函数,将 Lagrange 中值定理转化为 Rolle 定理。考虑连接 \( (a, f(a)) \) 和 \( (b, f(b)) \) 的弦的直线方程:
\[ y - f(a) = \frac{f(b) - f(a)}{b - a} (x - a) \]
即 \( y = f(a) + \frac{f(b) - f(a)}{b - a} (x - a) \)。
定义辅助函数 \( F(x) \) 为函数 \( f(x) \) 与弦的纵坐标之差:
\[ F(x) = f(x) - \left[ f(a) + \frac{f(b) - f(a)}{b - a} (x - a) \right] \]
验证 \( F(x) \) 满足 Rolle 定理的条件:
① \( F(x) \) 在 \( [a, b] \) 上连续(因为 \( f(x) \) 连续,线性函数也连续)。
② \( F(x) \) 在 \( (a, b) \) 内可导(因为 \( f(x) \) 可导,线性函数也可导)。
③ \( F(a) = f(a) - [f(a) + 0] = 0 \)。
\( F(b) = f(b) - \left[ f(a) + \frac{f(b) - f(a)}{b - a} (b - a) \right] = f(b) - [f(a) + f(b) - f(a)] = 0 \)。
所以 \( F(a) = F(b) = 0 \)。
根据 Rolle 定理,存在 \( \xi \in (a, b) \) 使得 \( F'(\xi) = 0 \)。
求 \( F'(x) \):
\[ F'(x) = f'(x) - \frac{f(b) - f(a)}{b - a} \]
令 \( F'(\xi) = 0 \),则 \( f'(\xi) - \frac{f(b) - f(a)}{b - a} = 0 \),即 \( f'(\xi) = \frac{f(b) - f(a)}{b - a} \)。
例 4.3.2:验证函数 \( f(x) = x^3 \) 在区间 \( [0, 2] \) 上满足 Lagrange 中值定理的条件,并求出满足定理结论的点 \( \xi \)。
解:
① \( f(x) = x^3 \) 是多项式函数,在 \( [0, 2] \) 上连续。
② \( f'(x) = 3x^2 \),在 \( (0, 2) \) 内可导。
函数 \( f(x) \) 满足 Lagrange 中值定理的两个条件。根据 Lagrange 中值定理,存在 \( \xi \in (0, 2) \) 使得 \( f'(\xi) = \frac{f(2) - f(0)}{2 - 0} \)。
计算 \( \frac{f(2) - f(0)}{2 - 0} = \frac{2^3 - 0^3}{2 - 0} = \frac{8}{2} = 4 \)。
令 \( f'(\xi) = 3\xi^2 = 4 \),解得 \( \xi^2 = \frac{4}{3} \),\( \xi = \pm \frac{2}{\sqrt{3}} = \pm \frac{2\sqrt{3}}{3} \)。由于 \( \xi \in (0, 2) \),取正值 \( \xi = \frac{2\sqrt{3}}{3} \approx \frac{2 \times 1.732}{3} \approx 1.155 \)。显然 \( \xi = \frac{2\sqrt{3}}{3} \in (0, 2) \)。
4.3.3 Cauchy 中值定理 (Cauchy's Mean Value Theorem)
Cauchy 中值定理 (Cauchy's Mean Value Theorem) 是 Lagrange 中值定理的推广形式,它涉及两个函数,描述了两个函数导数之比与函数值之比的关系。
定理 4.3.3 (Cauchy 中值定理):如果函数 \( f \) 和 \( g \) 满足以下条件:
① 在闭区间 \( [a, b] \) 上连续 (continuous);
② 在开区间 \( (a, b) \) 内可导 (differentiable);
③ 对任意 \( x \in (a, b) \),\( g'(x) \neq 0 \);
那么,在开区间 \( (a, b) \) 内至少存在一点 \( \xi \),使得
\[ \frac{f'(\xi)}{g'(\xi)} = \frac{f(b) - f(a)}{g(b) - g(a)} \]
注意:条件 ③ \( g'(x) \neq 0 \) 保证了 \( g(b) \neq g(a) \),从而分母 \( g(b) - g(a) \neq 0 \)。如果取 \( g(x) = x \),则 \( g'(x) = 1 \),Cauchy 中值定理就退化为 Lagrange 中值定理。
证明思路 (Proof Idea):
类似于 Lagrange 中值定理的证明,构造辅助函数,将 Cauchy 中值定理转化为 Rolle 定理。定义辅助函数 \( H(x) \) 为:
\[ H(x) = f(x) [g(b) - g(a)] - g(x) [f(b) - f(a)] \]
验证 \( H(x) \) 满足 Rolle 定理的条件:
① \( H(x) \) 在 \( [a, b] \) 上连续(因为 \( f(x) \) 和 \( g(x) \) 连续)。
② \( H(x) \) 在 \( (a, b) \) 内可导(因为 \( f(x) \) 和 \( g(x) \) 可导)。
③ \( H(a) = f(a) [g(b) - g(a)] - g(a) [f(b) - f(a)] = f(a)g(b) - f(a)g(a) - g(a)f(b) + g(a)f(a) = f(a)g(b) - g(a)f(b) \)。
\( H(b) = f(b) [g(b) - g(a)] - g(b) [f(b) - f(a)] = f(b)g(b) - f(b)g(a) - g(b)f(b) + g(b)f(a) = -f(b)g(a) + g(b)f(a) = f(a)g(b) - g(a)f(b) \)。
所以 \( H(a) = H(b) \)。
根据 Rolle 定理,存在 \( \xi \in (a, b) \) 使得 \( H'(\xi) = 0 \)。
求 \( H'(x) \):
\[ H'(x) = f'(x) [g(b) - g(a)] - g'(x) [f(b) - f(a)] \]
令 \( H'(\xi) = 0 \),则 \( f'(\xi) [g(b) - g(a)] - g'(\xi) [f(b) - f(a)] = 0 \)。由于 \( g'(x) \neq 0 \) 在 \( (a, b) \) 内成立,可以证明 \( g(b) \neq g(a) \)。因此 \( g(b) - g(a) \neq 0 \)。将上式移项并除以 \( g'(\xi) [g(b) - g(a)] \) (由于 \( g'(\xi) \neq 0 \) 和 \( g(b) - g(a) \neq 0 \),除数不为零),得到:
\[ \frac{f'(\xi)}{g'(\xi)} = \frac{f(b) - f(a)}{g(b) - g(a)} \]
例 4.3.3:验证函数 \( f(x) = \sin x \) 和 \( g(x) = \cos x \) 在区间 \( [0, \frac{\pi}{2}] \) 上满足 Cauchy 中值定理的条件,并求出满足定理结论的点 \( \xi \)。
解:
① \( f(x) = \sin x \) 和 \( g(x) = \cos x \) 在 \( [0, \frac{\pi}{2}] \) 上连续。
② \( f'(x) = \cos x \) 和 \( g'(x) = -\sin x \) 在 \( (0, \frac{\pi}{2}] \) 内可导。
③ 在 \( (0, \frac{\pi}{2}) \) 内,\( g'(x) = -\sin x < 0 \),所以 \( g'(x) \neq 0 \)。
函数 \( f(x) \) 和 \( g(x) \) 满足 Cauchy 中值定理的三个条件。根据 Cauchy 中值定理,存在 \( \xi \in (0, \frac{\pi}{2}) \) 使得 \( \frac{f'(\xi)}{g'(\xi)} = \frac{f(\frac{\pi}{2}) - f(0)}{g(\frac{\pi}{2}) - g(0)} \)。
计算 \( \frac{f(\frac{\pi}{2}) - f(0)}{g(\frac{\pi}{2}) - g(0)} = \frac{\sin(\frac{\pi}{2}) - \sin(0)}{\cos(\frac{\pi}{2}) - \cos(0)} = \frac{1 - 0}{0 - 1} = -1 \)。
计算 \( \frac{f'(\xi)}{g'(\xi)} = \frac{\cos \xi}{-\sin \xi} = -\cot \xi \)。
令 \( -\cot \xi = -1 \),则 \( \cot \xi = 1 \)。在 \( (0, \frac{\pi}{2}) \) 内,解得 \( \xi = \frac{\pi}{4} \)。显然 \( \xi = \frac{\pi}{4} \in (0, \frac{\pi}{2}) \)。
4.4 Taylor 展开 (Taylor Expansion)
Taylor 展开 (Taylor expansion) 是利用函数在某一点的导数值来近似表示函数在该点附近值的有力工具。它将一个复杂函数表示成一个多项式加上一个余项的形式,多项式部分称为 Taylor 多项式 (Taylor polynomial),余项描述了近似的误差。Taylor 展开在数值计算、近似分析等领域有广泛应用。
4.4.1 Taylor 公式 (Taylor's Formula)
Taylor 公式 (Taylor's formula) 给出了函数在某一点的 Taylor 展开的具体形式。
定理 4.4.1 (Taylor 公式 - Lagrange 余项):设函数 \( f \) 在包含 \( x_0 \) 的开区间 \( I \) 内具有直到 \( (n+1) \) 阶的导数。对于任意 \( x \in I \),存在 \( \xi \) 介于 \( x_0 \) 与 \( x \) 之间,使得
\[ f(x) = f(x_0) + f'(x_0)(x - x_0) + \frac{f''(x_0)}{2!}(x - x_0)^2 + \cdots + \frac{f^{(n)}(x_0)}{n!}(x - x_0)^n + R_n(x) \]
其中,\( R_n(x) \) 称为 Lagrange 余项 (Lagrange remainder),表示为:
\[ R_n(x) = \frac{f^{(n+1)}(\xi)}{(n+1)!}(x - x_0)^{n+1} \]
上述公式称为函数 \( f(x) \) 在点 \( x_0 \) 处的 n 阶 Taylor 展开式 (n-th order Taylor expansion),多项式
\[ P_n(x) = f(x_0) + f'(x_0)(x - x_0) + \frac{f''(x_0)}{2!}(x - x_0)^2 + \cdots + \frac{f^{(n)}(x_0)}{n!}(x - x_0)^n \]
称为 n 阶 Taylor 多项式 (n-th order Taylor polynomial)。
特殊情况:Maclaurin 展开 (Maclaurin Expansion):当 \( x_0 = 0 \) 时,Taylor 展开式变为 Maclaurin 展开式 (Maclaurin expansion):
\[ f(x) = f(0) + f'(0)x + \frac{f''(0)}{2!}x^2 + \cdots + \frac{f^{(n)}(0)}{n!}x^n + R_n(x) \]
其中,Lagrange 余项为 \( R_n(x) = \frac{f^{(n+1)}(\xi)}{(n+1)!}x^{n+1} \),\( \xi \) 介于 \( 0 \) 与 \( x \) 之间。
常用函数的 Maclaurin 展开式:
① \( e^x = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \cdots + \frac{x^n}{n!} + \frac{e^\xi}{(n+1)!}x^{n+1} \)
② \( \sin x = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \cdots + (-1)^k \frac{x^{2k+1}}{(2k+1)!} + \cdots \)
③ \( \cos x = 1 - \frac{x^2}{2!} + \frac{x^4}{4!} - \cdots + (-1)^k \frac{x^{2k}}{(2k)!} + \cdots \)
④ \( \ln(1 + x) = x - \frac{x^2}{2} + \frac{x^3}{3} - \cdots + (-1)^{n-1} \frac{x^n}{n} + \cdots \)
⑤ \( (1 + x)^\alpha = 1 + \alpha x + \frac{\alpha(\alpha - 1)}{2!}x^2 + \cdots + \frac{\alpha(\alpha - 1)\cdots(\alpha - n + 1)}{n!}x^n + \cdots \) (二项展开式)
4.4.2 Taylor 展开的应用 (Applications of Taylor Expansion)
Taylor 展开在数学分析和应用数学中具有广泛的应用,主要包括以下几个方面:
① 函数近似计算 (Function Approximation):利用 Taylor 多项式 \( P_n(x) \) 近似计算函数值 \( f(x) \)。当 \( x \) 接近 \( x_0 \) 时,\( P_n(x) \) 是 \( f(x) \) 的良好近似。阶数 \( n \) 越高,近似程度通常越高。
例 4.4.1:利用 Maclaurin 展开式近似计算 \( e^{0.1} \),精确到小数点后三位。
解:取 \( e^x \) 的 Maclaurin 展开式的前几项:
\( e^x \approx 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \cdots + \frac{x^n}{n!} \)。
当 \( x = 0.1 \) 时,
\( e^{0.1} \approx 1 + 0.1 + \frac{(0.1)^2}{2!} + \frac{(0.1)^3}{3!} + \cdots \)
\( e^{0.1} \approx 1 + 0.1 + \frac{0.01}{2} + \frac{0.001}{6} + \cdots = 1 + 0.1 + 0.005 + 0.000166\cdots = 1.105166\cdots \)
取前三项和 \( 1 + 0.1 + 0.005 = 1.105 \)。
取前四项和 \( 1 + 0.1 + 0.005 + 0.000166 = 1.105166 \)。
要精确到小数点后三位,需要估计余项 \( R_n(0.1) = \frac{e^\xi}{(n+1)!}(0.1)^{n+1} \) 的大小。由于 \( \xi \) 介于 \( 0 \) 和 \( 0.1 \) 之间,\( e^\xi < e^{0.1} < e < 3 \)。
当 \( n = 2 \) 时,\( |R_2(0.1)| = \left| \frac{e^\xi}{3!}(0.1)^3 \right| < \frac{3}{6} (0.001) = 0.0005 \)。
因此,取前三项 \( 1 + 0.1 + \frac{(0.1)^2}{2!} = 1.105 \) 即可保证精确到小数点后三位。所以 \( e^{0.1} \approx 1.105 \)。
② 误差估计 (Error Estimation):利用 Lagrange 余项 \( R_n(x) \) 估计 Taylor 近似的误差范围。通过控制余项的大小,可以确定近似的精度。
③ 求极限 (Limit Calculation):对于一些复杂极限,利用 Taylor 展开可以将函数化为多项式形式,从而简化极限计算。
例 4.4.2:求极限 \( \lim_{x \to 0} \frac{\sin x - x}{x^3} \)。
解:利用 \( \sin x \) 的 Maclaurin 展开式:\( \sin x = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \cdots \)。
\[ \begin{aligned} \lim_{x \to 0} \frac{\sin x - x}{x^3} &= \lim_{x \to 0} \frac{(x - \frac{x^3}{3!} + \frac{x^5}{5!} - \cdots) - x}{x^3} \\ &= \lim_{x \to 0} \frac{-\frac{x^3}{3!} + \frac{x^5}{5!} - \cdots}{x^3} \\ &= \lim_{x \to 0} \left( -\frac{1}{3!} + \frac{x^2}{5!} - \cdots \right) \\ &= -\frac{1}{3!} = -\frac{1}{6} \end{aligned} \]
④ 函数性质分析 (Function Property Analysis):利用 Taylor 展开式可以分析函数在某一点附近的性质,例如极值、拐点等。
⑤ 数值计算方法 (Numerical Methods):Taylor 展开是许多数值计算方法的基础,例如数值微分、数值积分、微分方程数值解等。
Taylor 展开是微分学的重要组成部分,它不仅提供了函数近似的有效方法,也为深入理解函数性质和解决实际问题提供了强大的工具。
5. chapter 5: 积分学:面积与累积的计算 (Integral Calculus: Calculation of Area and Accumulation)
5.1 Riemann 积分 (Riemann Integral)
5.1.1 Riemann 和与定积分的定义 (Riemann Sum and Definition of Definite Integral)
在微积分学中,积分 (Integral) 是一个核心概念,它源于解决诸如计算曲线围成的面积、不规则形状的体积等几何问题,以及物理学中计算变力做功、流体流量等累积量的问题。Riemann 积分 (Riemann Integral) 是积分理论的基石,它通过逼近的思想,将连续函数的积分定义为一系列矩形面积之和的极限。
为了精确地定义 Riemann 积分,我们首先需要引入一些基本概念。
定义 5.1.1.1 (区间的分割 (Partition of an Interval))
设 \( [a, b] \) 是一个闭区间。\( [a, b] \) 的一个分割 \( P \) 是指在此区间中选取有限个点 \( x_0, x_1, x_2, \ldots, x_n \),使得
\[ a = x_0 < x_1 < x_2 < \cdots < x_n = b \]
这些点将区间 \( [a, b] \) 分成 \( n \) 个子区间 \( [x_{i-1}, x_i] \),其中 \( i = 1, 2, \ldots, n \)。我们记 \( \Delta x_i = x_i - x_{i-1} \) 为第 \( i \) 个子区间的长度。
定义 5.1.1.2 (Riemann 和 (Riemann Sum))
设 \( f(x) \) 是定义在闭区间 \( [a, b] \) 上的有界函数,\( P = \{x_0, x_1, \ldots, x_n\} \) 是 \( [a, b] \) 的一个分割。在每个子区间 \( [x_{i-1}, x_i] \) 中任取一点 \( \xi_i \),作乘积 \( f(\xi_i) \Delta x_i \)。和式
\[ S(P, f, \xi) = \sum_{i=1}^{n} f(\xi_i) \Delta x_i \]
称为函数 \( f(x) \) 关于分割 \( P \) 和一组中间点 \( \xi = \{\xi_1, \xi_2, \ldots, \xi_n\} \) 的 Riemann 和。
Riemann 和的几何意义可以用矩形面积的和来理解。在每个子区间 \( [x_{i-1}, x_i] \) 上,我们以 \( \Delta x_i \) 为底,\( f(\xi_i) \) 为高作矩形。当 \( f(\xi_i) > 0 \) 时,\( f(\xi_i) \Delta x_i \) 表示第 \( i \) 个矩形的面积;当 \( f(\xi_i) < 0 \) 时,\( f(\xi_i) \Delta x_i \) 表示第 \( i \) 个矩形面积的负值。Riemann 和就是这些矩形面积(或面积的负值)的代数和。
为了定义定积分,我们需要考虑分割的精细程度。我们用 \( \|P\| = \max_{1 \le i \le n} \Delta x_i \) 表示分割 \( P \) 的范数 (norm) 或 宽度 (mesh),它表示所有子区间长度的最大值。\( \|P\| \) 越小,分割就越精细。
定义 5.1.1.3 (定积分 (Definite Integral))
设 \( f(x) \) 是定义在闭区间 \( [a, b] \) 上的有界函数。若存在一个确定的数 \( I \),使得对于任意给定的 \( \epsilon > 0 \),总存在 \( \delta > 0 \),当分割 \( P \) 的范数 \( \|P\| < \delta \) 时,Riemann 和 \( S(P, f, \xi) \) 与 \( I \) 的差的绝对值小于 \( \epsilon \),即
\[ |S(P, f, \xi) - I| < \epsilon \]
其中 \( \xi_i \) 是在子区间 \( [x_{i-1}, x_i] \) 上任意选取的点,则称函数 \( f(x) \) 在区间 \( [a, b] \) 上 Riemann 可积 (Riemann integrable),数 \( I \) 称为 \( f(x) \) 在 \( [a, b] \) 上的 定积分 (definite integral),记作 \( \int_a^b f(x) \, dx \)。其中 \( a \) 称为 积分下限 (lower limit of integration),\( b \) 称为 积分上限 (upper limit of integration),\( f(x) \) 称为 被积函数 (integrand),\( x \) 称为 积分变量 (variable of integration),\( [a, b] \) 称为 积分区间 (interval of integration)。
定积分 \( \int_a^b f(x) \, dx \) 的几何意义是曲线 \( y = f(x) \)、直线 \( x = a \)、\( x = b \) 以及 \( x \) 轴所围成的曲边梯形的代数面积。当函数值 \( f(x) \ge 0 \) 时,定积分表示曲边梯形的面积;当函数值 \( f(x) \le 0 \) 时,定积分表示曲边梯形面积的负值;当函数值 \( f(x) \) 有正有负时,定积分表示 \( x \) 轴上方图形面积减去 \( x \) 轴下方图形面积的差。
注意:
① 定积分的值仅依赖于被积函数 \( f(x) \) 和积分区间 \( [a, b] \),而与积分变量的记号无关。例如,\( \int_a^b f(x) \, dx = \int_a^b f(t) \, dt = \int_a^b f(u) \, du \)。
② 当 \( a = b \) 时,定义 \( \int_a^a f(x) \, dx = 0 \)。
③ 当 \( a > b \) 时,定义 \( \int_a^b f(x) \, dx = - \int_b^a f(x) \, dx \)。
5.1.2 可积条件 (Integrability Conditions)
并非所有有界函数都是 Riemann 可积的。那么,什么样的函数是 Riemann 可积的呢?我们需要讨论 Riemann 可积的条件。为了研究可积性,我们引入 上和 (upper sum) 和 下和 (lower sum) 的概念。
对于有界函数 \( f(x) \) 和区间 \( [a, b] \) 的一个分割 \( P = \{x_0, x_1, \ldots, x_n\} \),记
\[ M_i = \sup_{x \in [x_{i-1}, x_i]} f(x), \quad m_i = \inf_{x \in [x_{i-1}, x_i]} f(x) \]
分别为函数 \( f(x) \) 在子区间 \( [x_{i-1}, x_i] \) 上的 上确界 (supremum) 和 下确界 (infimum)。
定义 5.1.2.1 (上和与下和 (Upper Sum and Lower Sum))
和式
\[ U(P, f) = \sum_{i=1}^{n} M_i \Delta x_i \]
称为函数 \( f(x) \) 关于分割 \( P \) 的 上和 (upper sum)。
和式
\[ L(P, f) = \sum_{i=1}^{n} m_i \Delta x_i \]
称为函数 \( f(x) \) 关于分割 \( P \) 的 下和 (lower sum)。
显然,对于任意分割 \( P \) 和任意中间点集 \( \xi \),都有
\[ L(P, f) \le S(P, f, \xi) \le U(P, f) \]
上和 \( U(P, f) \) 可以看作是用外接矩形面积之和逼近曲边梯形面积,下和 \( L(P, f) \) 可以看作是用内接矩形面积之和逼近曲边梯形面积。
当分割 \( P \) 加细时,上和趋于减少,下和趋于增加。为了更精确地描述这个性质,我们引入 Darbox 上积分 (Darboux upper integral) 和 Darbox 下积分 (Darboux lower integral) 的概念。
定义 5.1.2.2 (Darbox 上积分与下积分 (Darboux Upper and Lower Integrals))
函数 \( f(x) \) 在 \( [a, b] \) 上的 Darbox 上积分 (Darboux upper integral) 定义为
\[ \overline{\int_a^b} f(x) \, dx = \inf_P \{U(P, f)\} \]
其中下确界是对 \( [a, b] \) 的所有分割 \( P \) 取的。
函数 \( f(x) \) 在 \( [a, b] \) 上的 Darbox 下积分 (Darboux lower integral) 定义为
\[ \underline{\int_a^b} f(x) \, dx = \sup_P \{L(P, f)\} \]
其中上确界是对 \( [a, b] \) 的所有分割 \( P \) 取的。
定理 5.1.2.1 (Riemann 可积的充要条件 (Necessary and Sufficient Condition for Riemann Integrability))
有界函数 \( f(x) \) 在 \( [a, b] \) 上 Riemann 可积的充要条件是:对于任意给定的 \( \epsilon > 0 \),存在 \( [a, b] \) 的分割 \( P \),使得
\[ U(P, f) - L(P, f) < \epsilon \]
或者等价地,函数 \( f(x) \) 在 \( [a, b] \) 上 Riemann 可积的充要条件是
\[ \overline{\int_a^b} f(x) \, dx = \underline{\int_a^b} f(x) \, dx \]
且定积分的值为
\[ \int_a^b f(x) \, dx = \overline{\int_a^b} f(x) \, dx = \underline{\int_a^b} f(x) \, dx \]
这个定理给出了判断函数 Riemann 可积性的理论依据。从直观上看,一个函数 Riemann 可积,意味着我们可以通过不断加细分割,使得上和与下和之间的差距任意小,即用外接矩形和内接矩形逼近曲边梯形面积的误差可以任意小。
定理 5.1.2.2 (Riemann 可积的充分条件 (Sufficient Conditions for Riemann Integrability))
以下两类函数在闭区间 \( [a, b] \) 上 Riemann 可积:
① 连续函数 (Continuous function):若函数 \( f(x) \) 在 \( [a, b] \) 上连续,则 \( f(x) \) 在 \( [a, b] \) 上 Riemann 可积。
② 单调函数 (Monotonic function):若函数 \( f(x) \) 在 \( [a, b] \) 上单调,则 \( f(x) \) 在 \( [a, b] \) 上 Riemann 可积。
③ 分段连续函数 (Piecewise continuous function):若函数 \( f(x) \) 在 \( [a, b] \) 上分段连续(即在 \( [a, b] \) 上只有有限个间断点,且在每个连续区间上连续),则 \( f(x) \) 在 \( [a, b] \) 上 Riemann 可积。
这些充分条件在实际应用中非常重要,它们保证了我们常见的大量函数都是 Riemann 可积的。例如,多项式函数、三角函数、指数函数、对数函数以及它们的有限次四则运算和复合得到的函数,在它们的定义区间内,只要是闭区间,通常都是 Riemann 可积的。
5.2 积分的性质 (Properties of Integrals)
5.2.1 线性性、单调性、区间可加性 (Linearity, Monotonicity, Interval Additivity)
Riemann 积分具有许多重要的性质,这些性质在积分的计算和应用中非常有用。
性质 5.2.1.1 (线性性 (Linearity))
设函数 \( f(x) \) 和 \( g(x) \) 在 \( [a, b] \) 上 Riemann 可积,\( \alpha \) 和 \( \beta \) 为常数,则 \( \alpha f(x) + \beta g(x) \) 在 \( [a, b] \) 上也 Riemann 可积,且
\[ \int_a^b [\alpha f(x) + \beta g(x)] \, dx = \alpha \int_a^b f(x) \, dx + \beta \int_a^b g(x) \, dx \]
证明思路: 利用 Riemann 和的定义和极限的线性性质即可证明。
线性性表明,积分运算对于被积函数的线性组合是线性的。这个性质使得我们可以将复杂的积分分解为简单积分的线性组合来计算。
性质 5.2.1.2 (单调性 (Monotonicity))
设函数 \( f(x) \) 和 \( g(x) \) 在 \( [a, b] \) 上 Riemann 可积。
① 若在 \( [a, b] \) 上 \( f(x) \ge 0 \),则 \( \int_a^b f(x) \, dx \ge 0 \)。
② 若在 \( [a, b] \) 上 \( f(x) \le g(x) \),则 \( \int_a^b f(x) \, dx \le \int_a^b g(x) \, dx \)。
证明思路: 利用 Riemann 和的定义和不等式的性质即可证明。
单调性表明,积分运算保持函数的大小关系。如果一个函数非负,则其积分非负;如果一个函数小于等于另一个函数,则其积分也小于等于另一个函数的积分。
性质 5.2.1.3 (区间可加性 (Interval Additivity))
设函数 \( f(x) \) 在包含 \( a, b, c \) 的区间上 Riemann 可积,则对于 \( a, b, c \) 的任意排列次序,都有
\[ \int_a^b f(x) \, dx = \int_a^c f(x) \, dx + \int_c^b f(x) \, dx \]
特别地,当 \( a < c < b \) 时,有
\[ \int_a^b f(x) \, dx = \int_a^c f(x) \, dx + \int_c^b f(x) \, dx \]
证明思路: 利用 Riemann 和的定义,将区间 \( [a, b] \) 的分割点包含 \( c \) 的情况进行讨论。
区间可加性表明,积分区间可以分割,总区间上的积分等于各子区间上的积分之和。这个性质在分段函数积分和变限积分中非常重要。
性质 5.2.1.4 (绝对值积分不等式 (Integral Inequality for Absolute Value))
设函数 \( f(x) \) 在 \( [a, b] \) 上 Riemann 可积,则 \( |f(x)| \) 在 \( [a, b] \) 上也 Riemann 可积,且
\[ \left| \int_a^b f(x) \, dx \right| \le \int_a^b |f(x)| \, dx \]
证明思路: 利用 \( -|f(x)| \le f(x) \le |f(x)| \) 和积分的单调性即可证明。
绝对值积分不等式给出了积分绝对值的上界,它在估计积分值时非常有用。
5.2.2 积分中值定理 (Mean Value Theorem for Integrals)
积分中值定理是连接积分值与函数值的重要桥梁,它类似于微分中值定理在微分学中的作用。
定理 5.2.2.1 (积分第一中值定理 (First Mean Value Theorem for Integrals))
设函数 \( f(x) \) 在 \( [a, b] \) 上连续,\( g(x) \) 在 \( [a, b] \) 上 Riemann 可积且不变号(即在 \( [a, b] \) 上 \( g(x) \ge 0 \) 或 \( g(x) \le 0 \))。则存在 \( \xi \in [a, b] \),使得
\[ \int_a^b f(x) g(x) \, dx = f(\xi) \int_a^b g(x) \, dx \]
特别地,当 \( g(x) \equiv 1 \) 时,存在 \( \xi \in [a, b] \),使得
\[ \int_a^b f(x) \, dx = f(\xi) (b - a) \]
或者
\[ f(\xi) = \frac{1}{b - a} \int_a^b f(x) \, dx \]
称 \( \frac{1}{b - a} \int_a^b f(x) \, dx \) 为函数 \( f(x) \) 在 \( [a, b] \) 上的 积分平均值 (integral average value)。
证明思路: 利用连续函数的最值定理和积分的单调性,以及介值定理进行证明。
积分第一中值定理表明,连续函数 \( f(x) \) 在 \( [a, b] \) 上的积分,等于某个介于 \( f(x) \) 在 \( [a, b] \) 上的最小值和最大值之间的值 \( f(\xi) \) 与区间长度 \( (b - a) \) 的乘积。几何意义是,曲边梯形的面积等于以区间 \( [a, b] \) 为底,以 \( f(\xi) \) 为高的矩形面积。
定理 5.2.2.2 (积分第二中值定理 (Second Mean Value Theorem for Integrals))
设函数 \( f(x) \) 在 \( [a, b] \) 上单调,\( g(x) \) 在 \( [a, b] \) 上 Riemann 可积。
① 若 \( f(x) \) 单调递减且非负,则存在 \( \xi \in [a, b] \),使得
\[ \int_a^b f(x) g(x) \, dx = f(a) \int_a^\xi g(x) \, dx \]
② 若 \( f(x) \) 单调递增且非负,则存在 \( \xi \in [a, b] \),使得
\[ \int_a^b f(x) g(x) \, dx = f(b) \int_\xi^b g(x) \, dx \]
还有其他形式的积分第二中值定理,例如,若 \( f(x) \) 单调,\( g(x) \) Riemann 可积,则存在 \( \xi \in [a, b] \),使得
\[ \int_a^b f(x) g(x) \, dx = f(a) \int_a^\xi g(x) \, dx + f(b) \int_\xi^b g(x) \, dx \]
积分第二中值定理在某些特殊积分的估计和计算中非常有用,尤其是在处理被积函数中含有单调函数因子的情况。
5.3 微积分基本定理 (Fundamental Theorem of Calculus)
5.3.1 原函数与不定积分 (Antiderivative and Indefinite Integral)
微积分基本定理是微分学和积分学之间的桥梁,它揭示了微分和积分互为逆运算的本质联系。为了理解微积分基本定理,我们首先需要引入原函数和不定积分的概念。
定义 5.3.1.1 (原函数 (Antiderivative))
设函数 \( f(x) \) 定义在区间 \( I \) 上。如果存在函数 \( F(x) \),使得对于 \( I \) 内的任意点 \( x \),都有
\[ F'(x) = f(x) \]
则称 \( F(x) \) 为 \( f(x) \) 在区间 \( I \) 上的一个 原函数 (antiderivative) 或 不定积分 (indefinite integral)。
若 \( F(x) \) 是 \( f(x) \) 的一个原函数,则 \( F(x) + C \) (其中 \( C \) 为任意常数) 也是 \( f(x) \) 的原函数。反之,若 \( F_1(x) \) 和 \( F_2(x) \) 都是 \( f(x) \) 的原函数,则 \( F_1(x) - F_2(x) \) 为常数。因此,如果函数 \( f(x) \) 存在原函数,则它有无穷多个原函数,它们之间只差一个常数。
记号: 函数 \( f(x) \) 的不定积分记作 \( \int f(x) \, dx \)。因此,若 \( F'(x) = f(x) \),则
\[ \int f(x) \, dx = F(x) + C \]
其中 \( C \) 为 积分常数 (constant of integration)。
基本积分公式: 通过反向使用求导公式,我们可以得到一些基本函数的不定积分公式,例如:
① \( \int x^\mu \, dx = \frac{x^{\mu+1}}{\mu+1} + C \) \( (\mu \ne -1) \)
② \( \int \frac{1}{x} \, dx = \ln|x| + C \)
③ \( \int e^x \, dx = e^x + C \)
④ \( \int \sin x \, dx = -\cos x + C \)
⑤ \( \int \cos x \, dx = \sin x + C \)
... (更多基本积分公式)
5.3.2 微积分基本定理 (Fundamental Theorem of Calculus)
微积分基本定理包含两个部分,通常称为 微积分基本定理第一部分 (Fundamental Theorem of Calculus, Part 1) 和 微积分基本定理第二部分 (Fundamental Theorem of Calculus, Part 2)。
定理 5.3.2.1 (微积分基本定理第一部分 - 变上限积分函数求导 (Fundamental Theorem of Calculus, Part 1 - Derivative of Indefinite Integral))
设函数 \( f(x) \) 在区间 \( [a, b] \) 上连续,定义 变上限积分函数 (indefinite integral function)
\[ \Phi(x) = \int_a^x f(t) \, dt, \quad x \in [a, b] \]
则 \( \Phi(x) \) 在 \( [a, b] \) 上可导,且对于任意 \( x \in [a, b] \),有
\[ \Phi'(x) = \frac{d}{dx} \int_a^x f(t) \, dt = f(x) \]
证明思路: 利用导数的定义和积分中值定理进行证明。
微积分基本定理第一部分表明,连续函数 \( f(x) \) 的变上限积分函数 \( \Phi(x) \) 是 \( f(x) \) 的一个原函数。换句话说,对积分求导,得到被积函数本身。这揭示了积分运算是微分运算的逆运算之一。
定理 5.3.2.2 (微积分基本定理第二部分 - Newton-Leibniz 公式 (Fundamental Theorem of Calculus, Part 2 - Newton-Leibniz Formula))
设函数 \( f(x) \) 在区间 \( [a, b] \) 上连续,\( F(x) \) 是 \( f(x) \) 的任意一个原函数,则
\[ \int_a^b f(x) \, dx = F(b) - F(a) \]
通常记 \( F(b) - F(a) = \left. F(x) \right|_a^b \)。
证明思路: 利用微积分基本定理第一部分和原函数的定义进行证明。
微积分基本定理第二部分给出了计算定积分的有效方法,即 Newton-Leibniz 公式 (Newton-Leibniz Formula)。它表明,要计算连续函数 \( f(x) \) 在 \( [a, b] \) 上的定积分,只需要找到 \( f(x) \) 的一个原函数 \( F(x) \),然后计算 \( F(b) - F(a) \) 即可。这大大简化了定积分的计算,将积分的计算转化为求原函数和代入数值的运算。
总结: 微积分基本定理的两部分共同揭示了微分和积分的互逆关系:
① 微分是求变化的速率,积分是求累积的数量。
② 微分运算和积分运算在某种意义上是互逆的。
③ 微积分基本定理为计算定积分提供了有效工具,也为进一步发展积分学奠定了理论基础。
5.4 积分的应用 (Applications of Integrals)
5.4.1 面积计算 (Area Calculation)
定积分最直接的应用之一是计算平面图形的面积。
① 计算曲边梯形的面积:
设函数 \( f(x) \ge 0 \) 在 \( [a, b] \) 上连续,则由曲线 \( y = f(x) \)、\( x \) 轴以及直线 \( x = a \)、\( x = b \) 所围成的曲边梯形的面积 \( A \) 为
\[ A = \int_a^b f(x) \, dx \]
若函数 \( f(x) \le 0 \) 在 \( [a, b] \) 上连续,则曲边梯形面积为 \( A = - \int_a^b f(x) \, dx = \int_a^b |f(x)| \, dx \)。
一般情况下,若函数 \( f(x) \) 在 \( [a, b] \) 上连续,则曲线 \( y = f(x) \)、\( x \) 轴以及直线 \( x = a \)、\( x = b \) 所围成的图形的面积为
\[ A = \int_a^b |f(x)| \, dx \]
② 计算两曲线之间的面积:
设函数 \( f(x) \) 和 \( g(x) \) 在 \( [a, b] \) 上连续,且在 \( [a, b] \) 上 \( f(x) \ge g(x) \),则由曲线 \( y = f(x) \)、\( y = g(x) \) 以及直线 \( x = a \)、\( x = b \) 所围成的平面图形的面积 \( A \) 为
\[ A = \int_a^b [f(x) - g(x)] \, dx \]
更一般地,若曲线 \( y = f(x) \) 和 \( y = g(x) \) 在 \( [a, b] \) 上围成封闭图形,则面积为
\[ A = \int_a^b |f(x) - g(x)| \, dx \]
③ 参数方程曲线围成的面积:
若平面曲线由参数方程 \( \begin{cases} x = \varphi(t) \\ y = \psi(t) \end{cases} \), \( t \in [\alpha, \beta] \) 给出,其中 \( \varphi(\alpha) = a, \varphi(\beta) = b \),且当 \( t \) 从 \( \alpha \) 增加到 \( \beta \) 时,\( x = \varphi(t) \) 从 \( a \) 增加到 \( b \),\( \psi(t) \ge 0 \) 且 \( \varphi'(t) \) 连续,则曲线与 \( x \) 轴及直线 \( x = a, x = b \) 围成的面积为
\[ A = \int_\alpha^\beta \psi(t) \varphi'(t) \, dt \]
④ 极坐标方程曲线围成的面积:
若平面曲线由极坐标方程 \( r = r(\theta) \), \( \theta \in [\alpha, \beta] \) 给出,其中 \( r(\theta) \ge 0 \) 且连续,则由曲线 \( r = r(\theta) \) 及射线 \( \theta = \alpha, \theta = \beta \) 所围成的扇形面积为
\[ A = \frac{1}{2} \int_\alpha^\beta [r(\theta)]^2 \, d\theta \]
5.4.2 体积计算 (Volume Calculation)
定积分还可以用于计算立体图形的体积。
① 旋转体的体积:
将平面图形绕 \( x \) 轴或 \( y \) 轴旋转一周所得到的立体图形称为 旋转体 (solid of revolution)。
⚝ 绕 \( x \) 轴旋转:设函数 \( y = f(x) \ge 0 \) 在 \( [a, b] \) 上连续,则由曲线 \( y = f(x) \)、\( x \) 轴以及直线 \( x = a \)、\( x = b \) 所围成的曲边梯形绕 \( x \) 轴旋转一周所得旋转体的体积 \( V_x \) 为
\[ V_x = \pi \int_a^b [f(x)]^2 \, dx \]
⚝ 绕 \( y \) 轴旋转:设函数 \( y = f(x) \ge 0 \) 在 \( [a, b] \) 上连续,则由曲线 \( y = f(x) \)、\( x \) 轴以及直线 \( x = a \)、\( x = b \) 所围成的曲边梯形绕 \( y \) 轴旋转一周所得旋转体的体积 \( V_y \) 为(假设 \( a \ge 0 \))
\[ V_y = 2\pi \int_a^b x f(x) \, dx \]
② 平行截面面积已知的立体体积:
若一个立体垂直于 \( x \) 轴的截面面积 \( A(x) \) 是已知的,且 \( A(x) \) 是 \( x \) 的连续函数,则该立体在 \( [a, b] \) 之间的体积 \( V \) 为
\[ V = \int_a^b A(x) \, dx \]
这个公式非常通用,可以用于计算各种形状的立体体积,只要我们知道平行截面面积的表达式。
5.4.3 物理应用 (Physical Applications)
积分在物理学中有着广泛的应用,例如计算变力做功、质心、转动惯量、流体压力等。
① 变力做功 (Work done by a variable force):
若物体沿 \( x \) 轴从 \( x = a \) 移动到 \( x = b \),所受到的力是位置 \( x \) 的函数 \( F(x) \),则变力 \( F(x) \) 所做的功 \( W \) 为
\[ W = \int_a^b F(x) \, dx \]
② 质心 (Center of mass):
⚝ 均匀薄板的质心:设均匀薄板由区域 \( D \) 占据,其面密度为 \( \rho \)。则薄板的质心 \( (\bar{x}, \bar{y}) \) 的坐标为
\[ \bar{x} = \frac{1}{M} \iint_D x \rho \, dA, \quad \bar{y} = \frac{1}{M} \iint_D y \rho \, dA \]
其中 \( M = \iint_D \rho \, dA \) 是薄板的质量,\( dA = dx \, dy \) 是面积元素。对于平面图形,可以简化为定积分计算。
⚝ 细杆的质心:设细杆沿 \( x \) 轴分布在 \( [a, b] \) 上,线密度为 \( \rho(x) \)。则细杆的质心 \( \bar{x} \) 坐标为
\[ \bar{x} = \frac{1}{M} \int_a^b x \rho(x) \, dx \]
其中 \( M = \int_a^b \rho(x) \, dx \) 是细杆的质量。
③ 转动惯量 (Moment of inertia):
⚝ 质点系对轴的转动惯量:\( I = \sum_{i=1}^n m_i r_i^2 \),其中 \( m_i \) 是质点的质量,\( r_i \) 是质点到转轴的距离。
⚝ 连续体对轴的转动惯量:通过积分计算。例如,细杆绕垂直于杆且过端点的轴的转动惯量为 \( I = \int_0^L x^2 \rho(x) \, dx \)。
④ 流体静压力 (Fluid pressure):
水平面上的流体压力 \( P = \rho g h \),其中 \( \rho \) 是流体密度,\( g \) 是重力加速度,\( h \) 是深度。对于垂直面上的流体压力,需要用积分计算。例如,垂直浸没在流体中的平板所受的流体压力 \( F = \int_a^b \rho g y w(y) \, dy \),其中 \( y \) 是深度,\( w(y) \) 是深度为 \( y \) 处的平板宽度。
除了上述应用,积分还在概率论、统计学、经济学、工程学等领域有着广泛的应用。积分作为一种强大的数学工具,在解决各种累积和总量问题中发挥着重要作用。
6. chapter 6: 级数理论:无限项求和的艺术 (Series Theory: The Art of Summing Infinite Terms)
6.1 数项级数 (Numerical Series)
6.1.1 级数收敛与发散 (Convergence and Divergence of Series)
在数学分析中,级数 (series) 是一个重要的概念,它研究的是将无穷多个数相加的可能性与结果。本节我们首先探讨数项级数 (numerical series),即由常数项构成的级数。
定义 6.1.1 (数项级数) 给定一个数列 \(\{a_n\}\),将数列的项 \(a_1, a_2, a_3, \ldots\) 依次用加号连接起来的表达式
\[ a_1 + a_2 + a_3 + \cdots + a_n + \cdots \]
称为无穷级数 (infinite series),简称为级数 (series),记为 \(\sum_{n=1}^{\infty} a_n\),其中 \(a_n\) 称为级数的通项 (general term) 或 第 \(n\) 项 (n-th term)。
为了研究无穷多个项相加的“和”,我们引入部分和 (partial sum) 的概念。
定义 6.1.2 (部分和) 对于级数 \(\sum_{n=1}^{\infty} a_n\),令
\[ S_n = \sum_{k=1}^{n} a_k = a_1 + a_2 + \cdots + a_n \]
称 \(S_n\) 为级数 \(\sum_{n=1}^{\infty} a_n\) 的第 \(n\) 项部分和 (n-th partial sum),所有部分和构成的数列 \(\{S_n\}\) 称为部分和数列 (sequence of partial sums)。
有了部分和的概念,我们就可以严格定义级数的收敛 (convergence) 与 发散 (divergence)。
定义 6.1.3 (级数的收敛与发散) 如果级数 \(\sum_{n=1}^{\infty} a_n\) 的部分和数列 \(\{S_n\}\) 有极限 \(S\),即 \(\lim_{n\to\infty} S_n = S\),则称级数 \(\sum_{n=1}^{\infty} a_n\) 收敛 (converges),并称 \(S\) 为级数的和 (sum),记为 \(\sum_{n=1}^{\infty} a_n = S\)。如果部分和数列 \(\{S_n\}\) 没有极限,则称级数 \(\sum_{n=1}^{\infty} a_n\) 发散 (diverges)。
例 6.1.1 (几何级数) 考虑几何级数 (geometric series) \(\sum_{n=0}^{\infty} r^n = 1 + r + r^2 + \cdots\),其中 \(r\) 为常数,称为公比 (common ratio)。其部分和为
\[ S_n = 1 + r + r^2 + \cdots + r^{n-1} = \begin{cases} \frac{1-r^n}{1-r}, & r \neq 1 \\ n, & r = 1 \end{cases} \]
当 \(|r| < 1\) 时,\(\lim_{n\to\infty} r^n = 0\),故 \(\lim_{n\to\infty} S_n = \frac{1}{1-r}\)。因此,当 \(|r| < 1\) 时,几何级数收敛,且和为 \(\frac{1}{1-r}\)。
当 \(r \geq 1\) 时,\(\lim_{n\to\infty} r^n \neq 0\),且当 \(r = 1\) 时,\(S_n = n \to \infty\),当 \(r > 1\) 时,\(r^n \to \infty\),故 \(\{S_n\}\) 发散。
当 \(r = -1\) 时,\(S_n = 1 - 1 + 1 - 1 + \cdots + (-1)^{n-1}\),部分和数列为 \(1, 0, 1, 0, \ldots\),没有极限,故发散。
当 \(r < -1\) 时,\(|r| > 1\),\(r^n\) 符号交替变化且绝对值趋于无穷大,部分和数列也发散。
综上所述,几何级数 \(\sum_{n=0}^{\infty} r^n\) 收敛当且仅当 \(|r| < 1\),此时其和为 \(\frac{1}{1-r}\);当 \(|r| \geq 1\) 时,几何级数发散。
例 6.1.2 (调和级数) 考虑调和级数 (harmonic series) \(\sum_{n=1}^{\infty} \frac{1}{n} = 1 + \frac{1}{2} + \frac{1}{3} + \cdots\)。我们可以通过比较部分和来分析其敛散性。
\[ S_{2^k} = 1 + \frac{1}{2} + (\frac{1}{3} + \frac{1}{4}) + (\frac{1}{5} + \cdots + \frac{1}{8}) + \cdots + (\frac{1}{2^{k-1}+1} + \cdots + \frac{1}{2^k}) \]
每一组括号内的项都大于等于 \(\frac{1}{2}\),例如 \(\frac{1}{3} + \frac{1}{4} > \frac{1}{4} + \frac{1}{4} = \frac{1}{2}\),\(\frac{1}{5} + \cdots + \frac{1}{8} > 4 \times \frac{1}{8} = \frac{1}{2}\),最后一组有 \(2^{k-1}\) 项,每一项都大于等于 \(\frac{1}{2^k}\),所以和大于等于 \(2^{k-1} \times \frac{1}{2^k} = \frac{1}{2}\)。
因此,\(S_{2^k} > 1 + \frac{k}{2}\)。当 \(k \to \infty\) 时,\(S_{2^k} \to \infty\)。所以调和级数 \(\sum_{n=1}^{\infty} \frac{1}{n}\) 发散。
定理 6.1.1 (级数收敛的必要条件) 若级数 \(\sum_{n=1}^{\infty} a_n\) 收敛,则 \(\lim_{n\to\infty} a_n = 0\)。
证明 若 \(\sum_{n=1}^{\infty} a_n\) 收敛于 \(S\),则 \(\lim_{n\to\infty} S_n = S\)。由于 \(a_n = S_n - S_{n-1}\) (当 \(n \geq 2\) 时),且 \(\lim_{n\to\infty} S_{n-1} = S\),所以
\[ \lim_{n\to\infty} a_n = \lim_{n\to\infty} (S_n - S_{n-1}) = \lim_{n\to\infty} S_n - \lim_{n\to\infty} S_{n-1} = S - S = 0 \]
因此,若级数收敛,则其通项的极限必须为零。
注意 定理 6.1.1 只是级数收敛的必要条件 (necessary condition),而非充分条件 (sufficient condition)。也就是说,如果 \(\lim_{n\to\infty} a_n \neq 0\),则级数 \(\sum_{n=1}^{\infty} a_n\) 一定发散。但如果 \(\lim_{n\to\infty} a_n = 0\),级数 \(\sum_{n=1}^{\infty} a_n\) 可能收敛,也可能发散。例如,调和级数 \(\sum_{n=1}^{\infty} \frac{1}{n}\) 的通项 \(\lim_{n\to\infty} \frac{1}{n} = 0\),但级数发散。
级数的基本性质
设 \(\sum_{n=1}^{\infty} a_n\) 和 \(\sum_{n=1}^{\infty} b_n\) 均为收敛级数,\(c\) 为常数,则有:
① \(\sum_{n=1}^{\infty} (a_n \pm b_n) = \sum_{n=1}^{\infty} a_n \pm \sum_{n=1}^{\infty} b_n\) (线性性质)
② \(\sum_{n=1}^{\infty} (c a_n) = c \sum_{n=1}^{\infty} a_n\) (齐次性质)
③ 改变级数的有限项,不影响级数的敛散性,只可能影响级数的和。
6.1.2 收敛判别法 (Convergence Tests)
判断级数的敛散性是级数理论的核心问题。由于级数是无穷多项的和,我们不能直接计算其和来判断是否收敛。因此,需要寻找一些判别级数敛散性的方法,称为收敛判别法 (convergence tests)。根据级数项的特点,我们有针对正项级数 (series with positive terms) 和 一般项级数 (general series) 的判别法。
6.1.2.1 正项级数的判别法 (Tests for Series with Positive Terms)
定义 6.1.4 (正项级数) 若级数 \(\sum_{n=1}^{\infty} a_n\) 的每一项 \(a_n \geq 0\) (或 \(a_n > 0\)),则称之为正项级数 (series with positive terms)。
正项级数的部分和数列 \(\{S_n\}\) 是单调递增的。因此,正项级数要么收敛(部分和数列有上界),要么发散到正无穷(部分和数列无上界)。
定理 6.1.2 (正项级数收敛的充要条件) 正项级数 \(\sum_{n=1}^{\infty} a_n\) 收敛的充要条件是其部分和数列 \(\{S_n\}\) 有上界。
1. 比较判别法 (Comparison Test)
定理 6.1.3 (比较判别法) 设 \(\sum_{n=1}^{\infty} a_n\) 和 \(\sum_{n=1}^{\infty} b_n\) 均为正项级数。
(i) 若存在正整数 \(N\),当 \(n > N\) 时,有 \(a_n \leq b_n\),且 \(\sum_{n=1}^{\infty} b_n\) 收敛,则 \(\sum_{n=1}^{\infty} a_n\) 也收敛。
(ii) 若存在正整数 \(N\),当 \(n > N\) 时,有 \(a_n \geq b_n\),且 \(\sum_{n=1}^{\infty} b_n\) 发散,则 \(\sum_{n=1}^{\infty} a_n\) 也发散。
证明 (i) 因为 \(\sum_{n=1}^{\infty} b_n\) 收敛,所以其部分和数列 \(\{T_n = \sum_{k=1}^{n} b_k\}\) 有上界,设为 \(M\)。对于 \(\sum_{n=1}^{\infty} a_n\) 的部分和 \(S_n = \sum_{k=1}^{n} a_k\),当 \(n > N\) 时,
\[ S_n = \sum_{k=1}^{N} a_k + \sum_{k=N+1}^{n} a_k \leq \sum_{k=1}^{N} a_k + \sum_{k=N+1}^{n} b_k \leq \sum_{k=1}^{N} a_k + T_n \leq \sum_{k=1}^{N} a_k + M \]
因此,\(\{S_n\}\) 有上界,故 \(\sum_{n=1}^{\infty} a_n\) 收敛。
(ii) 因为 \(\sum_{n=1}^{\infty} b_n\) 发散,所以其部分和数列 \(\{T_n\}\) 无上界,即 \(T_n \to \infty\)。当 \(n > N\) 时,
\[ S_n = \sum_{k=1}^{N} a_k + \sum_{k=N+1}^{n} a_k \geq \sum_{k=1}^{N} a_k + \sum_{k=N+1}^{n} b_k = \sum_{k=1}^{N} a_k + (T_n - T_N) \]
由于 \(T_n \to \infty\),所以 \(S_n \to \infty\),故 \(\sum_{n=1}^{\infty} a_n\) 发散。
常用比较级数
① 几何级数 \(\sum_{n=0}^{\infty} r^n\),当 \(0 < r < 1\) 时收敛,当 \(r \geq 1\) 时发散。
② \(p\) 级数 \(\sum_{n=1}^{\infty} \frac{1}{n^p}\),当 \(p > 1\) 时收敛,当 \(p \leq 1\) 时发散。 (当 \(p=1\) 时为调和级数)
例 6.1.3 判断级数 \(\sum_{n=1}^{\infty} \frac{1}{n^2 + 1}\) 的敛散性。
解:因为当 \(n \geq 1\) 时,\(n^2 + 1 > n^2\),所以 \(\frac{1}{n^2 + 1} < \frac{1}{n^2}\)。已知 \(p=2 > 1\) 时,\(p\) 级数 \(\sum_{n=1}^{\infty} \frac{1}{n^2}\) 收敛。根据比较判别法,\(\sum_{n=1}^{\infty} \frac{1}{n^2 + 1}\) 也收敛。
例 6.1.4 判断级数 \(\sum_{n=1}^{\infty} \frac{1}{\sqrt{n}}\) 的敛散性。
解:因为当 \(n \geq 1\) 时,\(\sqrt{n} \leq n\),所以 \(\frac{1}{\sqrt{n}} \geq \frac{1}{n}\)。已知调和级数 \(\sum_{n=1}^{\infty} \frac{1}{n}\) 发散。根据比较判别法,\(\sum_{n=1}^{\infty} \frac{1}{\sqrt{n}}\) 也发散。
2. 极限形式的比较判别法 (Limit Comparison Test)
定理 6.1.4 (极限形式的比较判别法) 设 \(\sum_{n=1}^{\infty} a_n\) 和 \(\sum_{n=1}^{\infty} b_n\) 均为正项级数,且 \(\lim_{n\to\infty} \frac{a_n}{b_n} = L\)。
(i) 若 \(0 < L < \infty\),则 \(\sum_{n=1}^{\infty} a_n\) 与 \(\sum_{n=1}^{\infty} b_n\) 同敛散性。
(ii) 若 \(L = 0\),且 \(\sum_{n=1}^{\infty} b_n\) 收敛,则 \(\sum_{n=1}^{\infty} a_n\) 也收敛。
(iii) 若 \(L = \infty\),且 \(\sum_{n=1}^{\infty} b_n\) 发散,则 \(\sum_{n=1}^{\infty} a_n\) 也发散。
证明 (i) 因为 \(\lim_{n\to\infty} \frac{a_n}{b_n} = L > 0\),对于 \(\epsilon = \frac{L}{2} > 0\),存在 \(N\),当 \(n > N\) 时,有 \(|\frac{a_n}{b_n} - L| < \frac{L}{2}\),即 \(L - \frac{L}{2} < \frac{a_n}{b_n} < L + \frac{L}{2}\),所以 \(\frac{L}{2} b_n < a_n < \frac{3L}{2} b_n\)。
若 \(\sum_{n=1}^{\infty} b_n\) 收敛,则 \(\sum_{n=1}^{\infty} \frac{3L}{2} b_n\) 也收敛,由比较判别法,\(\sum_{n=1}^{\infty} a_n\) 收敛。
若 \(\sum_{n=1}^{\infty} b_n\) 发散,则 \(\sum_{n=1}^{\infty} \frac{L}{2} b_n\) 也发散,由比较判别法,\(\sum_{n=1}^{\infty} a_n\) 发散。
(ii) 若 \(L = 0\),则 \(\lim_{n\to\infty} \frac{a_n}{b_n} = 0\)。对于 \(\epsilon = 1\),存在 \(N\),当 \(n > N\) 时,有 \(\frac{a_n}{b_n} < 1\),即 \(a_n < b_n\)。若 \(\sum_{n=1}^{\infty} b_n\) 收敛,由比较判别法,\(\sum_{n=1}^{\infty} a_n\) 收敛。
(iii) 若 \(L = \infty\),则 \(\lim_{n\to\infty} \frac{a_n}{b_n} = \infty\),即 \(\lim_{n\to\infty} \frac{b_n}{a_n} = 0\)。由 (ii) 的结论,若 \(\sum_{n=1}^{\infty} a_n\) 收敛,则 \(\sum_{n=1}^{\infty} b_n\) 也收敛,矛盾。因此,若 \(\sum_{n=1}^{\infty} b_n\) 发散,则 \(\sum_{n=1}^{\infty} a_n\) 也发散。
例 6.1.5 判断级数 \(\sum_{n=1}^{\infty} \frac{n+1}{n^3 + 2n + 1}\) 的敛散性。
解:取 \(b_n = \frac{1}{n^2}\),则
\[ \lim_{n\to\infty} \frac{a_n}{b_n} = \lim_{n\to\infty} \frac{\frac{n+1}{n^3 + 2n + 1}}{\frac{1}{n^2}} = \lim_{n\to\infty} \frac{n^2(n+1)}{n^3 + 2n + 1} = \lim_{n\to\infty} \frac{n^3 + n^2}{n^3 + 2n + 1} = 1 \]
因为 \(0 < 1 < \infty\),且 \(\sum_{n=1}^{\infty} \frac{1}{n^2}\) 收敛 (\(p=2 > 1\)),根据极限形式的比较判别法,\(\sum_{n=1}^{\infty} \frac{n+1}{n^3 + 2n + 1}\) 也收敛。
3. 比值判别法 (Ratio Test) (达朗贝尔判别法, D'Alembert's Ratio Test)
定理 6.1.5 (比值判别法) 设 \(\sum_{n=1}^{\infty} a_n\) 为正项级数。
(i) 若 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \rho < 1\),则级数 \(\sum_{n=1}^{\infty} a_n\) 收敛。
(ii) 若 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \rho > 1\) (或 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \infty\)),则级数 \(\sum_{n=1}^{\infty} a_n\) 发散。
(iii) 若 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \rho = 1\),则比值判别法失效,无法判断敛散性,需要用其他方法。
证明 (i) 若 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \rho < 1\),取 \(r\) 使得 \(\rho < r < 1\)。存在 \(N\),当 \(n > N\) 时,有 \(\frac{a_{n+1}}{a_n} < r\),即 \(a_{n+1} < r a_n\)。
则 \(a_{N+1} < r a_N\),\(a_{N+2} < r a_{N+1} < r^2 a_N\),\(\ldots\),\(a_{N+k} < r^k a_N\)。
考虑级数 \(\sum_{k=1}^{\infty} a_{N+k} = a_{N+1} + a_{N+2} + \cdots\)。对于 \(k \geq 1\),有 \(a_{N+k} < a_N r^k\)。由于 \(0 < r < 1\),几何级数 \(\sum_{k=1}^{\infty} a_N r^k = a_N \sum_{k=1}^{\infty} r^k\) 收敛。根据比较判别法,\(\sum_{k=1}^{\infty} a_{N+k}\) 收敛,从而 \(\sum_{n=1}^{\infty} a_n\) 收敛。
(ii) 若 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \rho > 1\),取 \(r\) 使得 \(1 < r < \rho\)。存在 \(N\),当 \(n > N\) 时,有 \(\frac{a_{n+1}}{a_n} > r > 1\),即 \(a_{n+1} > a_n\)。因此,当 \(n > N\) 时,数列 \(\{a_n\}\) 递增,且 \(a_n > a_N > 0\)。所以 \(\lim_{n\to\infty} a_n \neq 0\),根据级数收敛的必要条件,\(\sum_{n=1}^{\infty} a_n\) 发散。
若 \(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \infty\),则存在 \(N\),当 \(n > N\) 时,有 \(\frac{a_{n+1}}{a_n} > 2\),即 \(a_{n+1} > 2 a_n > a_n\)。同理可证 \(\sum_{n=1}^{\infty} a_n\) 发散。
例 6.1.6 判断级数 \(\sum_{n=1}^{\infty} \frac{n!}{n^n}\) 的敛散性。
解:\(a_n = \frac{n!}{n^n}\),\(a_{n+1} = \frac{(n+1)!}{(n+1)^{n+1}}\)。
\[ \frac{a_{n+1}}{a_n} = \frac{\frac{(n+1)!}{(n+1)^{n+1}}}{\frac{n!}{n^n}} = \frac{(n+1)!}{n!} \cdot \frac{n^n}{(n+1)^{n+1}} = (n+1) \cdot \frac{n^n}{(n+1)^{n+1}} = \frac{n^n}{(n+1)^n} = \left(\frac{n}{n+1}\right)^n = \left(\frac{1}{1 + \frac{1}{n}}\right)^n = \frac{1}{(1 + \frac{1}{n})^n} \]
\[ \lim_{n\to\infty} \frac{a_{n+1}}{a_n} = \lim_{n\to\infty} \frac{1}{(1 + \frac{1}{n})^n} = \frac{1}{e} < 1 \]
因为 \(\frac{1}{e} < 1\),根据比值判别法,级数 \(\sum_{n=1}^{\infty} \frac{n!}{n^n}\) 收敛。
例 6.1.7 判断级数 \(\sum_{n=1}^{\infty} \frac{1}{n^2}\) 和 \(\sum_{n=1}^{\infty} \frac{1}{n}\) 的比值判别法的结果。
对于 \(\sum_{n=1}^{\infty} \frac{1}{n^2}\),\(\frac{a_{n+1}}{a_n} = \frac{\frac{1}{(n+1)^2}}{\frac{1}{n^2}} = \frac{n^2}{(n+1)^2} = \left(\frac{n}{n+1}\right)^2 = \left(\frac{1}{1 + \frac{1}{n}}\right)^2\),\(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = 1\)。
对于 \(\sum_{n=1}^{\infty} \frac{1}{n}\),\(\frac{a_{n+1}}{a_n} = \frac{\frac{1}{n+1}}{\frac{1}{n}} = \frac{n}{n+1} = \frac{1}{1 + \frac{1}{n}}\),\(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = 1\)。
对于 \(p\) 级数 \(\sum_{n=1}^{\infty} \frac{1}{n^p}\),\(\frac{a_{n+1}}{a_n} = \frac{\frac{1}{(n+1)^p}}{\frac{1}{n^p}} = \left(\frac{n}{n+1}\right)^p = \left(\frac{1}{1 + \frac{1}{n}}\right)^p\),\(\lim_{n\to\infty} \frac{a_{n+1}}{a_n} = 1\)。
这说明当比值极限为 1 时,比值判别法失效,无法判断敛散性。
4. 根值判别法 (Root Test) (柯西判别法, Cauchy's Root Test)
定理 6.1.6 (根值判别法) 设 \(\sum_{n=1}^{\infty} a_n\) 为正项级数。
(i) 若 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \lambda < 1\),则级数 \(\sum_{n=1}^{\infty} a_n\) 收敛。
(ii) 若 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \lambda > 1\) (或 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \infty\)),则级数 \(\sum_{n=1}^{\infty} a_n\) 发散。
(iii) 若 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \lambda = 1\),则根值判别法失效,无法判断敛散性,需要用其他方法。
证明 (i) 若 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \lambda < 1\),取 \(r\) 使得 \(\lambda < r < 1\)。存在 \(N\),当 \(n > N\) 时,有 \(\sqrt[n]{a_n} < r\),即 \(a_n < r^n\)。由于 \(0 < r < 1\),几何级数 \(\sum_{n=1}^{\infty} r^n\) 收敛。根据比较判别法,\(\sum_{n=1}^{\infty} a_n\) 收敛。
(ii) 若 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \lambda > 1\),取 \(r\) 使得 \(1 < r < \lambda\)。存在 \(N\),当 \(n > N\) 时,有 \(\sqrt[n]{a_n} > r > 1\),即 \(a_n > r^n > 1\)。因此,\(\lim_{n\to\infty} a_n \neq 0\),根据级数收敛的必要条件,\(\sum_{n=1}^{\infty} a_n\) 发散。
若 \(\lim_{n\to\infty} \sqrt[n]{a_n} = \infty\),则存在 \(N\),当 \(n > N\) 时,有 \(\sqrt[n]{a_n} > 2\),即 \(a_n > 2^n > 1\)。同理可证 \(\sum_{n=1}^{\infty} a_n\) 发散。
例 6.1.8 判断级数 \(\sum_{n=1}^{\infty} \left(\frac{n}{2n+1}\right)^n\) 的敛散性。
解:\(a_n = \left(\frac{n}{2n+1}\right)^n\),\(\sqrt[n]{a_n} = \sqrt[n]{\left(\frac{n}{2n+1}\right)^n} = \frac{n}{2n+1} = \frac{1}{2 + \frac{1}{n}}\)。
\[ \lim_{n\to\infty} \sqrt[n]{a_n} = \lim_{n\to\infty} \frac{1}{2 + \frac{1}{n}} = \frac{1}{2} < 1 \]
因为 \(\frac{1}{2} < 1\),根据根值判别法,级数 \(\sum_{n=1}^{\infty} \left(\frac{n}{2n+1}\right)^n\) 收敛。
例 6.1.9 判断级数 \(\sum_{n=1}^{\infty} \frac{1}{n^2}\) 和 \(\sum_{n=1}^{\infty} \frac{1}{n}\) 的根值判别法的结果。
对于 \(\sum_{n=1}^{\infty} \frac{1}{n^2}\),\(\sqrt[n]{a_n} = \sqrt[n]{\frac{1}{n^2}} = \frac{1}{(\sqrt[n]{n})^2}\),\(\lim_{n\to\infty} \sqrt[n]{a_n} = \frac{1}{(\lim_{n\to\infty} \sqrt[n]{n})^2} = \frac{1}{1^2} = 1\)。
对于 \(\sum_{n=1}^{\infty} \frac{1}{n}\),\(\sqrt[n]{a_n} = \sqrt[n]{\frac{1}{n}} = \frac{1}{\sqrt[n]{n}}\),\(\lim_{n\to\infty} \sqrt[n]{a_n} = \frac{1}{\lim_{n\to\infty} \sqrt[n]{n}} = \frac{1}{1} = 1\)。
这说明当根值极限为 1 时,根值判别法失效,无法判断敛散性。
5. 积分判别法 (Integral Test)
定理 6.1.7 (积分判别法) 设函数 \(f(x)\) 在 \([1, +\infty)\) 上单调递减,且 \(f(x) \geq 0\)。令 \(a_n = f(n)\),则级数 \(\sum_{n=1}^{\infty} a_n\) 与反常积分 \(\int_{1}^{\infty} f(x) dx\) 同敛散性。
例 6.1.10 用积分判别法判断 \(p\) 级数 \(\sum_{n=1}^{\infty} \frac{1}{n^p}\) 的敛散性 (\(p > 0\))。
解:令 \(f(x) = \frac{1}{x^p}\),当 \(x \geq 1\) 时,\(f(x) > 0\),且 \(f'(x) = -p x^{-p-1} < 0\),所以 \(f(x)\) 单调递减。
考虑反常积分 \(\int_{1}^{\infty} \frac{1}{x^p} dx = \lim_{t\to\infty} \int_{1}^{t} x^{-p} dx\)。
当 \(p = 1\) 时,\(\int_{1}^{t} \frac{1}{x} dx = \ln x \Big|_1^t = \ln t - \ln 1 = \ln t\),\(\lim_{t\to\infty} \ln t = \infty\),积分发散。
当 \(p \neq 1\) 时,\(\int_{1}^{t} x^{-p} dx = \frac{x^{1-p}}{1-p} \Big|_1^t = \frac{t^{1-p} - 1}{1-p}\)。
当 \(p > 1\) 时,\(1-p < 0\),\(\lim_{t\to\infty} t^{1-p} = 0\),\(\lim_{t\to\infty} \frac{t^{1-p} - 1}{1-p} = \frac{-1}{1-p} = \frac{1}{p-1}\),积分收敛。
当 \(0 < p < 1\) 时,\(1-p > 0\),\(\lim_{t\to\infty} t^{1-p} = \infty\),积分发散。
因此,当 \(p > 1\) 时,积分收敛;当 \(0 < p \leq 1\) 时,积分发散。根据积分判别法,\(p\) 级数 \(\sum_{n=1}^{\infty} \frac{1}{n^p}\) 当 \(p > 1\) 时收敛,当 \(0 < p \leq 1\) 时发散。
6.1.2.2 一般项级数的判别法 (Tests for General Series)
定义 6.1.5 (一般项级数) 若级数 \(\sum_{n=1}^{\infty} a_n\) 的项 \(a_n\) 的符号不确定,则称之为一般项级数 (general series)。
1. 交错级数判别法 (Alternating Series Test) (莱布尼茨判别法, Leibniz's Test)
定义 6.1.6 (交错级数) 若级数 \(\sum_{n=1}^{\infty} a_n\) 的项 \(a_n\) 的符号交替出现,则称之为交错级数 (alternating series)。通常形式为 \(\sum_{n=1}^{\infty} (-1)^{n-1} b_n\) 或 \(\sum_{n=1}^{\infty} (-1)^{n} b_n\),其中 \(b_n \geq 0\)。
定理 6.1.8 (交错级数判别法) 若交错级数 \(\sum_{n=1}^{\infty} (-1)^{n-1} b_n\) 满足条件:
(i) \(b_n \geq 0\);
(ii) \(\lim_{n\to\infty} b_n = 0\);
(iii) \(b_{n+1} \leq b_n\) (即 \(\{b_n\}\) 单调递减)。
则级数 \(\sum_{n=1}^{\infty} (-1)^{n-1} b_n\) 收敛。
例 6.1.11 判断交错调和级数 \(\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n} = 1 - \frac{1}{2} + \frac{1}{3} - \frac{1}{4} + \cdots\) 的敛散性。
解:令 \(b_n = \frac{1}{n}\)。
(i) \(b_n = \frac{1}{n} > 0\);
(ii) \(\lim_{n\to\infty} b_n = \lim_{n\to\infty} \frac{1}{n} = 0\);
(iii) \(b_{n+1} = \frac{1}{n+1} < \frac{1}{n} = b_n\),\(\{b_n\}\) 单调递减。
三个条件都满足,根据交错级数判别法,交错调和级数 \(\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n}\) 收敛。
2. 绝对收敛与条件收敛 (Absolute Convergence and Conditional Convergence)
定义 6.1.7 (绝对收敛与条件收敛) 对于一般项级数 \(\sum_{n=1}^{\infty} a_n\)。
(i) 若级数 \(\sum_{n=1}^{\infty} |a_n|\) 收敛,则称级数 \(\sum_{n=1}^{\infty} a_n\) 绝对收敛 (absolutely convergent)。
(ii) 若级数 \(\sum_{n=1}^{\infty} a_n\) 收敛,但级数 \(\sum_{n=1}^{\infty} |a_n|\) 发散,则称级数 \(\sum_{n=1}^{\infty} a_n\) 条件收敛 (conditionally convergent)。
定理 6.1.9 (绝对收敛必收敛) 若级数 \(\sum_{n=1}^{\infty} a_n\) 绝对收敛,则级数 \(\sum_{n=1}^{\infty} a_n\) 收敛。
证明 因为 \(\sum_{n=1}^{\infty} |a_n|\) 收敛,根据 Cauchy 收敛准则,对于任意 \(\epsilon > 0\),存在 \(N\),当 \(n > m > N\) 时,有 \(\sum_{k=m+1}^{n} |a_k| < \epsilon\)。
由于 \(|a_{m+1} + a_{m+2} + \cdots + a_n| \leq |a_{m+1}| + |a_{m+2}| + \cdots + |a_n| = \sum_{k=m+1}^{n} |a_k| < \epsilon\)。
根据 Cauchy 收敛准则,级数 \(\sum_{n=1}^{\infty} a_n\) 收敛。
例 6.1.12 交错调和级数 \(\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n}\) 是条件收敛的,因为 \(\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n}\) 收敛 (交错级数判别法),但 \(\sum_{n=1}^{\infty} \left|\frac{(-1)^{n-1}}{n}\right| = \sum_{n=1}^{\infty} \frac{1}{n}\) 发散 (调和级数)。
绝对收敛级数的性质
① 绝对收敛级数经过任意重排后,仍绝对收敛,且和不变。
② 条件收敛级数经过适当重排后,可以收敛到任意实数,甚至发散。 (黎曼重排定理)
3. 一般项级数的比值判别法和根值判别法
对于一般项级数 \(\sum_{n=1}^{\infty} a_n\),我们可以考虑级数 \(\sum_{n=1}^{\infty} |a_n|\) 的敛散性,从而判断原级数是否绝对收敛。我们可以将比值判别法和根值判别法应用于 \(\sum_{n=1}^{\infty} |a_n|\)。
定理 6.1.10 (一般项级数的比值判别法) 设 \(\sum_{n=1}^{\infty} a_n\) 为一般项级数。
(i) 若 \(\lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \rho < 1\),则级数 \(\sum_{n=1}^{\infty} a_n\) 绝对收敛 (从而收敛)。
(ii) 若 \(\lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \rho > 1\) (或 \(\lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \infty\)),则级数 \(\sum_{n=1}^{\infty} a_n\) 发散。
(iii) 若 \(\lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \rho = 1\),则比值判别法失效。
定理 6.1.11 (一般项级数的根值判别法) 设 \(\sum_{n=1}^{\infty} a_n\) 为一般项级数。
(i) 若 \(\lim_{n\to\infty} \sqrt[n]{|a_n|} = \lambda < 1\),则级数 \(\sum_{n=1}^{\infty} a_n\) 绝对收敛 (从而收敛)。
(ii) 若 \(\lim_{n\to\infty} \sqrt[n]{|a_n|} = \lambda > 1\) (或 \(\lim_{n\to\infty} \sqrt[n]{|a_n|} = \infty\)),则级数 \(\sum_{n=1}^{\infty} a_n\) 发散。
(iii) 若 \(\lim_{n\to\infty} \sqrt[n]{|a_n|} = \lambda = 1\),则根值判别法失效。
例 6.1.13 判断级数 \(\sum_{n=1}^{\infty} \frac{(-2)^n}{n!}\) 的敛散性。
解:\(a_n = \frac{(-2)^n}{n!}\),\(\left|\frac{a_{n+1}}{a_n}\right| = \left|\frac{\frac{(-2)^{n+1}}{(n+1)!}}{\frac{(-2)^n}{n!}}\right| = \frac{2^{n+1}}{(n+1)!} \cdot \frac{n!}{2^n} = \frac{2}{n+1}\)。
\[ \lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \lim_{n\to\infty} \frac{2}{n+1} = 0 < 1 \]
根据比值判别法,级数 \(\sum_{n=1}^{\infty} \frac{(-2)^n}{n!}\) 绝对收敛,从而收敛。
6.2 函数项级数 (Series of Functions)
6.2.1 函数项级数的收敛域 (Domain of Convergence of Series of Functions)
定义 6.2.1 (函数项级数) 若级数 \(\sum_{n=1}^{\infty} u_n(x)\) 的每一项 \(u_n(x)\) 都是定义在区间 \(I\) 上的函数,则称之为函数项级数 (series of functions)。
对于给定的 \(x_0 \in I\),将 \(x = x_0\) 代入函数项级数,得到数项级数 \(\sum_{n=1}^{\infty} u_n(x_0)\)。如果该数项级数收敛,则称 \(x_0\) 为函数项级数的收敛点 (point of convergence)。所有收敛点的集合称为函数项级数的收敛域 (domain of convergence)。
定义 6.2.2 (逐点收敛) 若对于收敛域 \(D\) 内的每一个 \(x\),数项级数 \(\sum_{n=1}^{\infty} u_n(x)\) 都收敛,则称函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\) 在收敛域 \(D\) 上逐点收敛 (pointwise convergent)。记 \(S(x) = \sum_{n=1}^{\infty} u_n(x)\) 为级数的和函数 (sum function)。
求收敛域的方法
对于函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\),对于每一个固定的 \(x\),它是一个数项级数,可以使用数项级数的收敛判别法来判断其敛散性。通常使用比值判别法或根值判别法。
例 6.2.1 求函数项级数 \(\sum_{n=1}^{\infty} \frac{x^n}{n}\) 的收敛域。
解:对于固定的 \(x\),考虑数项级数 \(\sum_{n=1}^{\infty} \frac{x^n}{n}\)。使用比值判别法。
\[ \lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \lim_{n\to\infty} \left|\frac{\frac{x^{n+1}}{n+1}}{\frac{x^n}{n}}\right| = \lim_{n\to\infty} \left|\frac{x^{n+1}}{x^n} \cdot \frac{n}{n+1}\right| = |x| \lim_{n\to\infty} \frac{n}{n+1} = |x| \]
当 \(|x| < 1\) 时,级数绝对收敛;当 \(|x| > 1\) 时,级数发散;当 \(|x| = 1\) 时,比值判别法失效。
当 \(x = 1\) 时,级数为 \(\sum_{n=1}^{\infty} \frac{1}{n}\),调和级数,发散。
当 \(x = -1\) 时,级数为 \(\sum_{n=1}^{\infty} \frac{(-1)^n}{n} = -\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n}\),交错调和级数,收敛。
因此,收敛域为 \([-1, 1)\)。
例 6.2.2 求函数项级数 \(\sum_{n=0}^{\infty} n! x^n\) 的收敛域。
解:对于固定的 \(x\),考虑数项级数 \(\sum_{n=0}^{\infty} n! x^n\)。使用比值判别法。
\[ \lim_{n\to\infty} \left|\frac{a_{n+1}}{a_n}\right| = \lim_{n\to\infty} \left|\frac{(n+1)! x^{n+1}}{n! x^n}\right| = \lim_{n\to\infty} |(n+1)x| = |x| \lim_{n\to\infty} (n+1) = \begin{cases} 0, & x = 0 \\ \infty, & x \neq 0 \end{cases} \]
当 \(x = 0\) 时,极限为 0 < 1,级数收敛。当 \(x \neq 0\) 时,极限为 \(\infty > 1\),级数发散。
因此,收敛域为 \(\{0\}\)。
6.2.2 一致收敛性 (Uniform Convergence)
逐点收敛只是对每个点 \(x\) 而言,函数项级数收敛到和函数 \(S(x)\)。为了研究和函数 \(S(x)\) 的性质 (如连续性、可积性、可微性),我们需要更强的收敛性,即一致收敛性 (uniform convergence)。
定义 6.2.3 (一致收敛) 设函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \(I\) 上逐点收敛于和函数 \(S(x)\),记部分和 \(S_n(x) = \sum_{k=1}^{n} u_k(x)\)。若对于任意 \(\epsilon > 0\),存在 \(N\),使得当 \(n > N\) 时,对于所有 \(x \in I\),都有 \(|S_n(x) - S(x)| < \epsilon\),则称函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \(I\) 上一致收敛 (uniformly convergent) 于 \(S(x)\)。
注意 一致收敛与逐点收敛的区别在于,一致收敛中,\(N\) 的选取只依赖于 \(\epsilon\),而与 \(x\) 无关;逐点收敛中,对于不同的 \(x\),可能需要不同的 \(N\)。
定理 6.2.1 (一致收敛的柯西准则) 函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \(I\) 上一致收敛的充要条件是:对于任意 \(\epsilon > 0\),存在 \(N\),使得当 \(n > N\) 时,对于任意正整数 \(p\) 和所有 \(x \in I\),都有 \(\left|\sum_{k=n+1}^{n+p} u_k(x)\right| < \epsilon\)。
定理 6.2.2 (魏尔斯特拉斯 M 判别法) (Weierstrass M-test) 若存在正项级数 \(\sum_{n=1}^{\infty} M_n\) 收敛,且存在 \(N\),当 \(n > N\) 时,对于所有 \(x \in I\),都有 \(|u_n(x)| \leq M_n\),则函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \(I\) 上一致收敛。
证明 因为 \(\sum_{n=1}^{\infty} M_n\) 收敛,根据数项级数的柯西收敛准则,对于任意 \(\epsilon > 0\),存在 \(N\),当 \(n > N\) 时,对于任意正整数 \(p\),有 \(\sum_{k=n+1}^{n+p} M_k < \epsilon\)。
对于函数项级数 \(\sum_{n=1}^{\infty} u_n(x)\),当 \(n > N\) 时,对于任意正整数 \(p\) 和所有 \(x \in I\),
\[ \left|\sum_{k=n+1}^{n+p} u_k(x)\right| \leq \sum_{k=n+1}^{n+p} |u_k(x)| \leq \sum_{k=n+1}^{n+p} M_k < \epsilon \]
根据一致收敛的柯西准则,函数项级数 \ведении \sum_{n=1}^{\infty} u_n(x)) 在区间 \(I\) 上一致收敛。
例 6.2.3 证明级数 \(\sum_{n=1}^{\infty} \frac{\sin(nx)}{n^2}\) 在 \((-\infty, +\infty)\) 上一致收敛。
解:对于任意 \(x \in (-\infty, +\infty)\),\(|u_n(x)| = \left|\frac{\sin(nx)}{n^2}\right| \leq \frac{1}{n^2}\)。取 \(M_n = \frac{1}{n^2}\),级数 \(\sum_{n=1}^{\infty} M_n = \sum_{n=1}^{\infty} \frac{1}{n^2}\) 收敛 (\(p=2 > 1\))。根据魏尔斯特拉斯 M 判别法,级数 \(\sum_{n=1}^{\infty} \frac{\sin(nx)}{n^2}\) 在 \((-\infty, +\infty)\) 上一致收敛。
一致收敛的性质
① 若 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \(I\) 上一致收敛,且每个 \(u_n(x)\) 在 \(x_0 \in I\) 处连续,则和函数 \(S(x) = \sum_{n=1}^{\infty} u_n(x)\) 在 \(x_0\) 处连续。
② 若 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \([a, b]\) 上一致收敛,且每个 \(u_n(x)\) 在 \([a, b]\) 上可积,则和函数 \(S(x) = \sum_{n=1}^{\infty} u_n(x)\) 在 \([a, b]\) 上可积,且可以逐项积分:
\[ \int_{a}^{b} S(x) dx = \int_{a}^{b} \left(\sum_{n=1}^{\infty} u_n(x)\right) dx = \sum_{n=1}^{\infty} \int_{a}^{b} u_n(x) dx \]
③ 若 \(\sum_{n=1}^{\infty} u_n(x)\) 在区间 \([a, b]\) 上逐点收敛于 \(S(x)\),且每个 \(u_n(x)\) 可导,\(\sum_{n=1}^{\infty} u'_n(x)\) 在区间 \([a, b]\) 上一致收敛,则 \(S(x)\) 在 \([a, b]\) 上可导,且可以逐项求导:
\[ S'(x) = \left(\sum_{n=1}^{\infty} u_n(x)\right)' = \sum_{n=1}^{\infty} u'_n(x) \]
6.3 幂级数 (Power Series)
6.3.1 幂级数的收敛半径与收敛域 (Radius and Domain of Convergence of Power Series)
定义 6.3.1 (幂级数) 形如 \(\sum_{n=0}^{\infty} c_n (x-x_0)^n\) 的函数项级数称为幂级数 (power series),其中 \(c_n\) 为常数,称为系数 (coefficients),\(x_0\) 称为中心 (center)。当 \(x_0 = 0\) 时,幂级数简化为 \(\sum_{n=0}^{\infty} c_n x^n\)。
定理 6.3.1 (阿贝尔定理) (Abel's Theorem) 若幂级数 \(\sum_{n=0}^{\infty} c_n (x-x_0)^n\) 在 \(x = x_1 \neq x_0\) 处收敛,则对于满足 \(|x-x_0| < |x_1-x_0|\) 的所有 \(x\),幂级数绝对收敛;若幂级数在 \(x = x_2 \neq x_0\) 处发散,则对于满足 \(|x-x_0| > |x_2-x_0|\) 的所有 \(x\),幂级数发散。
推论 6.3.1 对于幂级数 \(\sum_{n=0}^{\infty} c_n (x-x_0)^n\),必存在 \(R \in [0, +\infty]\),使得:
(i) 当 \(|x-x_0| < R\) 时,幂级数绝对收敛;
(ii) 当 \(|x-x_0| > R\) 时,幂级数发散;
(iii) 当 \(|x-x_0| = R\) 时,幂级数的敛散性不定,需要具体分析。
\(R\) 称为幂级数的收敛半径 (radius of convergence)。区间 \((x_0 - R, x_0 + R)\) 称为收敛区间 (interval of convergence)。收敛域为收敛区间再加上端点处收敛的点。
求收敛半径的方法
通常使用比值判别法或根值判别法。
1. 比值法求收敛半径
若 \(\lim_{n\to\infty} \left|\frac{c_{n+1}}{c_n}\right| = L\) (或 \(\lim_{n\to\infty} \left|\frac{c_{n+1}}{c_n}\right| = \infty\) 或 \(\lim_{n\to\infty} \left|\frac{c_{n+1}}{c_n}\right| = 0\)),则收敛半径 \(R = \frac{1}{L}\) (当 \(L = 0\) 时,\(R = +\infty\);当 \(L = \infty\) 时,\(R = 0\))。
2. 根值法求收敛半径
若 \(\lim_{n\to\infty} \sqrt[n]{|c_n|} = L\) (或 \(\lim_{n\to\infty} \sqrt[n]{|c_n|} = \infty\) 或 \(\lim_{n\to\infty} \sqrt[n]{|c_n|} = 0\)),则收敛半径 \(R = \frac{1}{L}\) (当 \(L = 0\) 时,\(R = +\infty\);当 \(L = \infty\) 时,\(R = 0\))。
例 6.3.1 求幂级数 \(\sum_{n=0}^{\infty} \frac{x^n}{n!}\) 的收敛半径和收敛域。
解:\(c_n = \frac{1}{n!}\),\(\left|\frac{c_{n+1}}{c_n}\right| = \left|\frac{\frac{1}{(n+1)!}}{\frac{1}{n!}}\right| = \frac{n!}{(n+1)!} = \frac{1}{n+1}\),\(\lim_{n\to\infty} \left|\frac{c_{n+1}}{c_n}\right| = \lim_{n\to\infty} \frac{1}{n+1} = 0\)。
收敛半径 \(R = \frac{1}{0} = +\infty\)。收敛区间为 \((-\infty, +\infty)\)。收敛域为 \((-\infty, +\infty)\)。
例 6.3.2 求幂级数 \(\sum_{n=1}^{\infty} n x^n\) 的收敛半径和收敛域。
解:\(c_n = n\),\(\left|\frac{c_{n+1}}{c_n}\right| = \frac{n+1}{n} = 1 + \frac{1}{n}\),\(\lim_{n\to\infty} \left|\frac{c_{n+1}}{c_n}\right| = \lim_{n\to\infty} \left(1 + \frac{1}{n}\right) = 1\)。
收敛半径 \(R = \frac{1}{1} = 1\)。收敛区间为 \((-1, 1)\)。
当 \(x = 1\) 时,级数为 \(\sum_{n=1}^{\infty} n\),\(\lim_{n\to\infty} n = \infty \neq 0\),发散。
当 \(x = -1\) 时,级数为 \(\sum_{n=1}^{\infty} n (-1)^n\),\(\lim_{n\to\infty} n (-1)^n\) 不存在,不为 0,发散。
收敛域为 \((-1, 1)\)。
6.3.2 幂级数的性质 (Properties of Power Series)
设幂级数 \(\sum_{n=0}^{\infty} c_n (x-x_0)^n\) 的收敛半径为 \(R > 0\),和函数为 \(S(x)\)。
性质 1 (连续性) 在收敛区间 \((x_0 - R, x_0 + R)\) 内,和函数 \(S(x)\) 是连续的。
性质 2 (可积性) 在收敛区间 \((x_0 - R, x_0 + R)\) 内,幂级数可以逐项积分,且在 \((x_0 - R, x_0 + R)\) 内,积分后的级数仍收敛,且和函数为原和函数的积分。对于 \([x_0 - r, x_0 + r] \subset (x_0 - R, x_0 + R)\),有
\[ \int_{x_0}^{x} S(t) dt = \int_{x_0}^{x} \left(\sum_{n=0}^{\infty} c_n (t-x_0)^n\right) dt = \sum_{n=0}^{\infty} \int_{x_0}^{x} c_n (t-x_0)^n dt = \sum_{n=0}^{\infty} \frac{c_n}{n+1} (x-x_0)^{n+1} \]
积分后的幂级数的收敛半径与原幂级数的收敛半径相同,仍为 \(R\)。
性质 3 (可导性) 在收敛区间 \((x_0 - R, x_0 + R)\) 内,幂级数可以逐项求导,且在 \((x_0 - R, x_0 + R)\) 内,求导后的级数仍收敛,且和函数为原和函数的导数。
\[ S'(x) = \left(\sum_{n=0}^{\infty} c_n (x-x_0)^n\right)' = \sum_{n=1}^{\infty} n c_n (x-x_0)^{n-1} \]
求导后的幂级数的收敛半径与原幂级数的收敛半径相同,仍为 \(R\)。
性质 4 (唯一性) 若在 \((x_0 - \delta, x_0 + \delta)\) 内,有 \(\sum_{n=0}^{\infty} a_n (x-x_0)^n = \sum_{n=0}^{\infty} b_n (x-x_0)^n\),则 \(a_n = b_n\) 对所有 \(n\) 成立。
性质 5 (四则运算) 幂级数在收敛区间内可以进行加、减、乘、除运算。
例 6.3.3 求函数 \(f(x) = \frac{1}{1-x}\) 的幂级数展开式。
解:几何级数 \(\sum_{n=0}^{\infty} x^n = 1 + x + x^2 + \cdots\) 在 \(|x| < 1\) 时收敛,且和为 \(\frac{1}{1-x}\)。因此,\(f(x) = \frac{1}{1-x} = \sum_{n=0}^{\infty} x^n\),收敛半径 \(R = 1\)。
例 6.3.4 求函数 \(g(x) = \ln(1+x)\) 的幂级数展开式。
解:对 \(f(t) = \frac{1}{1-t} = \sum_{n=0}^{\infty} t^n\) 在 \([0, x]\) 上积分 (\(|x| < 1\))。
\[ \int_{0}^{x} \frac{1}{1-t} dt = \int_{0}^{x} \left(\sum_{n=0}^{\infty} t^n\right) dt = \sum_{n=0}^{\infty} \int_{0}^{x} t^n dt = \sum_{n=0}^{\infty} \frac{x^{n+1}}{n+1} = x - \frac{x^2}{2} + \frac{x^3}{3} - \frac{x^4}{4} + \cdots \]
\[ \int_{0}^{x} \frac{1}{1-t} dt = -\ln|1-t| \Big|_0^x = -\ln|1-x| - (-\ln|1|) = -\ln(1-x) \]
将 \(x\) 换成 \(-x\),得到
\[ -\ln(1-(-x)) = -\ln(1+x) = \sum_{n=0}^{\infty} \frac{(-x)^{n+1}}{n+1} = \sum_{n=0}^{\infty} \frac{(-1)^{n+1} x^{n+1}}{n+1} = -x + \frac{x^2}{2} - \frac{x^3}{3} + \cdots \]
\[ \ln(1+x) = \sum_{n=1}^{\infty} \frac{(-1)^{n-1} x^n}{n} = x - \frac{x^2}{2} + \frac{x^3}{3} - \frac{x^4}{4} + \cdots \]
收敛半径 \(R = 1\)。收敛域为 \([-1, 1)\)。
例 6.3.5 求函数 \(h(x) = \arctan x\) 的幂级数展开式。
解:对 \(f(t) = \frac{1}{1+t^2} = \frac{1}{1-(-t^2)} = \sum_{n=0}^{\infty} (-t^2)^n = \sum_{n=0}^{\infty} (-1)^n t^{2n}\) 在 \([0, x]\) 上积分 (\(|x| < 1\))。
\[ \int_{0}^{x} \frac{1}{1+t^2} dt = \int_{0}^{x} \left(\sum_{n=0}^{\infty} (-1)^n t^{2n}\right) dt = \sum_{n=0}^{\infty} \int_{0}^{x} (-1)^n t^{2n} dt = \sum_{n=0}^{\infty} \frac{(-1)^n x^{2n+1}}{2n+1} = x - \frac{x^3}{3} + \frac{x^5}{5} - \cdots \]
\[ \int_{0}^{x} \frac{1}{1+t^2} dt = \arctan t \Big|_0^x = \arctan x - \arctan 0 = \arctan x \]
\[ \arctan x = \sum_{n=0}^{\infty} \frac{(-1)^n x^{2n+1}}{2n+1} = x - \frac{x^3}{3} + \frac{x^5}{5} - \cdots \]
收敛半径 \(R = 1\)。收敛域为 \([-1, 1]\)。
通过级数理论的学习,我们掌握了判断级数敛散性的多种方法,了解了函数项级数一致收敛的重要性,以及幂级数的基本性质和应用。这些知识为进一步学习实分析和复分析奠定了坚实的基础。
7. chapter 7: 多元函数微积分初步 (Introduction to Multivariable Calculus)
7.1 多元函数的极限与连续性 (Limits and Continuity of Multivariable Functions)
多元函数 (multivariable function) 是指输入为多个变量,输出为一个或多个变量的函数。在实分析中,我们首先关注的是输入为 \(n\) 维向量,输出为实数的标量函数,以及输入为 \(n\) 维向量,输出为 \(m\) 维向量的向量值函数。本节我们主要讨论标量函数,向量值函数的极限与连续性可以类似地进行定义和讨论。
7.1.1 多元函数的极限 (Limits of Multivariable Functions)
对于一元函数 \(f(x)\),我们讨论当 \(x\) 趋近于某个点 \(x_0\) 时,函数 \(f(x)\) 的极限。对于多元函数 \(f(\mathbf{x})\),其中 \(\mathbf{x} = (x_1, x_2, \ldots, x_n) \in \mathbb{R}^n\),我们需要考虑当 \(\mathbf{x}\) 趋近于某个点 \(\mathbf{x}_0 = (x_{1,0}, x_{2,0}, \ldots, x_{n,0}) \in \mathbb{R}^n\) 时,函数 \(f(\mathbf{x})\) 的极限。
定义 7.1.1 (多元函数极限的定义):设 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\),\(\mathbf{x}_0\) 是 \(D\) 的聚点 (accumulation point)。我们说当 \(\mathbf{x}\) 趋近于 \(\mathbf{x}_0\) 时,\(f(\mathbf{x})\) 的极限为 \(L\),记作 \(\lim_{\mathbf{x} \to \mathbf{x}_0} f(\mathbf{x}) = L\),如果对于任意给定的 \(\epsilon > 0\),存在 \(\delta > 0\),使得对于所有 \(\mathbf{x} \in D\),只要 \(0 < \|\mathbf{x} - \mathbf{x}_0\| < \delta\),就有 \(|f(\mathbf{x}) - L| < \epsilon\)。这里 \(\|\mathbf{x} - \mathbf{x}_0\|\) 表示 \(\mathbf{x}\) 和 \(\mathbf{x}_0\) 之间的距离,通常使用欧几里得距离 (Euclidean distance),即
\[ \|\mathbf{x} - \mathbf{x}_0\| = \sqrt{\sum_{i=1}^n (x_i - x_{i,0})^2} \]
与一元函数极限类似,多元函数极限的定义也使用了 \(\epsilon-\delta\) 语言。需要注意的是,当 \(\mathbf{x}\) 趋近于 \(\mathbf{x}_0\) 时,\(\mathbf{x}\) 可以从各个方向趋近于 \(\mathbf{x}_0\)。这意味着,要证明多元函数极限存在,需要考虑所有可能的趋近路径。
例 7.1.1:考虑二元函数 \(f(x, y) = \frac{x^2 y}{x^2 + y^2}\),讨论当 \((x, y) \to (0, 0)\) 时的极限。
解:我们尝试用极坐标 (polar coordinates) 来分析。设 \(x = r \cos \theta\),\(y = r \sin \theta\),则当 \((x, y) \to (0, 0)\) 时,\(r \to 0\)。
\[ f(x, y) = f(r \cos \theta, r \sin \theta) = \frac{(r \cos \theta)^2 (r \sin \theta)}{(r \cos \theta)^2 + (r \sin \theta)^2} = \frac{r^3 \cos^2 \theta \sin \theta}{r^2 (\cos^2 \theta + \sin^2 \theta)} = r \cos^2 \theta \sin \theta \]
当 \(r \to 0\) 时,\(|f(x, y)| = |r \cos^2 \theta \sin \theta| \le r |\cos^2 \theta| |\sin \theta| \le r\)。
因此,对于任意 \(\epsilon > 0\),取 \(\delta = \epsilon\),当 \(0 < \sqrt{x^2 + y^2} = r < \delta\) 时,就有 \(|f(x, y) - 0| = |r \cos^2 \theta \sin \theta| \le r < \delta = \epsilon\)。
所以,\(\lim_{(x, y) \to (0, 0)} \frac{x^2 y}{x^2 + y^2} = 0\)。
例 7.1.2:考虑二元函数 \(f(x, y) = \frac{xy}{x^2 + y^2}\),讨论当 \((x, y) \to (0, 0)\) 时的极限。
解:我们尝试沿着不同的路径趋近于 \((0, 0)\)。
① 沿着 \(x\) 轴趋近,即 \(y = 0\),则 \(f(x, 0) = \frac{x \cdot 0}{x^2 + 0^2} = 0\),所以 \(\lim_{x \to 0} f(x, 0) = 0\)。
② 沿着 \(y\) 轴趋近,即 \(x = 0\),则 \(f(0, y) = \frac{0 \cdot y}{0^2 + y^2} = 0\),所以 \(\lim_{y \to 0} f(0, y) = 0\)。
③ 沿着直线 \(y = x\) 趋近,则 \(f(x, x) = \frac{x \cdot x}{x^2 + x^2} = \frac{x^2}{2x^2} = \frac{1}{2}\),所以 \(\lim_{x \to 0} f(x, x) = \frac{1}{2}\)。
由于沿着不同路径趋近于 \((0, 0)\) 时,极限值不同,因此 \(\lim_{(x, y) \to (0, 0)} \frac{xy}{x^2 + y^2}\) 不存在。
从例 7.1.2 可以看出,判断多元函数极限不存在的一个常用方法是路径逼近法 (path approach method)。如果沿着不同的路径趋近于某点时,函数极限值不同,则该点极限不存在。反之,如果沿着所有路径趋近于某点时,函数极限值都相同,也不能直接断定极限存在,还需要用 \(\epsilon-\delta\) 定义进行严格证明,或者使用其他方法。
7.1.2 多元函数的连续性 (Continuity of Multivariable Functions)
多元函数的连续性概念与一元函数类似,也是通过极限来定义的。
定义 7.1.2 (多元函数连续性的定义):设 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\),\(\mathbf{x}_0 \in D\)。如果 \(\lim_{\mathbf{x} \to \mathbf{x}_0} f(\mathbf{x}) = f(\mathbf{x}_0)\),则称函数 \(f\) 在点 \(\mathbf{x}_0\) 处连续 (continuous at point \(\mathbf{x}_0\))。如果 \(f\) 在 \(D\) 上每一点都连续,则称 \(f\) 在 \(D\) 上连续 (continuous on \(D\))。
根据极限的 \(\epsilon-\delta\) 定义,多元函数 \(f\) 在点 \(\mathbf{x}_0\) 处连续,意味着对于任意给定的 \(\epsilon > 0\),存在 \(\delta > 0\),使得对于所有 \(\mathbf{x} \in D\),只要 \( \|\mathbf{x} - \mathbf{x}_0\| < \delta\),就有 \(|f(\mathbf{x}) - f(\mathbf{x}_0)| < \epsilon\)。
与一元函数类似,多元连续函数也具有一些基本性质。
定理 7.1.1 (连续函数的四则运算):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\) 和 \(g: D \subseteq \mathbb{R}^n \to \mathbb{R}\) 在点 \(\mathbf{x}_0 \in D\) 处连续,\(c\) 为常数,则以下函数在点 \(\mathbf{x}_0\) 处也连续:
① \(f + g\)
② \(f - g\)
③ \(c f\)
④ \(f \cdot g\)
⑤ 若 \(g(\mathbf{x}_0) \neq 0\),则 \(\frac{f}{g}\)
这个定理的证明可以直接利用极限的四则运算性质以及连续性的定义得到。
定理 7.1.2 (复合函数的连续性):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}^m\) 在点 \(\mathbf{x}_0 \in D\) 处连续,函数 \(g: E \subseteq \mathbb{R}^m \to \mathbb{R}^p\),且 \(f(D) \subseteq E\),在点 \(\mathbf{y}_0 = f(\mathbf{x}_0)\) 处连续,则复合函数 \(g \circ f: D \subseteq \mathbb{R}^n \to \mathbb{R}^p\),\((g \circ f)(\mathbf{x}) = g(f(\mathbf{x}))\) 在点 \(\mathbf{x}_0\) 处连续。
这个定理表明,连续函数的复合仍然是连续函数。证明也基于极限的复合性质和连续性的定义。
例 7.1.3:判断函数 \(f(x, y) = \begin{cases} \frac{x^2 y}{x^2 + y^2}, & (x, y) \neq (0, 0) \\ 0, & (x, y) = (0, 0) \end{cases}\) 在 \((0, 0)\) 处是否连续。
解:在例 7.1.1 中我们已经证明了 \(\lim_{(x, y) \to (0, 0)} \frac{x^2 y}{x^2 + y^2} = 0\)。根据定义,\(f(0, 0) = 0\)。由于 \(\lim_{(x, y) \to (0, 0)} f(x, y) = f(0, 0) = 0\),因此函数 \(f(x, y)\) 在 \((0, 0)\) 处连续。
7.2 偏导数与全微分 (Partial Derivatives and Total Differential)
7.2.1 偏导数的定义 (Definition of Partial Derivative)
偏导数 (partial derivative) 是研究多元函数沿着坐标轴方向的变化率的概念。
定义 7.2.1 (偏导数的定义):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\),\(\mathbf{x}_0 = (x_{1,0}, x_{2,0}, \ldots, x_{n,0}) \in D\)。函数 \(f\) 对第 \(i\) 个变量 \(x_i\) 在 \(\mathbf{x}_0\) 处的偏导数定义为:
\[ \frac{\partial f}{\partial x_i}(\mathbf{x}_0) = \lim_{h \to 0} \frac{f(x_{1,0}, \ldots, x_{i,0} + h, \ldots, x_{n,0}) - f(x_{1,0}, \ldots, x_{i,0}, \ldots, x_{n,0})}{h} \]
如果极限存在,则称偏导数存在。偏导数也记作 \(f_{x_i}(\mathbf{x}_0)\) 或 \(D_i f(\mathbf{x}_0)\)。
计算偏导数时,将其他变量看作常数,只对当前变量求导即可。
例 7.2.1:计算函数 \(f(x, y) = x^3 y^2 + \sin(xy)\) 的偏导数 \(\frac{\partial f}{\partial x}\) 和 \(\frac{\partial f}{\partial y}\)。
解:
① 对 \(x\) 求偏导数,将 \(y\) 看作常数:
\[ \frac{\partial f}{\partial x} = \frac{\partial}{\partial x} (x^3 y^2 + \sin(xy)) = 3x^2 y^2 + \cos(xy) \cdot y = 3x^2 y^2 + y \cos(xy) \]
② 对 \(y\) 求偏导数,将 \(x\) 看作常数:
\[ \frac{\partial f}{\partial y} = \frac{\partial}{\partial y} (x^3 y^2 + \sin(xy)) = x^3 \cdot 2y + \cos(xy) \cdot x = 2x^3 y + x \cos(xy) \]
高阶偏导数 (higher-order partial derivatives) 可以通过对偏导数再次求偏导得到。例如,二阶偏导数有:
\[ \frac{\partial^2 f}{\partial x^2} = \frac{\partial}{\partial x} \left( \frac{\partial f}{\partial x} \right), \quad \frac{\partial^2 f}{\partial y^2} = \frac{\partial}{\partial y} \left( \frac{\partial f}{\partial y} \right) \]
\[ \frac{\partial^2 f}{\partial x \partial y} = \frac{\partial}{\partial x} \left( \frac{\partial f}{\partial y} \right), \quad \frac{\partial^2 f}{\partial y \partial x} = \frac{\partial}{\partial y} \left( \frac{\partial f}{\partial x} \right) \]
定理 7.2.1 (混合偏导数相等定理):如果函数 \(f(x, y)\) 的二阶混合偏导数 \(\frac{\partial^2 f}{\partial x \partial y}\) 和 \(\frac{\partial^2 f}{\partial y \partial x}\) 在区域 \(D\) 内连续,则在 \(D\) 内有 \(\frac{\partial^2 f}{\partial x \partial y} = \frac{\partial^2 f}{\partial y \partial x}\)。
这个定理表明,在一定条件下,混合偏导数的求导次序可以交换。
7.2.2 全微分的定义 (Definition of Total Differential)
全微分 (total differential) 是对多元函数微分概念的推广,它描述了函数值在各个方向上的线性近似变化。
定义 7.2.2 (全微分的定义):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\),\(\mathbf{x}_0 \in \text{int}(D)\)。如果存在 \(n\) 个常数 \(A_1, A_2, \ldots, A_n\),使得
\[ \Delta f = f(\mathbf{x}_0 + \Delta \mathbf{x}) - f(\mathbf{x}_0) = \sum_{i=1}^n A_i \Delta x_i + o(\|\Delta \mathbf{x}\|) \]
其中 \(\Delta \mathbf{x} = (\Delta x_1, \Delta x_2, \ldots, \Delta x_n)\),\(\|\Delta \mathbf{x}\| = \sqrt{\sum_{i=1}^n (\Delta x_i)^2}\),\(o(\|\Delta \mathbf{x}\|)\) 是当 \(\|\Delta \mathbf{x}\| \to 0\) 时比 \(\|\Delta \mathbf{x}\|\) 更高阶的无穷小,则称函数 \(f\) 在点 \(\mathbf{x}_0\) 处可微 (differentiable)。线性部分 \(d f(\mathbf{x}_0, \Delta \mathbf{x}) = \sum_{i=1}^n A_i \Delta x_i\) 称为函数 \(f\) 在点 \(\mathbf{x}_0\) 处的全微分,记作 \(d f(\mathbf{x}_0)\) 或 \(d f\)。
定理 7.2.2 (可微与偏导数的关系):如果函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\) 在点 \(\mathbf{x}_0\) 处可微,则 \(f\) 在 \(\mathbf{x}_0\) 处的所有偏导数都存在,且全微分可以表示为:
\[ d f(\mathbf{x}_0, \Delta \mathbf{x}) = \sum_{i=1}^n \frac{\partial f}{\partial x_i}(\mathbf{x}_0) \Delta x_i \]
即 \(A_i = \frac{\partial f}{\partial x_i}(\mathbf{x}_0)\)。
定理 7.2.3 (偏导数连续与可微的关系):如果函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\) 在点 \(\mathbf{x}_0\) 的某个邻域内存在对所有变量的偏导数,且这些偏导数在点 \(\mathbf{x}_0\) 处连续,则函数 \(f\) 在点 \(\mathbf{x}_0\) 处可微。
需要注意的是,偏导数存在不能保证函数可微,但偏导数连续可以保证函数可微。可微性强于偏导数存在性,弱于偏导数连续性。
例 7.2.2:讨论函数 \(f(x, y) = \begin{cases} \frac{xy}{\sqrt{x^2 + y^2}}, & (x, y) \neq (0, 0) \\ 0, & (x, y) = (0, 0) \end{cases}\) 在 \((0, 0)\) 处的可微性。
解:首先计算偏导数:
\[ \frac{\partial f}{\partial x}(0, 0) = \lim_{h \to 0} \frac{f(h, 0) - f(0, 0)}{h} = \lim_{h \to 0} \frac{\frac{h \cdot 0}{\sqrt{h^2 + 0^2}} - 0}{h} = \lim_{h \to 0} \frac{0}{h} = 0 \]
\[ \frac{\partial f}{\partial y}(0, 0) = \lim_{k \to 0} \frac{f(0, k) - f(0, 0)}{k} = \lim_{k \to 0} \frac{\frac{0 \cdot k}{\sqrt{0^2 + k^2}} - 0}{k} = \lim_{k \to 0} \frac{0}{k} = 0 \]
所以,偏导数 \(\frac{\partial f}{\partial x}(0, 0) = 0\) 和 \(\frac{\partial f}{\partial y}(0, 0) = 0\) 存在。
假设 \(f\) 在 \((0, 0)\) 处可微,则全微分应为 \(d f(0, 0) = \frac{\partial f}{\partial x}(0, 0) \Delta x + \frac{\partial f}{\partial y}(0, 0) \Delta y = 0\)。
我们需要验证 \(\Delta f = f(\Delta x, \Delta y) - f(0, 0) = f(\Delta x, \Delta y)\) 是否满足 \(\Delta f = o(\sqrt{(\Delta x)^2 + (\Delta y)^2})\)。
\[ \frac{|\Delta f|}{\sqrt{(\Delta x)^2 + (\Delta y)^2}} = \frac{|f(\Delta x, \Delta y)|}{\sqrt{(\Delta x)^2 + (\Delta y)^2}} = \frac{|\frac{\Delta x \Delta y}{\sqrt{(\Delta x)^2 + (\Delta y)^2}}|}{\sqrt{(\Delta x)^2 + (\Delta y)^2}} = \frac{|\Delta x \Delta y|}{(\Delta x)^2 + (\Delta y)^2} \]
取 \(\Delta y = \Delta x\),则 \(\frac{|\Delta x \Delta y|}{(\Delta x)^2 + (\Delta y)^2} = \frac{(\Delta x)^2}{2(\Delta x)^2} = \frac{1}{2} \neq 0\)。
因此,\(\lim_{(\Delta x, \Delta y) \to (0, 0)} \frac{|\Delta f|}{\sqrt{(\Delta x)^2 + (\Delta y)^2}} \neq 0\),即 \(\Delta f\) 不是 \(\sqrt{(\Delta x)^2 + (\Delta y)^2}\) 的高阶无穷小。
所以,函数 \(f(x, y)\) 在 \((0, 0)\) 处不可微。
7.3 多元复合函数的求导法则 (Chain Rule for Multivariable Functions)
链式法则 (chain rule) 是求复合函数导数的重要工具。在多元函数中,链式法则的形式更加多样。
定理 7.3.1 (多元复合函数链式法则 - 类型一):设函数 \(u = \varphi(t)\) 和 \(v = \psi(t)\) 在 \(t\) 处可导,函数 \(z = f(u, v)\) 在点 \((u, v) = (\varphi(t), \psi(t))\) 处可微,则复合函数 \(z = f(\varphi(t), \psi(t))\) 作为 \(t\) 的函数在 \(t\) 处可导,且
\[ \frac{dz}{dt} = \frac{\partial f}{\partial u} \frac{du}{dt} + \frac{\partial f}{\partial v} \frac{dv}{dt} \]
更一般地,设 \(u_i = \varphi_i(t)\) (\(i = 1, 2, \ldots, m\)) 在 \(t\) 处可导,函数 \(z = f(u_1, u_2, \ldots, u_m)\) 在点 \((u_1, u_2, \ldots, u_m) = (\varphi_1(t), \varphi_2(t), \ldots, \varphi_m(t))\) 处可微,则复合函数 \(z = f(\varphi_1(t), \varphi_2(t), \ldots, \varphi_m(t))\) 作为 \(t\) 的函数在 \(t\) 处可导,且
\[ \frac{dz}{dt} = \sum_{i=1}^m \frac{\partial f}{\partial u_i} \frac{du_i}{dt} \]
定理 7.3.2 (多元复合函数链式法则 - 类型二):设函数 \(u = \varphi(x, y)\) 和 \(v = \psi(x, y)\) 在点 \((x, y)\) 处对 \(x\) 和 \(y\) 具有偏导数,函数 \(z = f(u, v)\) 在点 \((u, v) = (\varphi(x, y), \psi(x, y))\) 处可微,则复合函数 \(z = f(\varphi(x, y), \psi(x, y))\) 作为 \(x, y\) 的函数在点 \((x, y)\) 处对 \(x\) 和 \(y\) 具有偏导数,且
\[ \frac{\partial z}{\partial x} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} \]
\[ \frac{\partial z}{\partial y} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} \]
更一般地,设 \(u_i = \varphi_i(x_1, x_2, \ldots, x_n)\) (\(i = 1, 2, \ldots, m\)) 在点 \(\mathbf{x} = (x_1, x_2, \ldots, x_n)\) 处对 \(x_j\) (\(j = 1, 2, \ldots, n\)) 具有偏导数,函数 \(z = f(u_1, u_2, \ldots, u_m)\) 在点 \(\mathbf{u} = (\varphi_1(\mathbf{x}), \varphi_2(\mathbf{x}), \ldots, \varphi_m(\mathbf{x}))\) 处可微,则复合函数 \(z = f(\varphi_1(\mathbf{x}), \varphi_2(\mathbf{x}), \ldots, \varphi_m(\mathbf{x}))\) 作为 \(\mathbf{x}\) 的函数在点 \(\mathbf{x}\) 处对 \(x_j\) 具有偏导数,且
\[ \frac{\partial z}{\partial x_j} = \sum_{i=1}^m \frac{\partial f}{\partial u_i} \frac{\partial u_i}{\partial x_j} \]
例 7.3.1:设 \(z = u^2 + v^2\),\(u = x \cos y\),\(v = x \sin y\),求 \(\frac{\partial z}{\partial x}\) 和 \(\frac{\partial z}{\partial y}\)。
解:根据链式法则:
\[ \frac{\partial z}{\partial x} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial x} = (2u) (\cos y) + (2v) (\sin y) = 2(x \cos y) \cos y + 2(x \sin y) \sin y = 2x (\cos^2 y + \sin^2 y) = 2x \]
\[ \frac{\partial z}{\partial y} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial y} = (2u) (-x \sin y) + (2v) (x \cos y) = 2(x \cos y) (-x \sin y) + 2(x \sin y) (x \cos y) = -2x^2 \cos y \sin y + 2x^2 \sin y \cos y = 0 \]
7.4 多元函数的极值 (Extrema of Multivariable Functions)
多元函数的极值问题 (extrema problem) 是指求函数在定义域内的最大值、最小值、极大值和极小值。
7.4.1 多元函数的极值定义 (Definition of Extrema for Multivariable Functions)
定义 7.4.1 (局部极大值与局部极小值):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\),\(\mathbf{x}_0 \in D\)。
① 如果存在 \(\mathbf{x}_0\) 的邻域 \(U \subseteq D\),使得对于所有 \(\mathbf{x} \in U\),都有 \(f(\mathbf{x}) \le f(\mathbf{x}_0)\),则称 \(f(\mathbf{x}_0)\) 为 \(f\) 的局部极大值 (local maximum value),\(\mathbf{x}_0\) 称为局部极大值点 (local maximum point)。
② 如果存在 \(\mathbf{x}_0\) 的邻域 \(U \subseteq D\),使得对于所有 \(\mathbf{x} \in U\),都有 \(f(\mathbf{x}) \ge f(\mathbf{x}_0)\),则称 \(f(\mathbf{x}_0)\) 为 \(f\) 的局部极小值 (local minimum value),\(\mathbf{x}_0\) 称为局部极小值点 (local minimum point)。
局部极大值和局部极小值统称为局部极值 (local extremum)。
定义 7.4.2 (全局最大值与全局最小值):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\),\(\mathbf{x}_0 \in D\)。
① 如果对于所有 \(\mathbf{x} \in D\),都有 \(f(\mathbf{x}) \le f(\mathbf{x}_0)\),则称 \(f(\mathbf{x}_0)\) 为 \(f\) 的全局最大值 (global maximum value) 或最大值 (maximum value),\(\mathbf{x}_0\) 称为全局最大值点 (global maximum point) 或最大值点 (maximum point)。
② 如果对于所有 \(\mathbf{x} \in D\),都有 \(f(\mathbf{x}) \ge f(\mathbf{x}_0)\),则称 \(f(\mathbf{x}_0)\) 为 \(f\) 的全局最小值 (global minimum value) 或最小值 (minimum value),\(\mathbf{x}_0\) 称为全局最小值点 (global minimum point) 或最小值点 (minimum point)。
全局最大值和全局最小值统称为全局极值 (global extremum) 或最值 (extremum)。
7.4.2 多元函数极值的必要条件 (Necessary Condition for Extrema)
定理 7.4.1 (费马定理 - 多元形式):设函数 \(f: D \subseteq \mathbb{R}^n \to \mathbb{R}\) 在点 \(\mathbf{x}_0 \in \text{int}(D)\) 处取得局部极值,且 \(f\) 在 \(\mathbf{x}_0\) 处可微,则 \(\nabla f(\mathbf{x}_0) = \mathbf{0}\),即所有偏导数都为零:
\[ \frac{\partial f}{\partial x_1}(\mathbf{x}_0) = \frac{\partial f}{\partial x_2}(\mathbf{x}_0) = \cdots = \frac{\partial f}{\partial x_n}(\mathbf{x}_0) = 0 \]
满足 \(\nabla f(\mathbf{x}) = \mathbf{0}\) 的点 \(\mathbf{x}\) 称为驻点 (stationary point) 或临界点 (critical point)。局部极值点一定是驻点,但驻点不一定是局部极值点。
7.4.3 多元函数极值的充分条件 (Sufficient Condition for Extrema)
为了判断驻点是否为极值点,需要使用二阶偏导数。对于二元函数 \(f(x, y)\),记
\[ f_{xx} = \frac{\partial^2 f}{\partial x^2}, \quad f_{yy} = \frac{\partial^2 f}{\partial y^2}, \quad f_{xy} = \frac{\partial^2 f}{\partial x \partial y} \]
定义判别式 (discriminant) \(D = D(x, y) = f_{xx} f_{yy} - (f_{xy})^2\)。
定理 7.4.2 (二元函数极值的第二充分条件):设函数 \(f(x, y)\) 在点 \((x_0, y_0)\) 的某邻域内具有二阶连续偏导数,且 \((x_0, y_0)\) 是 \(f\) 的驻点,即 \(\frac{\partial f}{\partial x}(x_0, y_0) = 0\) 且 \(\frac{\partial f}{\partial y}(x_0, y_0) = 0\)。令 \(A = f_{xx}(x_0, y_0)\),\(B = f_{xy}(x_0, y_0)\),\(C = f_{yy}(x_0, y_0)\),\(D = AC - B^2\)。
① 若 \(D > 0\) 且 \(A > 0\) (或 \(C > 0\)),则 \(f(x_0, y_0)\) 为局部极小值。
② 若 \(D > 0\) 且 \(A < 0\) (或 \(C < 0\)),则 \(f(x_0, y_0)\) 为局部极大值。
③ 若 \(D < 0\),则 \(f(x_0, y_0)\) 不是极值,\((x_0, y_0)\) 是鞍点 (saddle point)。
④ 若 \(D = 0\),则无法判断,需要进一步分析。
例 7.4.1:求函数 \(f(x, y) = x^3 - y^3 - 3xy\) 的极值。
解:
① 求偏导数并令其为零:
\[ \frac{\partial f}{\partial x} = 3x^2 - 3y = 0 \implies y = x^2 \]
\[ \frac{\partial f}{\partial y} = -3y^2 - 3x = 0 \implies x = -y^2 \]
联立方程组 \(y = x^2\) 和 \(x = -y^2\),得到 \(x = -(x^2)^2 = -x^4\),即 \(x^4 + x = 0\),\(x(x^3 + 1) = 0\)。
解得 \(x = 0\) 或 \(x = -1\)。
当 \(x = 0\) 时,\(y = 0^2 = 0\),得到驻点 \((0, 0)\)。
当 \(x = -1\) 时,\(y = (-1)^2 = 1\),得到驻点 \((-1, 1)\)。
② 计算二阶偏导数:
\[ f_{xx} = 6x, \quad f_{yy} = -6y, \quad f_{xy} = -3 \]
判别式 \(D = f_{xx} f_{yy} - (f_{xy})^2 = (6x)(-6y) - (-3)^2 = -36xy - 9\)。
③ 判断驻点类型:
对于驻点 \((0, 0)\),\(D(0, 0) = -9 < 0\),所以 \((0, 0)\) 是鞍点,\(f(0, 0)\) 不是极值。
对于驻点 \((-1, 1)\),\(D(-1, 1) = -36(-1)(1) - 9 = 36 - 9 = 27 > 0\),\(f_{xx}(-1, 1) = 6(-1) = -6 < 0\),所以 \(f(-1, 1)\) 是局部极大值。
局部极大值为 \(f(-1, 1) = (-1)^3 - 1^3 - 3(-1)(1) = -1 - 1 + 3 = 1\)。
本章我们初步介绍了多元函数微积分的基本概念,包括极限、连续性、偏导数、全微分、复合函数求导法则以及极值问题。这些概念是进一步学习多元函数微积分的基础。在后续章节中,我们将深入探讨多元函数的积分、向量场、曲线积分、曲面积分等内容。
8. chapter 8: 度量空间初步 (Introduction to Metric Spaces)
8.1 度量空间的概念 (Concept of Metric Space)
在数学分析的深入学习中,我们逐渐脱离了仅仅在实数 \(\mathbb{R}\) 或欧几里得空间 \(\mathbb{R}^n\) 中进行分析的局限。为了更广泛地研究“距离”和“邻近”的概念,我们引入了度量空间 (Metric Space) 的概念。度量空间是现代分析学,特别是泛函分析和拓扑学的基础。它提供了一个抽象的框架,使我们能够在更一般的集合上讨论极限、连续性、收敛性等核心概念。
定义 8.1.1 (度量空间 (Metric Space))
设 \(X\) 是一个非空集合。一个定义在 \(X \times X\) 上的函数 \(d: X \times X \to \mathbb{R}\) 被称为 \(X\) 上的 度量 (metric) 或 距离函数 (distance function),如果它满足以下性质:
① 非负性 (Non-negativity): 对于所有 \(x, y \in X\),\(d(x, y) \ge 0\)。
② 同一性 (Identity of indiscernibles): 对于所有 \(x, y \in X\),\(d(x, y) = 0\) 当且仅当 \(x = y\)。
③ 对称性 (Symmetry): 对于所有 \(x, y \in X\),\(d(x, y) = d(y, x)\)。
④ 三角不等式 (Triangle inequality): 对于所有 \(x, y, z \in X\),\(d(x, z) \le d(x, y) + d(y, z)\)。
如果 \(d\) 是 \(X\) 上的一个度量,则称 \((X, d)\) 为一个 度量空间 (metric space)。我们通常将 \(d(x, y)\) 称为点 \(x\) 和点 \(y\) 之间的 距离 (distance)。
例 8.1.2 (常见的度量空间 (Common Metric Spaces))
① 实数集 (Real Numbers) \(\mathbb{R}\):定义 \(d(x, y) = |x - y|\),其中 \(|\cdot|\) 是绝对值函数。容易验证,\(d\) 满足度量的四个性质。因此,\((\mathbb{R}, |\cdot - \cdot|)\) 是一个度量空间,称为 实数度量空间 (real number metric space) 或 标准实数空间 (standard real number space)。
② n 维欧几里得空间 (n-dimensional Euclidean Space) \(\mathbb{R}^n\): 对于 \(x = (x_1, x_2, \ldots, x_n)\) 和 \(y = (y_1, y_2, \ldots, y_n)\) 在 \(\mathbb{R}^n\) 中,定义 欧几里得度量 (Euclidean metric) 为:
\[ d_2(x, y) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} \]
或者 曼哈顿度量 (Manhattan metric) (也称为出租车度量 (taxicab metric)) 为:
\[ d_1(x, y) = \sum_{i=1}^{n} |x_i - y_i| \]
或者 无穷度量 (infinity metric) (或最大值度量 (maximum metric)) 为:
\[ d_\infty(x, y) = \max_{1 \le i \le n} |x_i - y_i| \]
可以证明,\(d_1\), \(d_2\), 和 \(d_\infty\) 都是 \(\mathbb{R}^n\) 上的度量。因此,\((\mathbb{R}^n, d_2)\) 是 欧几里得空间 (Euclidean space),而 \((\mathbb{R}^n, d_1)\) 和 \((\mathbb{R}^n, d_\infty)\) 也是度量空间。
③ 离散度量空间 (Discrete Metric Space):设 \(X\) 是任意非空集合,定义 离散度量 (discrete metric) \(d\) 为:
\[ d(x, y) = \begin{cases} 0, & \text{if } x = y \\ 1, & \text{if } x \ne y \end{cases} \]
容易验证,离散度量 \(d\) 满足度量的四个性质。因此,\((X, d)\) 是一个度量空间,称为 离散度量空间 (discrete metric space)。在离散度量空间中,只有当两点完全相同时,距离才为 0;否则,距离恒为 1。
④ 函数空间 (Function Space):考虑闭区间 \([a, b]\) 上的全体连续函数 \(C([a, b])\)。我们可以定义不同的度量,例如 一致度量 (uniform metric) (或上确界度量 (supremum metric)):
\[ d_\infty(f, g) = \sup_{x \in [a, b]} |f(x) - g(x)| \]
或者 \(L^p\) 度量 (\(L^p\) metric) (对于 \(p \ge 1\)):
\[ d_p(f, g) = \left( \int_a^b |f(x) - g(x)|^p dx \right)^{1/p} \]
其中 \(f, g \in C([a, b])\)。这些度量使得函数空间成为研究函数性质的重要场所。例如,\((C([a, b]), d_\infty)\) 是一个完备的度量空间(将在后续章节讨论完备性)。
度量空间的概念非常广泛,它不仅包括我们熟悉的欧几里得空间,还包括各种函数空间、序列空间等。通过度量空间,我们可以用统一的语言和方法来研究各种数学对象的“距离”和“邻近”性质,从而深入理解数学分析的核心思想。
8.2 度量空间中的基本拓扑概念 (Basic Topological Concepts in Metric Spaces)
在度量空间中,我们可以推广实数和欧几里得空间中的许多拓扑概念,如开集、闭集、收敛、完备性和紧致性。这些概念是理解度量空间结构的关键。
8.2.1 开集与闭集 (Open Sets and Closed Sets)
开集 (Open Set) 和 闭集 (Closed Set) 是拓扑学中最基本的概念。在度量空间中,我们可以借助度量的概念来定义开集和闭集。
定义 8.2.1.1 (开球 (Open Ball))
设 \((X, d)\) 是一个度量空间,\(x_0 \in X\),\(r > 0\)。集合
\[ B(x_0, r) = \{x \in X \mid d(x, x_0) < r \} \]
称为以 \(x_0\) 为中心,\(r\) 为半径的 开球 (open ball)。
定义 8.2.1.2 (开集 (Open Set))
设 \((X, d)\) 是一个度量空间,\(U \subseteq X\)。称 \(U\) 是 开集 (open set),如果对于任意 \(x \in U\),都存在 \(r > 0\),使得开球 \(B(x, r) \subseteq U\)。换句话说,\(U\) 中的每个点都是 \(U\) 的 内点 (interior point)。
例 8.2.1.3 (开集的例子 (Examples of Open Sets))
① 在实数空间 \(\mathbb{R}\) 中,对于 \(a < b\),开区间 \((a, b)\) 是开集。对于任意 \(x \in (a, b)\),取 \(r = \min\{x - a, b - x\}\),则 \(B(x, r) = (x - r, x + r) \subseteq (a, b)\)。
② 在欧几里得空间 \(\mathbb{R}^n\) 中,开球 \(B(x_0, r)\) 自身是开集。
③ 在任意度量空间 \((X, d)\) 中,全空间 \(X\) 和空集 \(\emptyset\) 都是开集。
定理 8.2.1.4 (开集的性质 (Properties of Open Sets))
设 \((X, d)\) 是一个度量空间。
① 任意多个开集的并集是开集。
② 有限个开集的交集是开集。
证明:
① 设 \(\{U_\alpha\}_{\alpha \in A}\) 是一族开集,令 \(U = \bigcup_{\alpha \in A} U_\alpha\)。对于任意 \(x \in U\),存在某个 \(\alpha_0 \in A\) 使得 \(x \in U_{\alpha_0}\)。由于 \(U_{\alpha_0}\) 是开集,存在 \(r > 0\) 使得 \(B(x, r) \subseteq U_{\alpha_0}\)。因为 \(U_{\alpha_0} \subseteq U\),所以 \(B(x, r) \subseteq U\)。因此,\(U\) 是开集。
② 设 \(U_1, U_2, \ldots, U_n\) 是有限个开集,令 \(V = \bigcap_{i=1}^{n} U_i\)。如果 \(V = \emptyset\),则 \(V\) 是开集。如果 \(V \ne \emptyset\),对于任意 \(x \in V\),则 \(x \in U_i\) 对所有 \(i = 1, 2, \ldots, n\) 成立。由于每个 \(U_i\) 都是开集,对于每个 \(i\),存在 \(r_i > 0\) 使得 \(B(x, r_i) \subseteq U_i\)。令 \(r = \min\{r_1, r_2, \ldots, r_n\} > 0\)。则对于任意 \(i\),\(B(x, r) \subseteq B(x, r_i) \subseteq U_i\)。因此,\(B(x, r) \subseteq \bigcap_{i=1}^{n} U_i = V\)。所以,\(V\) 是开集。
定义 8.2.1.5 (闭集 (Closed Set))
设 \((X, d)\) 是一个度量空间,\(F \subseteq X\)。称 \(F\) 是 闭集 (closed set),如果它的补集 \(X \setminus F\) 是开集。
例 8.2.1.6 (闭集的例子 (Examples of Closed Sets))
① 在实数空间 \(\mathbb{R}\) 中,对于 \(a \le b\),闭区间 \([a, b]\) 是闭集,因为其补集 \(\mathbb{R} \setminus [a, b] = (-\infty, a) \cup (b, \infty)\) 是两个开区间的并集,因此是开集。
② 在欧几里得空间 \(\mathbb{R}^n\) 中,闭球 \(\overline{B}(x_0, r) = \{x \in \mathbb{R}^n \mid d(x, x_0) \le r\}\) 是闭集。
③ 在任意度量空间 \((X, d)\) 中,全空间 \(X\) 和空集 \(\emptyset\) 都是闭集,因为它们的补集分别是 \(\emptyset\) 和 \(X\),都是开集。
定理 8.2.1.7 (闭集的性质 (Properties of Closed Sets))
设 \((X, d)\) 是一个度量空间。
① 任意多个闭集的交集是闭集。
② 有限个闭集的并集是闭集。
证明: 这些性质可以直接由开集的性质和德摩根定律 (De Morgan's laws) 得到。例如,对于性质 ①,设 \(\{F_\alpha\}_{\alpha \in A}\) 是一族闭集。则它们的补集 \(\{X \setminus F_\alpha\}_{\alpha \in A}\) 都是开集。根据开集的性质 ①,\(\bigcup_{\alpha \in A} (X \setminus F_\alpha)\) 是开集。由德摩根定律,
\[ \bigcup_{\alpha \in A} (X \setminus F_\alpha) = X \setminus \left( \bigcap_{\alpha \in A} F_\alpha \right) \]
因此,\(X \setminus \left( \bigcap_{\alpha \in A} F_\alpha \right)\) 是开集,这意味着 \(\bigcap_{\alpha \in A} F_\alpha\) 是闭集。性质 ② 的证明类似。
8.2.2 收敛与完备性 (Convergence and Completeness)
收敛性 (Convergence) 是分析学的核心概念之一。在度量空间中,我们可以自然地推广数列收敛的概念。
定义 8.2.2.1 (序列的收敛 (Convergence of a Sequence))
设 \((X, d)\) 是一个度量空间,\(\{x_n\}_{n=1}^\infty\) 是 \(X\) 中的一个序列。称序列 \(\{x_n\}\) 收敛于 (converges to) \(x \in X\),如果对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(n > N\) 时,有 \(d(x_n, x) < \epsilon\)。记作 \(\lim_{n \to \infty} x_n = x\) 或 \(x_n \to x\)。
例 8.2.2.2 (收敛序列的例子 (Examples of Convergent Sequences))
① 在实数空间 \(\mathbb{R}\) 中,序列 \(\{1/n\}_{n=1}^\infty\) 收敛于 0,因为对于任意 \(\epsilon > 0\),取 \(N = \lceil 1/\epsilon \rceil\),当 \(n > N\) 时,\(|1/n - 0| = 1/n < 1/N \le \epsilon\)。
② 在欧几里得空间 \(\mathbb{R}^n\) 中,序列 \(\{x^{(k)}\}_{k=1}^\infty\) 收敛于 \(x = (x_1, x_2, \ldots, x_n)\),当且仅当对于每个分量 \(i = 1, 2, \ldots, n\),序列 \(\{x_i^{(k)}\}_{k=1}^\infty\) 收敛于 \(x_i\)。
定义 8.2.2.3 (Cauchy 序列 (Cauchy Sequence))
设 \((X, d)\) 是一个度量空间,\(\{x_n\}_{n=1}^\infty\) 是 \(X\) 中的一个序列。称序列 \(\{x_n\}\) 是 Cauchy 序列 (Cauchy sequence),如果对于任意 \(\epsilon > 0\),存在正整数 \(N\),使得当 \(m, n > N\) 时,有 \(d(x_m, x_n) < \epsilon\)。
定理 8.2.2.4 (收敛序列是 Cauchy 序列 (Convergent Sequence is Cauchy Sequence))
在任意度量空间中,收敛序列一定是 Cauchy 序列。
证明: 设 \(\{x_n\}\) 收敛于 \(x\)。对于任意 \(\epsilon > 0\),存在 \(N\),当 \(n > N\) 时,\(d(x_n, x) < \epsilon/2\)。对于 \(m, n > N\),利用三角不等式,
\[ d(x_m, x_n) \le d(x_m, x) + d(x, x_n) < \epsilon/2 + \epsilon/2 = \epsilon \]
因此,\(\{x_n\}\) 是 Cauchy 序列。
反之,Cauchy 序列是否一定收敛呢?在实数 \(\mathbb{R}\) 中,我们知道 Cauchy 序列是收敛的。但在一 Arbitrary 度量空间中,情况并非总是如此。这就引出了完备性 (Completeness) 的概念。
定义 8.2.2.5 (完备度量空间 (Complete Metric Space))
称度量空间 \((X, d)\) 是 完备的 (complete),如果 \(X\) 中的每个 Cauchy 序列都收敛于 \(X\) 中的某个点。
例 8.2.2.6 (完备度量空间的例子 (Examples of Complete Metric Spaces))
① 实数空间 \(\mathbb{R}\) 是完备的。这是实数理论的一个基本定理。
② 欧几里得空间 \(\mathbb{R}^n\) 是完备的。
③ 闭区间 \([a, b]\) 上的连续函数空间 \((C([a, b]), d_\infty)\) (配备一致度量) 是完备的。
例 8.2.2.7 (非完备度量空间的例子 (Examples of Incomplete Metric Spaces))
① 有理数集 \(\mathbb{Q}\) 配备绝对值度量不是完备的。例如,考虑序列 \(\{x_n\}\) 定义为十进制展开式为 \(\sqrt{2}\) 的前 \(n\) 位小数的有理数,例如 \(x_1 = 1.4\), \(x_2 = 1.41\), \(x_3 = 1.414\), ...。这个序列在 \(\mathbb{Q}\) 中是 Cauchy 序列,但在 \(\mathbb{Q}\) 中不收敛(它收敛到 \(\sqrt{2} \notin \mathbb{Q}\))。
② 开区间 \((0, 1)\) 配备绝对值度量不是完备的。例如,序列 \(\{1/n\}_{n=2}^\infty\) 在 \((0, 1)\) 中是 Cauchy 序列,但在 \((0, 1)\) 中不收敛(它收敛到 \(0 \notin (0, 1)\))。
完备性是度量空间的一个非常重要的性质。在完备度量空间中,我们可以更方便地使用 Cauchy 序列来判断收敛性,这在理论分析和应用中都非常重要。
8.2.3 紧致性 (Compactness)
紧致性 (Compactness) 是拓扑学和分析学中另一个至关重要的概念。在实数 \(\mathbb{R}\) 中,闭区间上的有界闭集是紧致的(Heine-Borel 定理)。在一般的度量空间中,紧致性的定义和性质需要更仔细地考虑。
定义 8.2.3.1 (覆盖 (Cover))
设 \(S \subseteq X\),其中 \((X, d)\) 是一个度量空间。称一族开集 \(\{U_\alpha\}_{\alpha \in A}\) 是 \(S\) 的一个 开覆盖 (open cover),如果 \(S \subseteq \bigcup_{\alpha \in A} U_\alpha\)。
定义 8.2.3.2 (紧致集 (Compact Set))
设 \((X, d)\) 是一个度量空间,\(K \subseteq X\)。称 \(K\) 是 紧致的 (compact),如果 \(K\) 的每个开覆盖都存在有限子覆盖。也就是说,对于 \(K\) 的任意开覆盖 \(\{U_\alpha\}_{\alpha \in A}\),都存在有限个指标 \(\alpha_1, \alpha_2, \ldots, \alpha_n \in A\),使得 \(K \subseteq \bigcup_{i=1}^{n} U_{\alpha_i}\)。
例 8.2.3.3 (紧致集的例子 (Examples of Compact Sets))
① 在实数空间 \(\mathbb{R}\) 中,根据 Heine-Borel 定理,有界闭区间 \([a, b]\) 是紧致的。
② 在欧几里得空间 \(\mathbb{R}^n\) 中,根据 Heine-Borel 定理的推广,有界闭集是紧致的。例如,闭球 \(\overline{B}(x_0, r)\) 是紧致的。
③ 在任意度量空间 \((X, d)\) 中,有限点集是紧致的。
定理 8.2.3.4 (紧致集的性质 (Properties of Compact Sets))
① 度量空间中的紧致集一定是闭集。
② 度量空间中的紧致集一定是有界的。
③ 闭集的紧致子集是紧致的。
证明:
① 设 \(K\) 是 \(X\) 中的紧致集。要证明 \(K\) 是闭集,只需证明 \(X \setminus K\) 是开集。对于任意 \(x \in X \setminus K\),对于每个 \(y \in K\),\(d(x, y) > 0\)。考虑开球 \(B(y, d(x, y)/2)\) 和 \(B(x, d(x, y)/2)\)。对于每个 \(y \in K\),令 \(U_y = B(y, d(x, y)/2)\)。则 \(\{U_y\}_{y \in K}\) 是 \(K\) 的一个开覆盖。由于 \(K\) 是紧致的,存在有限子覆盖 \(U_{y_1}, U_{y_2}, \ldots, U_{y_n}\) 使得 \(K \subseteq \bigcup_{i=1}^{n} U_{y_i}\)。令 \(V_i = B(x, d(x, y_i)/2)\),并令 \(V = \bigcap_{i=1}^{n} V_i\)。则 \(V\) 是开集(有限个开集的交集是开集)。我们断言 \(V \subseteq X \setminus K\)。假设存在 \(z \in V \cap K\)。则 \(z \in K\),所以存在某个 \(i\) 使得 \(z \in U_{y_i} = B(y_i, d(x, y_i)/2)\)。同时 \(z \in V \subseteq V_i = B(x, d(x, y_i)/2)\)。因此,\(d(z, y_i) < d(x, y_i)/2\) 且 \(d(z, x) < d(x, y_i)/2\)。利用三角不等式,
\[ d(x, y_i) \le d(x, z) + d(z, y_i) < d(x, y_i)/2 + d(x, y_i)/2 = d(x, y_i) \]
这导致 \(d(x, y_i) < d(x, y_i)\) 的矛盾。因此,\(V \cap K = \emptyset\),即 \(V \subseteq X \setminus K\)。由于对于任意 \(x \in X \setminus K\),都存在开集 \(V\) 使得 \(x \in V \subseteq X \setminus K\),所以 \(X \setminus K\) 是开集,\(K\) 是闭集。
② 设 \(K\) 是 \(X\) 中的紧致集。固定一点 \(x_0 \in X\)。考虑开覆盖 \(\{B(x_0, n)\}_{n=1}^\infty\) of \(K\)。由于 \(K\) 是紧致的,存在有限子覆盖 \(B(x_0, n_1), B(x_0, n_2), \ldots, B(x_0, n_m)\)。令 \(N = \max\{n_1, n_2, \ldots, n_m\}\)。则 \(K \subseteq \bigcup_{i=1}^{m} B(x_0, n_i) \subseteq B(x_0, N)\)。因此,\(K\) 是有界的。
③ 设 \(C\) 是闭集,\(K \subseteq C\) 是紧致集。要证明 \(K\) 是紧致的,设 \(\{U_\alpha\}_{\alpha \in A}\) 是 \(K\) 的一个开覆盖。由于 \(K \subseteq C\),\(\{U_\alpha\}_{\alpha \in A}\) 也是 \(K\) 的开覆盖。因为 \(K\) 是紧致的,存在有限子覆盖 \(\{U_{\alpha_i}\}_{i=1}^n\) 覆盖 \(K\)。因此,\(K\) 是紧致的。
在度量空间中,紧致性与序列紧致性是等价的(虽然这里没有详细展开序列紧致性的定义,但这是一个重要的结果)。紧致集在分析学中具有许多重要的性质,例如,连续函数在紧致集上一致连续,以及连续函数在紧致集上可以取到最大值和最小值。这些性质使得紧致集在理论研究和应用中都扮演着关键角色。
9. chapter 9: 实分析的前沿与展望 (Frontiers and Prospects of Real Analysis)
9.1 Lebesgue 测度与积分简介 (Introduction to Lebesgue Measure and Integration)
在之前的章节中,我们深入探讨了基于 Riemann 积分的实分析理论。Riemann 积分对于许多函数都非常有效,尤其是在连续函数和分段连续函数的情形下。然而,Riemann 积分也存在局限性。例如,Dirichlet 函数,一个处处不连续的函数,在 Riemann 意义下是不可积的。为了克服这些局限性,并进一步拓展积分理论的应用范围,数学家们发展了 Lebesgue 测度与积分理论。Lebesgue 积分不仅扩展了可积函数的范围,也为现代分析学,特别是泛函分析 (Functional Analysis) 和概率论 (Probability Theory) 奠定了坚实的基础。
9.1.1 从 Riemann 积分到 Lebesgue 积分的动因 (Motivation from Riemann Integration to Lebesgue Integration)
Riemann 积分的核心思想是使用矩形来逼近函数图像下的面积。对于定义在闭区间 \([a, b]\) 上的有界函数 \(f(x)\),我们将区间 \([a, b]\) 分割成若干个小区间,在每个小区间上取一个样本点,并用函数在该样本点的值乘以小区间的长度作为小矩形的面积,然后将这些小矩形的面积求和,得到 Riemann 和。通过不断细化区间分割,如果 Riemann 和的极限存在,则定义为函数 \(f(x)\) 在 \([a, b]\) 上的 Riemann 积分。
Riemann 积分的局限性主要体现在以下几个方面:
① 可积函数范围的局限性:存在许多函数,例如 Dirichlet 函数,在 Riemann 意义下不可积,但在实际应用中,我们希望能够对更广泛的函数进行积分。Dirichlet 函数定义为:
\[ D(x) = \begin{cases} 1, & \text{如果 } x \in \mathbb{Q} \\ 0, & \text{如果 } x \notin \mathbb{Q} \end{cases} \]
其中 \(\mathbb{Q}\) 是有理数集。由于有理数和无理数在实数轴上都是稠密的,无论如何细分区间,每个小区间内都既包含有理数也包含无理数,导致 Riemann 和的上和与下和不相等,因此 Dirichlet 函数在 Riemann 意义下不可积。
② 极限运算的局限性:在研究函数序列的积分时,我们希望积分运算与极限运算可以交换顺序。例如,如果函数序列 \(\{f_n(x)\}\) 收敛到函数 \(f(x)\),我们希望有
\[ \lim_{n \to \infty} \int_a^b f_n(x) \, dx = \int_a^b \lim_{n \to \infty} f_n(x) \, dx = \int_a^b f(x) \, dx \]
然而,对于 Riemann 积分,这个等式并不总是成立。为了保证积分运算与极限运算的可交换性,我们需要更强大的积分理论。
Lebesgue 积分通过改变积分的思路,有效地克服了 Riemann 积分的局限性。Riemann 积分是基于对 \(x\) 轴的分割,而 Lebesgue 积分则是基于对 \(y\) 轴(函数值域)的分割。形象地说,Riemann 积分是“切西瓜”,将定义域切成小块,然后累加;Lebesgue 积分是“叠煎饼”,将值域切成薄片,然后累加。这种思路的转变,使得我们可以处理更复杂的函数,并得到更优良的性质。
9.1.2 Lebesgue 测度的基本思想 (Basic Ideas of Lebesgue Measure)
Lebesgue 测度是 Lebesgue 积分的基础。为了定义 Lebesgue 积分,首先需要定义 Lebesgue 测度,它可以看作是对“长度”概念的推广。对于简单的集合,如区间,其 Lebesgue 测度就是其长度。对于更复杂的集合,Lebesgue 测度提供了一种度量其“大小”的方式。
Lebesgue 测度的核心思想是外测度 (Outer Measure)。对于 \(\mathbb{R}\) 的任意子集 \(E\),其 Lebesgue 外测度 \(m^*(E)\) 定义为:
\[ m^*(E) = \inf \left\{ \sum_{k=1}^\infty l(I_k) : E \subseteq \bigcup_{k=1}^\infty I_k, I_k \text{ 是开区间} \right\} \]
其中 \(l(I_k)\) 表示开区间 \(I_k\) 的长度,\( \inf \) 表示下确界。这个定义意味着,我们用一列开区间覆盖集合 \(E\),所有开区间长度之和的下确界就是 \(E\) 的 Lebesgue 外测度。
基于外测度,我们可以定义 Lebesgue 可测集 (Lebesgue Measurable Set)。一个集合 \(E \subseteq \mathbb{R}\) 被称为 Lebesgue 可测的,如果对于任意集合 \(A \subseteq \mathbb{R}\),满足 Carathéodory 条件 (Carathéodory's condition):
\[ m^*(A) = m^*(A \cap E) + m^*(A \cap E^c) \]
其中 \(E^c = \mathbb{R} \setminus E\) 是 \(E\) 的补集。如果集合 \(E\) 是 Lebesgue 可测的,则其 Lebesgue 测度 \(m(E)\) 就定义为其 Lebesgue 外测度:\(m(E) = m^*(E)\)。
Lebesgue 测度具有以下重要性质:
① 非负性 (Non-negativity):对于任意 Lebesgue 可测集 \(E\),\(m(E) \ge 0\)。
② 可数可加性 (Countable Additivity):如果 \(\{E_k\}_{k=1}^\infty\) 是一列互不相交的 Lebesgue 可测集,则它们的并集 \(\bigcup_{k=1}^\infty E_k\) 也是 Lebesgue 可测的,且
\[ m\left( \bigcup_{k=1}^\infty E_k \right) = \sum_{k=1}^\infty m(E_k) \]
③ 平移不变性 (Translation Invariance):如果 \(E\) 是 Lebesgue 可测集,对于任意实数 \(x\),平移后的集合 \(E+x = \{y+x : y \in E\}\) 也是 Lebesgue 可测的,且 \(m(E+x) = m(E)\)。
④ 完备性 (Completeness):如果 \(m(E) = 0\),且 \(F \subseteq E\),则 \(F\) 也是 Lebesgue 可测的,且 \(m(F) = 0\)。
9.1.3 Lebesgue 积分的构造 (Construction of Lebesgue Integral)
有了 Lebesgue 测度的概念,我们就可以构造 Lebesgue 积分。Lebesgue 积分的构造通常分为几个步骤:
① 简单函数 (Simple Functions) 的积分:简单函数是指值域为有限个值的可测函数。设 \(\phi(x)\) 是一个简单函数,其标准表示为
\[ \phi(x) = \sum_{i=1}^n c_i \chi_{E_i}(x) \]
其中 \(c_i\) 是常数,\(E_i\) 是互不相交的可测集,\(\chi_{E_i}(x)\) 是 \(E_i\) 的特征函数 (Characteristic Function)。简单函数 \(\phi(x)\) 在集合 \(E\) 上的 Lebesgue 积分定义为
\[ \int_E \phi(x) \, dm = \sum_{i=1}^n c_i m(E \cap E_i) \]
② 非负可测函数 (Non-negative Measurable Functions) 的积分:对于非负可测函数 \(f(x) \ge 0\),其 Lebesgue 积分定义为
\[ \int_E f(x) \, dm = \sup \left\{ \int_E \phi(x) \, dm : 0 \le \phi(x) \le f(x), \phi(x) \text{ 是简单函数} \right\} \]
即非负可测函数 \(f(x)\) 的 Lebesgue 积分是所有小于等于 \(f(x)\) 的非负简单函数积分的上确界。
③ 一般可测函数 (General Measurable Functions) 的积分:对于一般的可测函数 \(f(x)\),我们可以将其分解为正部 \(f^+(x) = \max\{f(x), 0\}\) 和负部 \(f^-(x) = \max\{-f(x), 0\}\),则 \(f(x) = f^+(x) - f^-(x)\),且 \(f^+(x) \ge 0\),\(f^-(x) \ge 0\)。如果 \(\int_E f^+(x) \, dm\) 和 \(\int_E f^-(x) \, dm\) 至少有一个是有限的,则定义 \(f(x)\) 在 \(E\) 上的 Lebesgue 积分为
\[ \int_E f(x) \, dm = \int_E f^+(x) \, dm - \int_E f^-(x) \, dm \]
如果 \(\int_E |f(x)| \, dm = \int_E f^+(x) \, dm + \int_E f^-(x) \, dm < \infty\),则称 \(f(x)\) 在 \(E\) 上 Lebesgue 可积 (Lebesgue Integrable)。
Lebesgue 积分具有许多优良的性质,例如:
① 线性性 (Linearity):对于可积函数 \(f(x)\) 和 \(g(x)\),以及常数 \(a\) 和 \(b\),\(af(x) + bg(x)\) 也可积,且
\[ \int_E (af(x) + bg(x)) \, dm = a \int_E f(x) \, dm + b \int_E g(x) \, dm \]
② 单调性 (Monotonicity):如果 \(f(x) \le g(x)\) 几乎处处成立,则 \(\int_E f(x) \, dm \le \int_E g(x) \, dm\)。
③ 控制收敛定理 (Dominated Convergence Theorem):这是 Lebesgue 积分理论中最重要的定理之一。如果函数序列 \(\{f_n(x)\}\) 逐点收敛到 \(f(x)\),且存在可积函数 \(g(x)\) 使得 \(|f_n(x)| \le g(x)\) 几乎处处成立,则 \(f(x)\) 也可积,且
\[ \lim_{n \to \infty} \int_E f_n(x) \, dm = \int_E \lim_{n \to \infty} f_n(x) \, dm = \int_E f(x) \, dm \]
控制收敛定理为积分与极限的交换提供了强大的工具,在分析学和概率论中有着广泛的应用。
9.1.4 Lebesgue 积分与 Riemann 积分的比较 (Comparison between Lebesgue Integral and Riemann Integral)
Lebesgue 积分是 Riemann 积分的推广和发展。所有 Riemann 可积的函数都是 Lebesgue 可积的,且两种积分的值相等。但是,存在 Lebesgue 可积但 Riemann 不可积的函数,例如 Dirichlet 函数。因此,Lebesgue 积分的可积函数范围更广。
特性 (Characteristic) | Riemann 积分 (Riemann Integral) | Lebesgue 积分 (Lebesgue Integral) |
---|---|---|
分割方式 (Partition Method) | 定义域分割 (Domain Partition) (\(x\) 轴) | 值域分割 (Range Partition) (\(y\) 轴) |
可积函数范围 (Scope of Integrable Functions) | 连续函数、分段连续函数 (Continuous, Piecewise Continuous) | 更广泛,包括 Riemann 不可积函数 (Broader, Includes Non-Riemann Integrable Functions) |
收敛定理 (Convergence Theorems) | 收敛定理较弱,条件较苛刻 (Weaker Convergence Theorems, Stricter Conditions) | 控制收敛定理等强大收敛定理 (Powerful Convergence Theorems like Dominated Convergence Theorem) |
应用 (Applications) | 初等函数积分,几何计算 (Elementary Function Integration, Geometric Calculations) | 现代分析学、泛函分析、概率论 (Modern Analysis, Functional Analysis, Probability Theory) |
Lebesgue 积分的出现,极大地推动了现代分析学的发展。它不仅提供了一个更完善的积分理论,也为泛函分析、概率论等分支提供了重要的工具和基础。在后续的数学学习和研究中,Lebesgue 测度与积分将扮演越来越重要的角色。
9.2 实分析在现代数学中的地位与作用 (Status and Role of Real Analysis in Modern Mathematics)
实分析是现代数学的基石之一,它不仅是数学专业学生的核心课程,也是许多其他学科,如物理学、工程学、经济学等的重要数学基础。实分析以严格的逻辑推理为基础,深入研究实数、函数、极限、连续性、微分、积分等概念,构建起严谨的数学分析体系。在现代数学的各个领域,实分析都发挥着至关重要的作用。
9.2.1 实分析作为现代数学的基础 (Real Analysis as the Foundation of Modern Mathematics)
① 逻辑严谨性的训练:实分析课程强调公理化方法和严格的逻辑证明。从实数系统的公理出发,逐步建立起极限理论、连续性理论、微分积分理论等。这种严谨的逻辑训练,培养了学生的批判性思维和精确的数学表达能力,这对于从事任何科学研究都是至关重要的。
② 概念理解的深化:实分析深入剖析了微积分学中的基本概念,如极限、连续、微分、积分等。通过严格的定义和定理,澄清了初等微积分中可能存在的模糊认识,使学生对这些概念的理解更加深刻和透彻。这种深刻的概念理解,为后续学习更高级的数学课程打下了坚实的基础。
③ 方法论的启示:实分析中蕴含着丰富的数学思想和方法,例如 \(\epsilon-\delta\) 语言、反证法、数学归纳法、构造性证明等。这些方法不仅在实分析中广泛应用,也渗透到数学的其他分支,甚至科学研究的各个领域。学习实分析,不仅是学习知识,更是学习一种思考问题、解决问题的方法论。
9.2.2 实分析在其他数学分支中的应用 (Applications of Real Analysis in Other Branches of Mathematics)
① 泛函分析 (Functional Analysis):泛函分析是研究无穷维向量空间的分析学分支,它广泛应用于微分方程、量子力学、信号处理等领域。泛函分析的概念和理论,如 Banach 空间 (Banach Space)、Hilbert 空间 (Hilbert Space)、线性算子 (Linear Operator) 等,都深深根植于实分析的基础之上。Lebesgue 积分理论是泛函分析的重要工具,\(L^p\) 空间 ( \(L^p\) Space) 的理论更是泛函分析的核心内容。
② 概率论 (Probability Theory):现代概率论是建立在测度论基础上的严格数学理论,而测度论正是从 Lebesgue 测度发展而来。概率空间 (Probability Space) 的定义、随机变量 (Random Variable) 的概念、期望 (Expectation) 的计算、各种极限定理(如大数定律、中心极限定理)的证明,都离不开实分析的工具和方法。可以说,没有实分析,就没有现代概率论。
③ 微分方程 (Differential Equations):微分方程是描述自然规律的重要数学工具。偏微分方程 (Partial Differential Equations) 的理论,如椭圆型方程、抛物型方程、双曲型方程的研究,需要用到大量的实分析知识,如 Sobolev 空间 (Sobolev Space)、分布理论 (Distribution Theory)、变分法 (Variational Methods) 等。实分析为微分方程的研究提供了理论基础和分析工具。
④ 数值分析 (Numerical Analysis):数值分析是研究如何用数值方法近似求解数学问题的学科。数值分析的理论基础是实分析。例如,数值积分 (Numerical Integration) 方法的收敛性分析、数值微分 (Numerical Differentiation) 方法的误差估计、迭代法 (Iterative Method) 的收敛速度分析等,都需要用到实分析的极限理论、逼近理论、误差分析等方法。
⑤ 复分析 (Complex Analysis):复分析是研究复变函数 (Complex Variable Function) 的分析学分支。复分析与实分析既有联系又有区别。复分析中的许多概念和方法,如复数域的完备性、复函数的连续性、复函数的微分和积分等,都是实分析概念在复数域的推广。同时,复分析又有其独特的理论和方法,如 Cauchy 积分公式、留数定理等,这些理论在物理学、工程学等领域有着重要的应用。
除了以上列举的分支,实分析还在拓扑学 (Topology)、几何学 (Geometry)、调和分析 (Harmonic Analysis)、动力系统 (Dynamical Systems) 等众多数学领域中发挥着重要作用。可以说,实分析是现代数学的通用语言和基本工具,掌握实分析的理论和方法,是进入现代数学研究领域的必要条件。
9.2.3 实分析在其他学科中的应用 (Applications of Real Analysis in Other Disciplines)
① 物理学 (Physics):物理学是高度数学化的学科,许多物理理论都用数学语言来描述。实分析为物理学提供了重要的数学工具。例如,经典力学 (Classical Mechanics) 中的变分原理、量子力学 (Quantum Mechanics) 中的 Hilbert 空间理论、热力学 (Thermodynamics) 中的偏微分方程、流体力学 (Fluid Mechanics) 中的 Navier-Stokes 方程等,都离不开实分析的应用。
② 工程学 (Engineering):工程学的各个领域,如电子工程、机械工程、土木工程、化学工程等,都需要用到实分析的知识。信号处理 (Signal Processing) 中的 Fourier 分析 (Fourier Analysis)、控制理论 (Control Theory) 中的稳定性分析、图像处理 (Image Processing) 中的偏微分方程方法、金融工程 (Financial Engineering) 中的随机微积分 (Stochastic Calculus) 等,都与实分析密切相关。
③ 经济学 (Economics):现代经济学越来越依赖数学模型。实分析为经济学提供了分析工具。例如,经济学中的最优化问题 (Optimization Problem)、均衡分析 (Equilibrium Analysis)、动态规划 (Dynamic Programming)、金融模型 (Financial Model) 等,都需要用到实分析的理论和方法。
④ 计算机科学 (Computer Science):计算机科学的某些领域也需要用到实分析。例如,算法分析 (Algorithm Analysis) 中的复杂度分析、机器学习 (Machine Learning) 中的优化算法、计算机图形学 (Computer Graphics) 中的曲线曲面拟合、数值计算 (Numerical Computation) 中的误差分析等,都与实分析有关。
总而言之,实分析不仅是数学学科的核心组成部分,也是连接数学与其他科学领域的桥梁。它以其严谨的逻辑体系、深刻的概念理解、有效的方法论启示,为现代科学技术的发展提供了强大的理论支撑和工具保障。
9.3 实分析的未来发展趋势 (Future Development Trends of Real Analysis)
实分析作为一个成熟的数学分支,其基本理论框架已经建立完善。然而,随着数学自身的发展以及与其他学科的交叉融合,实分析仍然面临着新的挑战和机遇,展现出蓬勃的生命力。未来的实分析将继续在理论深度和应用广度两个方面不断拓展。
9.3.1 理论深度拓展 (Expansion of Theoretical Depth)
① 非线性分析 (Nonlinear Analysis):传统的实分析主要研究线性问题,而非线性现象在自然界和社会生活中普遍存在。非线性分析是研究非线性算子、非线性方程、非线性系统的理论和方法。非线性泛函分析、非线性偏微分方程、分形几何 (Fractal Geometry)、混沌理论 (Chaos Theory) 等都是非线性分析的重要组成部分。未来的实分析将更加重视非线性问题的研究,发展更有效的非线性分析工具。
② 无限维分析 (Infinite Dimensional Analysis):传统的实分析主要研究有限维空间上的问题,而现代数学和物理学中,无限维空间的问题越来越重要。无限维分析是研究无限维空间上的分析学,如无限维微分流形 (Infinite Dimensional Differentiable Manifold)、无限维 Lie 群 (Infinite Dimensional Lie Group)、随机分析 (Stochastic Analysis) 等。泛函分析是无限维分析的基础,未来的实分析将更加深入地研究无限维空间上的分析问题。
③ 奇异性分析 (Singularity Analysis):奇异性 (Singularity) 是指数学对象的不光滑点或不规则行为。奇异性分析是研究数学对象奇异性的理论和方法。例如,偏微分方程解的奇异性、动力系统中的奇异吸引子 (Strange Attractor)、几何形状的奇异点等。奇异性分析在物理学、工程学、计算机科学等领域有着广泛的应用。未来的实分析将更加关注奇异性问题的研究,发展更精细的奇异性分析工具。
④ 多尺度分析 (Multiscale Analysis):自然界和社会现象往往具有多尺度特征,即在不同尺度下呈现出不同的规律。多尺度分析是研究多尺度现象的数学理论和方法。小波分析 (Wavelet Analysis)、调和分析 (Harmonic Analysis)、粗糙路径理论 (Rough Path Theory) 等都是多尺度分析的重要组成部分。多尺度分析在信号处理、图像处理、流体力学、金融工程等领域有着广泛的应用。未来的实分析将更加重视多尺度问题的研究,发展更有效的多尺度分析工具。
9.3.2 应用广度拓展 (Expansion of Application Breadth)
① 大数据分析 (Big Data Analysis):大数据时代,数据量呈爆炸式增长,如何从海量数据中提取有价值的信息,成为一个重要的挑战。实分析为大数据分析提供了理论基础和方法工具。例如,机器学习中的优化算法、统计学习理论 (Statistical Learning Theory) 中的泛化能力分析、数据降维 (Dimensionality Reduction) 中的流形学习 (Manifold Learning) 等,都与实分析密切相关。未来的实分析将更加深入地应用于大数据分析领域,发展更高效的数据分析方法。
② 人工智能 (Artificial Intelligence):人工智能是当前科技发展的前沿领域。深度学习 (Deep Learning) 是人工智能的核心技术之一。深度学习的数学基础是优化理论、概率论、线性代数和实分析。例如,深度神经网络的优化算法、泛化能力分析、稳定性分析等,都需要用到实分析的知识。未来的实分析将更加深入地应用于人工智能领域,为人工智能的发展提供理论支撑。
③ 生物数学 (Mathematical Biology):生物数学是运用数学方法研究生物现象的交叉学科。生物数学的模型构建、动力学分析、参数估计、优化控制等,都需要用到实分析的工具。例如,种群动力学模型 (Population Dynamics Model)、流行病传播模型 (Epidemic Spreading Model)、生物网络模型 (Biological Network Model) 等,都与实分析密切相关。未来的实分析将更加深入地应用于生物数学领域,为生命科学的研究提供数学方法。
④ 金融数学 (Financial Mathematics):金融数学是运用数学方法研究金融问题的学科。金融衍生品定价 (Financial Derivatives Pricing)、风险管理 (Risk Management)、投资组合优化 (Portfolio Optimization)、金融市场建模 (Financial Market Modeling) 等,都需要用到实分析的理论和方法。随机微积分 (Stochastic Calculus) 是金融数学的重要工具,而随机微积分正是建立在 Lebesgue 积分理论基础上的。未来的实分析将更加深入地应用于金融数学领域,为金融市场的稳定和发展提供理论支持。
⑤ 量子信息 (Quantum Information):量子信息是研究量子力学规律下的信息处理的学科。量子计算 (Quantum Computing)、量子通信 (Quantum Communication)、量子密码学 (Quantum Cryptography) 等都是量子信息的重要组成部分。泛函分析、算子代数 (Operator Algebra)、非交换几何 (Noncommutative Geometry) 等实分析的分支,在量子信息理论中有着重要的应用。未来的实分析将更加深入地应用于量子信息领域,为量子科技的发展提供数学基础。
总而言之,实分析的未来发展将呈现出理论深度和应用广度并驾齐驱的趋势。一方面,实分析将继续深化对非线性、无限维、奇异性、多尺度等复杂数学问题的研究,拓展理论的边界;另一方面,实分析将更加广泛地应用于大数据分析、人工智能、生物数学、金融数学、量子信息等新兴科技领域,发挥其在现代科学技术发展中的重要作用。实分析的未来充满活力,值得期待。