• 文件浏览器
  • 000 数学 (Mathematics)的知识框架 001 《逻辑与集合论:基础、理论与前沿》 002 《数论基础:原理与方法 (Foundations of Number Theory: Principles and Methods)》 003 《初等代数:系统精讲与深度应用 (Elementary Algebra: Systematic Elucidation and In-depth Applications)》 004 《线性代数:理论、方法与应用深度解析 (Linear Algebra: In-depth Analysis of Theory, Methods, and Applications)》 005 《抽象代数:全面解析与深度探索》 006 《数论:从基础到前沿的全面解析》 007 《代数几何:全面解析与前沿探索》 008 《欧几里得几何学:原理、证明与应用全面解析》 009 《非欧几何:从基础到前沿》 010 《微分几何:理论、方法与应用 (Differential Geometry: Theory, Methods, and Applications)》 011 《拓扑学:基础、理论与应用 (Topology: Foundations, Theory, and Applications)》 012 《分形几何:原理、分析与应用》 013 《数学分析:原理、方法与应用 (Mathematical Analysis: Principles, Methods, and Applications)》 014 《实分析之美:从基础到前沿 (The Beauty of Real Analysis: From Foundations to Frontiers)》 015 《复分析:理论、方法与应用 (Complex Analysis: Theory, Methods, and Applications)》 016 《现代泛函分析:理论、方法与应用》 017 《微分方程:理论、方法与应用 (Differential Equations: Theory, Methods, and Applications)》 018 《数值分析:原理、方法与实践 (Numerical Analysis: Principles, Methods, and Practice)》 019 《组合数学:原理、方法与应用 (Combinatorics: Principles, Methods, and Applications)》 020 《图论:系统性深度解析 (Graph Theory: A Systematic and In-depth Analysis)》 021 《计算机科学逻辑:原理、技术与应用》 022 《离散概率:原理、方法与应用 (Discrete Probability: Principles, Methods, and Applications)》 023 《概率论:全面深度解析 (Probability Theory: A Comprehensive and In-depth Analysis)》 024 《数理统计:原理、方法与应用 (Mathematical Statistics: Principles, Methods, and Applications)》 025 《随机过程:理论、方法与应用》 026 《数学物理方程:原理、方法与应用 (Mathematical Physics Equations: Principles, Methods, and Applications)》 027 《优化理论:全面与深度解析 (Optimization Theory: A Comprehensive and In-depth Analysis)》 028 《控制理论:原理、分析与设计 (Control Theory: Principles, Analysis, and Design)》 029 《运筹学:理论、方法与应用 (Operations Research: Theory, Methodology and Applications)》 030 《计算数学:原理、方法与应用 (Computational Mathematics: Principles, Methods, and Applications)》 031 《生物数学:理论、模型与应用 (Biomathematics: Theory, Models, and Applications)》 032 《金融数学:原理、模型与应用 (Financial Mathematics: Principles, Models, and Applications)》 033 《现代密码学原理与实践 (Modern Cryptography: Principles and Practice)》 034 《数学思想与方法全面深度解析》

    002 《数论基础:原理与方法 (Foundations of Number Theory: Principles and Methods)》


    作者Lou Xiao, gemini创建时间2025-04-19 01:52:53更新时间2025-04-19 01:52:53

    🌟🌟🌟本文案由Gemini 2.5 Flash Preview 04-17创作,用来辅助学习知识。🌟🌟🌟

    书籍大纲

    ▮▮▮▮ 1. chapter 导论 (Introduction)
    ▮▮▮▮▮▮▮ 1.1 什么是数论? (What is Number Theory?)
    ▮▮▮▮▮▮▮ 1.2 数论的历史回顾 (Historical Overview of Number Theory)
    ▮▮▮▮▮▮▮ 1.3 本书的结构与阅读建议 (Structure of the Book and Reading Suggestions)
    ▮▮▮▮▮▮▮ 1.4 数学归纳法 (Mathematical Induction) - 数论中的基本证明工具 (Basic Proof Tool in Number Theory)
    ▮▮▮▮ 2. chapter 整除理论 (Theory of Divisibility)
    ▮▮▮▮▮▮▮ 2.1 整除的概念与性质 (Concept and Properties of Divisibility)
    ▮▮▮▮▮▮▮ 2.2 欧几里得算法 (Euclidean Algorithm)
    ▮▮▮▮▮▮▮ 2.3 最大公约数 (Greatest Common Divisor, GCD) 与 最小公倍数 (Least Common Multiple, LCM)
    ▮▮▮▮▮▮▮ 2.4 裴蜀定理 (Bézout's Identity)
    ▮▮▮▮ 3. chapter 素数 (Prime Numbers)
    ▮▮▮▮▮▮▮ 3.1 素数与合数 (Prime and Composite Numbers) 的定义
    ▮▮▮▮▮▮▮ 3.2 算术基本定理 (Fundamental Theorem of Arithmetic) - 唯一分解定理 (Unique Factorization Theorem)
    ▮▮▮▮▮▮▮ 3.3 素数的无穷性 (Infinitude of Primes)
    ▮▮▮▮▮▮▮ 3.4 素数分布的初步认识 (Preliminary Understanding of Prime Distribution)
    ▮▮▮▮ 4. chapter 同余 (Congruences)
    ▮▮▮▮▮▮▮ 4.1 同余的概念与基本性质 (Concept and Basic Properties of Congruences)
    ▮▮▮▮▮▮▮ 4.2 剩余类 (Residue Classes) 与 完全剩余系 (Complete Residue System)
    ▮▮▮▮▮▮▮ 4.3 简化剩余系 (Reduced Residue System)
    ▮▮▮▮▮▮▮ 4.4 线性同余方程 (Linear Congruence Equations)
    ▮▮▮▮▮▮▮ 4.5 中国剩余定理 (Chinese Remainder Theorem, CRT)
    ▮▮▮▮ 5. chapter 重要的同余定理 (Important Congruence Theorems)
    ▮▮▮▮▮▮▮ 5.1 费马小定理 (Fermat's Little Theorem)
    ▮▮▮▮▮▮▮ 5.2 欧拉定理 (Euler's Theorem) 与 欧拉函数 (Euler's Totient Function, Phi Function)
    ▮▮▮▮▮▮▮ 5.3 威尔逊定理 (Wilson's Theorem)
    ▮▮▮▮▮▮▮ 5.4 伪素数 (Pseudoprimes) 与 卡迈克尔数 (Carmichael Numbers)
    ▮▮▮▮ 6. chapter 算术函数 (Arithmetic Functions)
    ▮▮▮▮▮▮▮ 6.1 算术函数的定义与例子 (Definition and Examples of Arithmetic Functions)
    ▮▮▮▮▮▮▮ 6.2 积性函数 (Multiplicative Functions)
    ▮▮▮▮▮▮▮ 6.3 莫比乌斯函数 (Möbius Function) 与 莫比乌斯反演公式 (Möbius Inversion Formula)
    ▮▮▮▮▮▮▮ 6.4 除数函数 (Divisor Function) 与 和函数 (Sum of Divisors Function)
    ▮▮▮▮ 7. chapter 原根与指标 (Primitive Roots and Indices)
    ▮▮▮▮▮▮▮ 7.1 整数的阶 (Order of an Integer) 模 n
    ▮▮▮▮▮▮▮ 7.2 原根 (Primitive Root) 的定义与存在性 (Existence)
    ▮▮▮▮▮▮▮ 7.3 存在原根的模 (Moduli Having Primitive Roots)
    ▮▮▮▮▮▮▮ 7.4 指标 (Index) 的概念与性质
    ▮▮▮▮ 8. chapter 二次剩余与二次互反律 (Quadratic Residues and Quadratic Reciprocity)
    ▮▮▮▮▮▮▮ 8.1 二次剩余 (Quadratic Residue) 与 二次非剩余 (Quadratic Non-residue)
    ▮▮▮▮▮▮▮ 8.2 勒让德符号 (Legendre Symbol)
    ▮▮▮▮▮▮▮ 8.3 勒让德符号的性质 (Properties of Legendre Symbol)
    ▮▮▮▮▮▮▮ 8.4 二次互反律 (Law of Quadratic Reciprocity)
    ▮▮▮▮▮▮▮ 8.5 雅可比符号 (Jacobi Symbol)
    ▮▮▮▮ 9. chapter 丢番图方程 (Diophantine Equations)
    ▮▮▮▮▮▮▮ 9.1 线性丢番图方程 (Linear Diophantine Equations)
    ▮▮▮▮▮▮▮ 9.2 勾股数组 (Pythagorean Triples)
    ▮▮▮▮▮▮▮ 9.3 佩尔方程 (Pell's Equation) 的介绍
    ▮▮▮▮▮▮▮ 9.4 一些非线性丢番图方程的例子 (Examples of Some Nonlinear Diophantine Equations)
    ▮▮▮▮ 10. chapter 连分数 (Continued Fractions) (进阶主题 - Advanced Topic)
    ▮▮▮▮▮▮▮ 10.1 有限连分数 (Finite Continued Fractions)
    ▮▮▮▮▮▮▮ 10.2 无限连分数 (Infinite Continued Fractions)
    ▮▮▮▮▮▮▮ 10.3 连分数与最佳逼近 (Continued Fractions and Best Approximations)
    ▮▮▮▮▮▮▮ 10.4 连分数与佩尔方程的解 (Continued Fractions and Solutions to Pell's Equation)
    ▮▮▮▮ 11. chapter 代数数论初步 (Introduction to Algebraic Number Theory) (进阶主题 - Advanced Topic)
    ▮▮▮▮▮▮▮ 11.1 代数整数 (Algebraic Integers) 的概念
    ▮▮▮▮▮▮▮ 11.2 代数数域 (Algebraic Number Fields) 的初步认识
    ▮▮▮▮▮▮▮ 11.3 理想 (Ideals) 的概念 (Motivation)
    ▮▮▮▮ 12. chapter 解析数论初步 (Introduction to Analytic Number Theory) (进阶主题 - Advanced Topic)
    ▮▮▮▮▮▮▮ 12.1 素数定理 (Prime Number Theorem) 的陈述 (Statement)
    ▮▮▮▮▮▮▮ 12.2 黎曼ζ函数 (Riemann Zeta Function) 的介绍
    ▮▮▮▮▮▮▮ 12.3 Dirichlet 级数 (Dirichlet Series)
    ▮▮▮▮▮▮▮ 附录 A:符号与术语表 (Glossary of Symbols and Terms)
    ▮▮▮▮▮▮▮ 附录 B:常用定理与公式汇总 (Summary of Common Theorems and Formulas)
    ▮▮▮▮▮▮▮ 附录 C:部分习题解答或提示 (Solutions or Hints for Selected Exercises)
    ▮▮▮▮▮▮▮ 附录 D:参考文献 (References)
    ▮▮▮▮▮▮▮ 附录 E:进一步阅读建议 (Suggestions for Further Reading)


    1. chapter 导论 (Introduction)

    欢迎来到数论的奇妙世界!数论,顾名思义,是关于整数的学问。它研究整数的性质、它们之间的关系以及涉及整数的方程。这门学科历史悠久,问题看似简单,却往往蕴含着深刻的理论和巨大的挑战。从古希腊的毕达哥拉斯学派对数的神秘崇拜,到现代密码学中基于大素数的安全体系,数论始终是数学领域中最迷人、最活跃的分支之一。

    本书旨在为读者提供一个系统、全面且深入的数论基础知识框架。无论您是初次接触数论的初学者,希望建立坚实基础;还是已有一定了解的进阶学习者,希望深化理解;亦或是寻求特定主题参考的专家,本书都力求满足您的需求。我们将从最基本的整除概念出发,逐步深入到素数、同余、算术函数、二次剩余等核心主题,并对一些进阶领域如连分数、代数数论和解析数论进行初步介绍。

    学习数论不仅仅是掌握定理和证明,更是一种思维方式的训练。它鼓励我们提出问题、探索模式、进行严谨的逻辑推理。希望通过本书的学习,您能体会到数论的魅力,培养对数学的兴趣,并提升分析和解决问题的能力。

    1.1 什么是数论? (What is Number Theory?)

    数论 (Number Theory),有时也被称为高等算术 (Higher Arithmetic),是纯粹数学 (Pure Mathematics) 的一个分支,主要研究整数 (Integers) 的性质。整数集合通常记为 \(\mathbb{Z} = \{..., -2, -1, 0, 1, 2, ...\}\)。然而,数论的核心关注点往往集中在自然数 (Natural Numbers),即正整数 \(\mathbb{N} = \{1, 2, 3, ...\}\) 或非负整数 \(\{0, 1, 2, 3, ...\}\),具体取决于不同的约定和研究领域。

    数论所研究的问题通常涉及整数的加法、减法、乘法以及最重要的——整除 (Divisibility)。一些典型的数论问题包括:

    ⚝ 素数 (Prime Numbers) 的性质:什么是素数?素数有多少个?它们是如何分布的?是否存在一个公式可以生成所有素数?(例如,著名的黎曼猜想 (Riemann Hypothesis) 就与素数的分布密切相关)。
    ⚝ 整除关系:一个整数能否被另一个整数整除?如何找到两个整数的最大公约数 (Greatest Common Divisor, GCD) 或最小公倍数 (Least Common Multiple, LCM)?
    ⚝ 同余 (Congruences):整数在模 (Modulo) 一个固定整数下的余数有什么性质?这在密码学中有广泛应用。
    ⚝ 丢番图方程 (Diophantine Equations):寻找具有整数解 (Integer Solutions) 的多项式方程。例如,著名的费马大定理 (Fermat's Last Theorem) 就是关于方程 \(x^n + y^n = z^n\) 在 \(n > 2\) 时没有非零整数解的问题。
    ⚝ 算术函数 (Arithmetic Functions):研究定义在正整数上、取值为复数的函数,它们通常与整数的算术性质有关,例如欧拉函数 (Euler's Totient Function) \(\phi(n)\) 计算小于等于 \(n\) 且与 \(n\) 互素的正整数个数。

    数论的魅力在于其问题的表述往往非常简单易懂,甚至小学生都能理解,但解决这些问题所需的工具和技巧却可能极其复杂和深刻。许多数论问题至今仍未解决,是数学研究的前沿领域。

    尽管数论起源于对整数本身纯粹的好奇和探索,但它在现代科学技术中扮演着越来越重要的角色。最显著的应用领域是密码学 (Cryptography),特别是公钥密码系统 (Public-Key Cryptosystems),如 RSA 算法,其安全性就依赖于大整数分解 (Integer Factorization) 的困难性,这是一个典型的数论问题。此外,数论还在计算机科学 (Computer Science)、编码理论 (Coding Theory) 等领域有重要应用。

    1.2 数论的历史回顾 (Historical Overview of Number Theory)

    数论的历史几乎与人类文明一样古老。对整数性质的探索可以追溯到古代文明。

    古代 (Ancient Times)
    ▮ 古巴比伦 (Ancient Babylonians) 和 古埃及 (Ancient Egyptians) 就已经研究了涉及整数的方程,例如著名的普林顿 322 (Plimpton 322) 泥板就包含了勾股数组 (Pythagorean Triples) 的列表。
    ▮ 古希腊 (Ancient Greeks) 对数论做出了系统性的贡献。
    ▮▮ 毕达哥拉斯学派 (Pythagoreans) 对整数赋予了神秘的意义,研究了完全数 (Perfect Numbers)、亲和数 (Amicable Numbers) 等概念。
    ▮▮ 欧几里得 (Euclid) 在其巨著《几何原本》(Elements) 的第七卷到第九卷中,系统地阐述了整除、素数、最大公约数(欧几里得算法)等基本概念和定理,并证明了素数有无穷多个。
    ▮ 丢番图 (Diophantus of Alexandria) 在其著作《算术》(Arithmetica) 中研究了求解有理数解的多项式方程,这些方程后来被称为丢番图方程。

    中世纪与文艺复兴 (Middle Ages and Renaissance)
    ▮ 在欧洲数学相对沉寂的时期,印度 (India) 和 阿拉伯世界 (Arab World) 的数学家们在数论方面取得了一些进展,例如婆什迦罗二世 (Bhaskara II) 研究了佩尔方程 (Pell's Equation)。
    ▮ 文艺复兴时期,欧洲数学复苏,一些数学家开始重新关注数论问题。

    费马时代 (Fermat's Era)
    ▮ 17世纪,皮埃尔·德·费马 (Pierre de Fermat) 开启了现代数论的先河。他是一位业余数学家,但提出了许多深刻的定理和猜想,包括费马小定理 (Fermat's Little Theorem)、费马大定理(他声称找到了证明,但未公布,成为困扰数学家三百多年的难题)、关于形如 \(2^{2^n} + 1\) 的数的素性猜想(费马数 (Fermat Numbers))。他的工作激发了后来的数学家。

    欧拉与高斯时代 (Euler and Gauss's Era)
    ▮ 18世纪,莱昂哈德·欧拉 (Leonhard Euler) 是数论领域的巨匠。他证明了费马提出的许多猜想,引入了欧拉函数 \(\phi(n)\),研究了二次剩余 (Quadratic Residues),并发现了许多重要的恒等式。
    ▮ 19世纪初,卡尔·弗里德里希·高斯 (Carl Friedrich Gauss) 在其划时代的著作《算术研究》(Disquisitiones Arithmeticae) 中,系统地整理和发展了数论,引入了同余的记号 \(a \equiv b \pmod{m}\),证明了二次互反律 (Law of Quadratic Reciprocity),并将数论从零散的定理集合提升为一门系统的科学。这本书奠定了现代数论的基础。

    现代数论 (Modern Number Theory)
    ▮ 19世纪末和20世纪,数论进一步发展,形成了多个分支:
    ▮▮ 代数数论 (Algebraic Number Theory):将数论问题置于代数数域 (Algebraic Number Fields) 的框架下研究,引入了理想 (Ideals) 等概念,用于解决费马大定理等问题。代表人物有库默尔 (Ernst Kummer)、戴德金 (Richard Dedekind)、希尔伯特 (David Hilbert)。
    ▮▮ 解析数论 (Analytic Number Theory):利用复变函数论 (Complex Analysis) 和微积分 (Calculus) 的工具研究数论问题,特别是素数的分布。代表人物有黎曼 (Bernhard Riemann)(黎曼ζ函数)、哈达玛 (Jacques Hadamard) 和 普赛 (Charles de la Vallée Poussin)(素数定理 (Prime Number Theorem))。
    ▮▮ 计算数论 (Computational Number Theory):研究数论算法,例如素性测试 (Primality Testing)、因数分解 (Integer Factorization) 算法。随着计算机的发展而兴起。
    ▮ 20世纪末,安德鲁·怀尔斯 (Andrew Wiles) 证明了费马大定理,这是数论史上的一个里程碑事件,综合运用了代数数论、椭圆曲线 (Elliptic Curves) 和模形式 (Modular Forms) 等现代数学工具。

    数论的历史是一部充满天才思想、深刻洞察和艰苦探索的历史。它不断提出新的问题,发展新的工具,并与其他数学分支乃至应用领域紧密结合。

    1.3 本书的结构与阅读建议 (Structure of the Book and Reading Suggestions)

    本书的结构设计旨在循序渐进地引导读者掌握数论的基础知识,并对一些进阶主题有所了解。全书共分为12章和若干附录:

    基础部分 (Chapters 1-9)
    ▮ 第1章:导论,介绍数论的概况、历史和基本证明工具(数学归纳法)。
    ▮ 第2章:整除理论,讲解整除、欧几里得算法、最大公约数和裴蜀定理。
    ▮ 第3章:素数,介绍素数的定义、算术基本定理、素数的无穷性。
    ▮ 第4章:同余,引入同余的概念、剩余类、线性同余方程和中国剩余定理。
    ▮ 第5章:重要的同余定理,讲解费马小定理、欧拉定理、威尔逊定理等。
    ▮ 第6章:算术函数,介绍常见的算术函数、积性函数和莫比乌斯反演。
    ▮ 第7章:原根与指标,讨论整数的阶、原根的存在性及其性质。
    ▮ 第8章:二次剩余与二次互反律,介绍二次剩余、勒让德符号和二次互反律。
    ▮ 第9章:丢番图方程,初步探讨线性丢番图方程、勾股数组和佩尔方程。

    这部分内容构成了经典数论的核心基础,适合所有希望学习数论的读者。建议按照章节顺序系统学习。

    进阶部分 (Chapters 10-12)
    ▮ 第10章:连分数,介绍连分数理论及其在最佳逼近和佩尔方程中的应用。
    ▮ 第11章:代数数论初步,简要介绍代数整数、代数数域和理想的概念。
    ▮ 第12章:解析数论初步,简要介绍素数定理、黎曼ζ函数和Dirichlet级数。

    这部分内容是经典数论向现代数论的延伸,属于进阶主题。读者可以根据自己的兴趣和需求选择阅读。对于初学者,可以先略过这部分,在掌握基础后回过头来学习。

    附录 (Appendices A-E)
    ▮ 附录A:符号与术语表,方便读者查阅书中使用的数学符号和术语。
    ▮ 附录B:常用定理与公式汇总,便于复习和查阅。
    ▮ 附录C:部分习题解答或提示,帮助读者检验学习效果。
    ▮ 附录D:参考文献,列出本书引用的或推荐的进一步阅读材料。
    ▮ 附录E:进一步阅读建议,为有兴趣深入研究的读者提供方向。

    阅读建议

    对于初学者 (Beginners)
    ▮ 建议从头开始,按章节顺序仔细阅读基础部分 (Chapters 1-9)。
    ▮ 理解每个定义和定理的含义,不要急于求成。
    ▮ 务必动手完成书中的例子和习题,这是掌握知识的关键。
    ▮ 如果遇到困难,可以参考附录C的提示或解答,但最好先独立思考。
    ▮ 进阶部分可以先略过,待基础扎实后再回头学习。

    对于进阶学习者 (Intermediate)
    ▮ 您可以快速回顾基础部分,重点关注自己不熟悉的章节或定理。
    ▮ 深入理解定理的证明过程,尝试自己独立完成证明。
    ▮ 挑战更具难度的习题。
    ▮ 尝试阅读进阶部分 (Chapters 10-12),了解现代数论的一些基本思想和工具。

    对于专家 (Experts)
    ▮ 本书的基础部分可以作为回顾或参考。
    ▮ 进阶部分可以提供一些基本概念的梳理。
    ▮ 您可能会对附录D和E中的参考文献和进一步阅读建议更感兴趣,它们可以引导您深入特定研究领域。

    无论您的水平如何,学习数论都需要耐心和毅力。数学是实践的学科,多做题、多思考、多讨论是提高水平的必由之路。祝您在数论的学习旅程中收获满满! 🚀

    1.4 数学归纳法 (Mathematical Induction) - 数论中的基本证明工具 (Basic Proof Tool in Number Theory)

    在数论中,我们经常需要证明关于所有正整数(或某个范围内的整数)的命题。数学归纳法 (Mathematical Induction) 是证明这类命题的强大工具。它基于自然数的良序性原理 (Well-Ordering Principle),即任何非空的正整数子集都有一个最小元。

    数学归纳法原理可以表述如下:

    假设 \(P(n)\) 是一个关于正整数 \(n\) 的命题。如果满足以下两个条件:

    基础步骤 (Base Case):命题 \(P(n_0)\) 对于某个起始正整数 \(n_0\) 成立(通常 \(n_0 = 1\) 或 \(n_0 = 0\),取决于命题的范围)。
    归纳步骤 (Inductive Step):假设命题 \(P(k)\) 对于某个正整数 \(k \ge n_0\) 成立(这个假设称为归纳假设 (Inductive Hypothesis)),能够证明命题 \(P(k+1)\) 也成立。

    那么,命题 \(P(n)\) 对于所有正整数 \(n \ge n_0\) 都成立。

    这个原理就像多米诺骨牌效应:如果第一块骨牌倒下(基础步骤),并且每一块骨牌倒下都能推倒下一块(归纳步骤),那么所有的骨牌都会倒下。

    证明示例

    我们用数学归纳法证明一个简单的数论相关命题:对于所有正整数 \(n\), \(6\) 整除 \(n^3 - n\)。

    设命题 \(P(n)\) 为 "\(\(6\) 整除 \(n^3 - n\))"。

    基础步骤 (Base Case)
    当 \(n = 1\) 时,\(n^3 - n = 1^3 - 1 = 1 - 1 = 0\)。因为 \(0 = 6 \times 0\),所以 \(6\) 整除 \(0\)。
    命题 \(P(1)\) 成立。

    归纳步骤 (Inductive Step)
    假设命题 \(P(k)\) 对于某个正整数 \(k \ge 1\) 成立,即 \(6\) 整除 \(k^3 - k\)。
    这意味着存在一个整数 \(m\),使得 \(k^3 - k = 6m\)。
    现在我们需要证明命题 \(P(k+1)\) 成立,即 \(6\) 整除 \((k+1)^3 - (k+1)\)。
    考虑 \((k+1)^3 - (k+1)\):
    \[ \begin{aligned} (k+1)^3 - (k+1) &= (k^3 + 3k^2 + 3k + 1) - (k+1) \\ &= k^3 + 3k^2 + 2k \\ &= (k^3 - k) + 3k^2 + 3k \\ &= (k^3 - k) + 3k(k+1) \end{aligned} \]
    根据归纳假设,\(k^3 - k\) 可以被 \(6\) 整除。
    现在我们来看 \(3k(k+1)\)。注意到 \(k\) 和 \(k+1\) 是两个连续的整数,所以其中一个必须是偶数。因此,\(k(k+1)\) 是偶数,可以被 \(2\) 整除。
    所以,\(k(k+1) = 2j\) 对于某个整数 \(j\)。
    那么 \(3k(k+1) = 3(2j) = 6j\)。
    这表明 \(3k(k+1)\) 可以被 \(6\) 整除。
    因此,\((k+1)^3 - (k+1) = (k^3 - k) + 3k(k+1)\) 是两个可以被 \(6\) 整除的数的和,所以它也可以被 \(6\) 整除。
    即 \(6\) 整除 \((k+1)^3 - (k+1)\)。
    命题 \(P(k+1)\) 成立。

    根据数学归纳法原理,命题 \(P(n)\) 对于所有正整数 \(n \ge 1\) 都成立。

    数学归纳法的变体

    强归纳法 (Strong Induction):在归纳步骤中,假设命题 \(P(i)\) 对于所有 \(n_0 \le i \le k\) 都成立,然后证明 \(P(k+1)\) 成立。这有时在证明依赖于前面所有情况的命题时非常有用,例如证明算术基本定理(唯一分解定理)。
    从 \(n\) 到 \(n-1\) 的归纳法 (Backward Induction):证明命题对于无穷多个值成立,然后证明如果命题对于某个值成立,那么对于前一个值也成立。

    数学归纳法是数论证明中最基础和最常用的工具之一。熟练掌握它对于后续章节的学习至关重要。在本书后续内容中,我们将频繁使用数学归纳法来证明各种定理。

    2. chapter 整除理论 (Theory of Divisibility)

    欢迎来到数论基础的学习!在第一章中,我们对数论有了一个初步的认识,并回顾了数学归纳法这一重要的证明工具。现在,我们将深入探索数论中最基本也是最重要的概念之一:整除。整除理论是整个数论大厦的基石,它为我们理解整数的结构和性质提供了框架。本章将系统地介绍整除的概念、性质,以及与之相关的核心算法和定理,包括欧几里得算法、最大公约数与最小公倍数、以及裴蜀定理。这些内容不仅是理论学习的基础,也是解决许多实际问题和进一步学习数论高级主题的关键。

    2.1 整除的概念与性质 (Concept and Properties of Divisibility)

    整除是整数之间的一种基本关系。直观地说,一个整数能被另一个非零整数整除,意味着前一个整数是后一个整数的整数倍。

    2.1.1 整除的定义 (Definition of Divisibility)

    定义 2.1 设 \( a \) 和 \( b \) 是两个整数,其中 \( a \neq 0 \)。如果存在一个整数 \( k \),使得 \( b = ak \),则称 \( a \) 整除 \( b \),记作 \( a | b \)。此时,我们也说 \( b \) 是 \( a \) 的倍数 (multiple),\( a \) 是 \( b \) 的约数 (divisor) 或因数 (factor)。如果 \( a \) 不整除 \( b \),则记作 \( a \nmid b \)。

    例子 2.1
    ⚝ \( 3 | 6 \) 因为 \( 6 = 3 \times 2 \),其中 \( k=2 \) 是整数。
    ⚝ \( -4 | 12 \) 因为 \( 12 = (-4) \times (-3) \),其中 \( k=-3 \) 是整数。
    ⚝ \( 7 | 0 \) 因为 \( 0 = 7 \times 0 \),其中 \( k=0 \) 是整数。注意,任何非零整数都整除 \( 0 \)。
    ⚝ \( 5 \nmid 12 \) 因为不存在整数 \( k \) 使得 \( 12 = 5k \)。

    需要强调的是,在定义中我们要求 \( a \neq 0 \)。这是因为如果允许 \( a=0 \),则 \( b = 0 \times k = 0 \),这意味着只有当 \( b=0 \) 时 \( 0 \) 才“整除” \( b \)。然而,在这种情况下,任何整数 \( k \) 都满足 \( 0 = 0 \times k \),导致 \( k \) 不唯一,这与我们通常对整除的理解不符,并且会在后续的许多定理中引入麻烦。因此,我们约定除数 (divisor) 不能为零。

    2.1.2 整除的基本性质 (Basic Properties of Divisibility)

    基于整除的定义,我们可以推导出一些重要的基本性质。设 \( a, b, c \) 都是整数。

    自反性 (Reflexivity): 如果 \( a \neq 0 \),则 \( a | a \)。
    ▮▮▮▮证明:因为 \( a = a \times 1 \),取 \( k=1 \),所以 \( a | a \)。

    传递性 (Transitivity): 如果 \( a | b \) 且 \( b | c \) (其中 \( a \neq 0, b \neq 0 \)),则 \( a | c \)。
    ▮▮▮▮证明:由 \( a | b \),存在整数 \( k_1 \) 使得 \( b = ak_1 \)。由 \( b | c \),存在整数 \( k_2 \) 使得 \( c = bk_2 \)。将第一个等式代入第二个等式,得 \( c = (ak_1)k_2 = a(k_1 k_2) \)。由于 \( k_1, k_2 \) 都是整数,所以 \( k_1 k_2 \) 也是整数。因此,根据定义,\( a | c \)。

    线性性 (Linearity): 如果 \( a | b \) 且 \( a | c \) (其中 \( a \neq 0 \)),则对于任意整数 \( x \) 和 \( y \),有 \( a | (bx + cy) \)。
    ▮▮▮▮证明:由 \( a | b \),存在整数 \( k_1 \) 使得 \( b = ak_1 \)。由 \( a | c \),存在整数 \( k_2 \) 使得 \( c = ak_2 \)。考虑 \( bx + cy \):
    ▮▮▮▮\[ bx + cy = (ak_1)x + (ak_2)y = a(k_1 x) + a(k_2 y) = a(k_1 x + k_2 y) \]
    ▮▮▮▮由于 \( k_1, x, k_2, y \) 都是整数,所以 \( k_1 x + k_2 y \) 也是整数。因此,根据定义,\( a | (bx + cy) \)。
    ▮▮▮▮⚝ 这个性质表明,如果一个数整除另外两个数,那么它也整除它们的任意整数线性组合 (integer linear combination)。

    倍数性质 (Multiple Property): 如果 \( a | b \) (其中 \( a \neq 0 \)),则对于任意非零整数 \( c \),有 \( ac | bc \)。
    ▮▮▮▮证明:由 \( a | b \),存在整数 \( k \) 使得 \( b = ak \)。将等式两边同乘以 \( c \),得 \( bc = (ak)c = (ac)k \)。由于 \( c \neq 0 \),所以 \( ac \neq 0 \)。根据定义,\( ac | bc \)。

    符号性质 (Sign Property): 如果 \( a | b \) (其中 \( a \neq 0 \)),则 \( |a| | |b| \)。反之亦然。
    ▮▮▮▮证明:由 \( a | b \),存在整数 \( k \) 使得 \( b = ak \)。取绝对值,\( |b| = |ak| = |a| |k| \)。由于 \( b \neq 0 \),则 \( k \neq 0 \),所以 \( |k| \ge 1 \) 是一个正整数。令 \( k' = |k| \),则 \( |b| = |a| k' \),其中 \( k' \) 是正整数。根据定义,\( |a| | |b| \)。
    ▮▮▮▮反之,如果 \( |a| | |b| \),则存在整数 \( k' \) 使得 \( |b| = |a| k' \)。
    ▮▮▮▮⚝ 如果 \( a, b \) 同号,则 \( b = ak' \),所以 \( a | b \)。
    ▮▮▮▮⚝ 如果 \( a, b \) 异号,则 \( -b = ak' \) 或 \( b = -ak' \),即 \( b = a(-k') \),所以 \( a | b \)。
    ▮▮▮▮⚝ 如果 \( b=0 \),则 \( |b|=0 \),\( |a| | 0 \),显然 \( a | 0 \)。
    ▮▮▮▮因此,\( a | b \) 当且仅当 \( |a| | |b| \)。这个性质告诉我们,在讨论整除时,通常可以只考虑正整数。

    比较性质 (Comparison Property): 如果 \( a | b \) (其中 \( a \neq 0, b \neq 0 \)),则 \( |a| \le |b| \)。
    ▮▮▮▮证明:由 \( a | b \),存在整数 \( k \) 使得 \( b = ak \)。由于 \( b \neq 0 \),所以 \( k \neq 0 \)。因此 \( |k| \ge 1 \)。取绝对值,\( |b| = |a| |k| \)。因为 \( |k| \ge 1 \),所以 \( |a| |k| \ge |a| \times 1 = |a| \)。即 \( |b| \ge |a| \)。

    这些基本性质构成了整除理论的基础,它们在后续的证明和计算中会频繁使用。

    2.1.3 带余除法 (The Division Algorithm)

    带余除法是整数算术中最基本也是最重要的定理之一。尽管名字中带有“算法”,但它实际上是一个存在性定理。

    定理 2.1 (带余除法) 设 \( a \) 是一个整数,\( b \) 是一个正整数。则存在唯一的整数 \( q \) 和 \( r \),使得 \( a = bq + r \),其中 \( 0 \le r < b \)。
    ▮▮▮▮⚝ 在这个等式中,\( q \) 称为商 (quotient),\( r \) 称为余数 (remainder)。

    证明 (存在性):
    考虑集合 \( S = \{ a - bk \mid k \in \mathbb{Z}, a - bk \ge 0 \} \)。
    ⚝ 如果 \( a \ge 0 \),取 \( k=0 \),则 \( a - b \times 0 = a \ge 0 \),所以 \( a \in S \),\( S \) 非空。
    ⚝ 如果 \( a < 0 \),取 \( k = a \)。由于 \( b \ge 1 \),则 \( -bk \ge -ak \)。如果 \( a \) 是负数,\( -a \) 是正数。取 \( k=a \),则 \( a - ba = a(1-b) \)。如果 \( b \ge 1 \),则 \( 1-b \le 0 \),\( a(1-b) \ge 0 \)。例如,取 \( k \) 足够小,比如 \( k = \lfloor a/b \rfloor - 1 \)。或者更简单地,取 \( k \) 为一个足够大的负数,例如 \( k = a \)。则 \( a - bk = a - ba = a(1-b) \)。如果 \( b \ge 1 \),则 \( 1-b \le 0 \),而 \( a < 0 \),所以 \( a(1-b) \ge 0 \)。因此 \( S \) 非空。
    根据良序原理 (Well-Ordering Principle),非空非负整数集合 \( S \) 必有最小元。设这个最小元为 \( r \)。由 \( r \in S \),存在整数 \( q \) 使得 \( r = a - bq \),且 \( r \ge 0 \)。
    现在我们需要证明 \( r < b \)。假设 \( r \ge b \)。则 \( r - b \ge 0 \)。考虑 \( a - b(q+1) = a - bq - b = r - b \)。由于 \( r - b \ge 0 \),所以 \( r - b \in S \)。但是 \( r - b < r \) (因为 \( b > 0 \)),这与 \( r \) 是 \( S \) 中的最小元矛盾。因此,假设 \( r \ge b \) 不成立,必有 \( r < b \)。
    所以,存在整数 \( q \) 和 \( r \),使得 \( a = bq + r \) 且 \( 0 \le r < b \)。

    证明 (唯一性):
    假设存在两对整数 \( (q_1, r_1) \) 和 \( (q_2, r_2) \),满足
    \( a = bq_1 + r_1 \),其中 \( 0 \le r_1 < b \)
    \( a = bq_2 + r_2 \),其中 \( 0 \le r_2 < b \)
    则 \( bq_1 + r_1 = bq_2 + r_2 \),移项得 \( b(q_1 - q_2) = r_2 - r_1 \)。
    这表明 \( b \) 整除 \( r_2 - r_1 \)。
    同时,由 \( 0 \le r_1 < b \) 和 \( 0 \le r_2 < b \),可得 \( -b < r_2 - r_1 < b \)。
    即 \( |r_2 - r_1| < b \)。
    我们有 \( b | (r_2 - r_1) \) 且 \( |r_2 - r_1| < b \)。根据整除的比较性质 (性质⑥),如果一个非零整数整除另一个非零整数,则前者的绝对值小于等于后者的绝对值。这里 \( b > 0 \)。如果 \( r_2 - r_1 \neq 0 \),则 \( b \le |r_2 - r_1| \),这与 \( |r_2 - r_1| < b \) 矛盾。
    因此,必有 \( r_2 - r_1 = 0 \),即 \( r_1 = r_2 \)。
    将 \( r_1 = r_2 \) 代回 \( b(q_1 - q_2) = r_2 - r_1 \),得 \( b(q_1 - q_2) = 0 \)。由于 \( b \neq 0 \),所以 \( q_1 - q_2 = 0 \),即 \( q_1 = q_2 \)。
    所以,整数 \( q \) 和 \( r \) 是唯一的。

    带余除法是数论中许多概念和算法的基础,例如欧几里得算法、同余等。

    2.2 欧几里得算法 (Euclidean Algorithm)

    欧几里得算法,也称为辗转相除法,是求解两个非负整数最大公约数 (GCD) 的一种高效算法。它是数学中最古老的算法之一,出现在欧几里得的《几何原本》中。

    2.2.1 算法原理 (Principle of the Algorithm)

    欧几里得算法的核心原理基于以下性质:
    性质 2.1 设 \( a \) 和 \( b \) 是两个整数,且 \( b \neq 0 \)。如果 \( a = bq + r \),则 \( \text{gcd}(a, b) = \text{gcd}(b, r) \)。
    ▮▮▮▮⚝ 其中 \( \text{gcd}(a, b) \) 表示 \( a \) 和 \( b \) 的最大公约数。

    证明:
    我们需要证明 \( a \) 和 \( b \) 的公约数集合与 \( b \) 和 \( r \) 的公约数集合相同。
    设 \( d \) 是 \( a \) 和 \( b \) 的任意一个公约数。则 \( d | a \) 且 \( d | b \)。
    由 \( a = bq + r \),可得 \( r = a - bq \)。
    由于 \( d | a \) 且 \( d | b \),根据整除的线性性 (性质③),\( d \) 整除 \( a - bq \),即 \( d | r \)。
    所以,\( d \) 也是 \( b \) 和 \( r \) 的公约数。

    反之,设 \( d' \) 是 \( b \) 和 \( r \) 的任意一个公约数。则 \( d' | b \) 且 \( d' | r \)。
    由 \( a = bq + r \)。
    由于 \( d' | b \) 且 \( d' | r \),根据整除的线性性 (性质③),\( d' \) 整除 \( bq + r \),即 \( d' | a \)。
    所以,\( d' \) 也是 \( a \) 和 \( b \) 的公约数。

    因此,\( a \) 和 \( b \) 的公约数集合与 \( b \) 和 \( r \) 的公约数集合完全相同。由于最大公约数是公约数集合中最大的那个数,所以 \( \text{gcd}(a, b) = \text{gcd}(b, r) \)。

    2.2.2 算法步骤 (Algorithm Steps)

    利用性质 2.1,我们可以通过反复应用带余除法来逐步减小参与计算的数字,直到余数为零。

    假设我们要计算非负整数 \( a \) 和 \( b \) 的最大公约数,其中至少一个不为零。不失一般性,设 \( a \ge b \ge 0 \)。
    ① 如果 \( b = 0 \),则 \( \text{gcd}(a, 0) = a \)。算法终止。
    ② 如果 \( b > 0 \),对 \( a \) 和 \( b \) 应用带余除法,得到 \( a = bq_1 + r_1 \),其中 \( 0 \le r_1 < b \)。
    ③ 根据性质 2.1,\( \text{gcd}(a, b) = \text{gcd}(b, r_1) \)。
    ④ 现在问题转化为计算 \( b \) 和 \( r_1 \) 的最大公约数。重复步骤 ① 和 ②,对 \( b \) 和 \( r_1 \) 应用带余除法:\( b = r_1 q_2 + r_2 \),其中 \( 0 \le r_2 < r_1 \)。则 \( \text{gcd}(b, r_1) = \text{gcd}(r_1, r_2) \)。
    ⑤ 继续这个过程:
    \( r_1 = r_2 q_3 + r_3 \), \( 0 \le r_3 < r_2 \)
    \( r_2 = r_3 q_4 + r_4 \), \( 0 \le r_4 < r_3 \)
    ...
    \( r_{n-2} = r_{n-1} q_n + r_n \), \( 0 \le r_n < r_{n-1} \)
    \( r_{n-1} = r_n q_{n+1} + 0 \)
    ⑥ 由于余数序列 \( b > r_1 > r_2 > \dots \ge 0 \) 是一个严格递减的非负整数序列,它最终必须在有限步内达到零。
    ⑦ 当余数 \( r_{n+1} = 0 \) 时,算法终止。此时,最后一个非零余数 \( r_n \) 就是 \( a \) 和 \( b \) 的最大公约数。
    \( \text{gcd}(a, b) = \text{gcd}(b, r_1) = \text{gcd}(r_1, r_2) = \dots = \text{gcd}(r_{n-1}, r_n) = \text{gcd}(r_n, 0) = r_n \)。

    例子 2.2 使用欧几里得算法计算 \( \text{gcd}(252, 198) \)。
    ① \( 252 = 1 \times 198 + 54 \)
    ② \( 198 = 3 \times 54 + 36 \)
    ③ \( 54 = 1 \times 36 + 18 \)
    ④ \( 36 = 2 \times 18 + 0 \)
    最后一个非零余数是 \( 18 \)。因此,\( \text{gcd}(252, 198) = 18 \)。

    2.2.3 算法实现 (Algorithm Implementation)

    欧几里得算法可以用伪代码或编程语言实现。

    1.双击鼠标左键复制此行;2.单击复制所有代码。
                                    
                                        
    1 def euclidean_algorithm(a, b):
    2 """
    3 计算两个非负整数 a 和 b 的最大公约数 (GCD)。
    4 假设 a >= 0, b >= 0, 且 a 和 b 不同时为 0。
    5 """
    6 if b == 0:
    7 return a
    8 else:
    9 return euclidean_algorithm(b, a % b)
    10
    11 # 示例
    12 # print(euclidean_algorithm(252, 198)) # 输出 18
    13 # print(euclidean_algorithm(100, 0)) # 输出 100
    14 # print(euclidean_algorithm(0, 100)) # 输出 100

    这个递归实现简洁明了。也可以使用迭代实现:

    1.双击鼠标左键复制此行;2.单击复制所有代码。
                                    
                                        
    1 def euclidean_algorithm_iterative(a, b):
    2 """
    3 计算两个非负整数 a 和 b 的最大公约数 (GCD) 的迭代实现。
    4 假设 a >= 0, b >= 0, 且 a 和 b 不同时为 0。
    5 """
    6 while b != 0:
    7 remainder = a % b
    8 a = b
    9 b = remainder
    10 return a
    11
    12 # 示例
    13 # print(euclidean_algorithm_iterative(252, 198)) # 输出 18
    14 # print(euclidean_algorithm_iterative(100, 0)) # 输出 100
    15 # print(euclidean_algorithm_iterative(0, 100)) # 输出 100

    对于负数,我们可以利用性质 \( \text{gcd}(a, b) = \text{gcd}(|a|, |b|) \) 将问题转化为非负整数的情况。

    欧几里得算法不仅用于计算最大公约数,它也是扩展欧几里得算法的基础,后者在求解线性同余方程和计算模逆元等方面有重要应用。

    2.3 最大公约数 (Greatest Common Divisor, GCD) 与 最小公倍数 (Least Common Multiple, LCM)

    最大公约数和最小公倍数是与整除密切相关的两个重要概念。

    2.3.1 最大公约数 (Greatest Common Divisor, GCD)

    定义 2.2 设 \( a \) 和 \( b \) 是不全为零的整数。\( a \) 和 \( b \) 的最大公约数是指同时整除 \( a \) 和 \( b \) 的所有整数中最大的那个正整数,记作 \( \text{gcd}(a, b) \) 或 \( (a, b) \)。

    例子 2.3
    ⚝ \( a=12, b=18 \)。\( 12 \) 的约数有 \( \pm 1, \pm 2, \pm 3, \pm 4, \pm 6, \pm 12 \)。\( 18 \) 的约数有 \( \pm 1, \pm 2, \pm 3, \pm 6, \pm 9, \pm 18 \)。它们的公约数有 \( \pm 1, \pm 2, \pm 3, \pm 6 \)。其中最大的正整数是 \( 6 \)。所以 \( \text{gcd}(12, 18) = 6 \)。
    ⚝ \( \text{gcd}(-12, 18) = \text{gcd}(12, 18) = 6 \)。
    ⚝ \( \text{gcd}(7, 11) = 1 \)。
    ⚝ \( \text{gcd}(10, 0) = 10 \)。

    性质 2.2 (GCD 的基本性质)
    设 \( a, b, c \) 是整数。
    ① \( \text{gcd}(a, b) = \text{gcd}(b, a) \) (交换律)。
    ② \( \text{gcd}(a, \text{gcd}(b, c)) = \text{gcd}(\text{gcd}(a, b), c) \) (结合律)。
    ③ \( \text{gcd}(a, 0) = |a| \) (对于 \( a \neq 0 \))。
    ④ \( \text{gcd}(a, 1) = 1 \)。
    ⑤ \( \text{gcd}(a, a) = |a| \) (对于 \( a \neq 0 \))。
    ⑥ 如果 \( a | b \),则 \( \text{gcd}(a, b) = |a| \) (对于 \( a \neq 0 \))。
    ⑦ \( \text{gcd}(ca, cb) = |c| \text{gcd}(a, b) \) (对于 \( c \neq 0 \))。
    ⑧ \( \text{gcd}(a, b) = \text{gcd}(b, a \pmod b) \) (欧几里得算法的基础,其中 \( a \pmod b \) 是 \( a \) 除以 \( b \) 的余数)。

    性质⑦的证明:
    设 \( d = \text{gcd}(a, b) \)。则 \( d | a \) 且 \( d | b \)。存在整数 \( x, y \) 使得 \( ax + by = d \) (裴蜀定理,我们将在下一节证明)。
    考虑 \( ca \) 和 \( cb \)。\( cd | ca \) 且 \( cd | cb \)。所以 \( cd \) 是 \( ca \) 和 \( cb \) 的公约数。
    设 \( D \) 是 \( ca \) 和 \( cb \) 的任意一个公约数。则 \( D | ca \) 且 \( D | cb \)。
    如果 \( c > 0 \),则 \( D/c \) 是 \( a \) 和 \( b \) 的公约数吗?不一定,因为 \( D \) 不一定能被 \( c \) 整除。
    换一种方式。设 \( d = \text{gcd}(a, b) \)。则 \( a = da' \), \( b = db' \),其中 \( \text{gcd}(a', b') = 1 \)。
    则 \( ca = cda' \), \( cb = cdb' \)。
    \( \text{gcd}(ca, cb) = \text{gcd}(cda', cdb') \)。
    我们知道 \( cd \) 是 \( ca \) 和 \( cb \) 的公约数。
    设 \( D = \text{gcd}(ca, cb) \)。则 \( D | cda' \) 且 \( D | cdb' \)。
    \( D \) 可以写成 \( D = cd \cdot \text{gcd}(a', b') \) 吗?
    考虑 \( \text{gcd}(ca, cb) \)。任何 \( ca \) 和 \( cb \) 的公约数 \( k \) 必须整除 \( ca \) 和 \( cb \)。
    \( k | ca \) 且 \( k | cb \)。
    设 \( d = \text{gcd}(a, b) \)。则 \( d | a \) 且 \( d | b \)。所以 \( cd | ca \) 且 \( cd | cb \)。因此 \( cd \) 是 \( ca \) 和 \( cb \) 的公约数。
    设 \( D = \text{gcd}(ca, cb) \)。则 \( D \) 是 \( ca \) 和 \( cb \) 的最大公约数。
    由裴蜀定理,存在 \( x, y \) 使得 \( ax + by = d \)。
    则 \( cax + cby = cd \)。由于 \( D | ca \) 且 \( D | cb \),根据线性性,\( D | (cax + cby) \),所以 \( D | cd \)。
    另一方面,\( d | a \) 和 \( d | b \),所以 \( ca = c(da_1) = (cd)a_1 \) 且 \( cb = c(db_1) = (cd)b_1 \)。
    所以 \( cd \) 是 \( ca \) 和 \( cb \) 的公约数。
    因为 \( D \) 是最大公约数,所以 \( cd | D \)。
    结合 \( D | cd \) 和 \( cd | D \),且 \( cd > 0 \) (假设 \( c \neq 0, d > 0 \)),所以 \( D = cd \)。
    如果 \( c < 0 \),则 \( |c| = -c \)。\( \text{gcd}(ca, cb) = \text{gcd}(-|c|a, -|c|b) = \text{gcd}(|c|a, |c|b) = |c|\text{gcd}(a, b) \)。
    所以 \( \text{gcd}(ca, cb) = |c| \text{gcd}(a, b) \)。

    2.3.2 互素 (Coprime / Relatively Prime)

    定义 2.3 设 \( a \) 和 \( b \) 是两个整数。如果 \( \text{gcd}(a, b) = 1 \),则称 \( a \) 和 \( b \) 互素 (coprime) 或互质。

    例子 2.4
    ⚝ \( \text{gcd}(7, 11) = 1 \),所以 \( 7 \) 和 \( 11 \) 互素。
    ⚝ \( \text{gcd}(10, 21) = 1 \),所以 \( 10 \) 和 \( 21 \) 互素。
    ⚝ \( \text{gcd}(12, 18) = 6 \neq 1 \),所以 \( 12 \) 和 \( 18 \) 不互素。
    ⚝ 对于任意整数 \( a \),\( \text{gcd}(a, 1) = 1 \),所以任何整数都与 \( 1 \) 互素。

    性质 2.3 (互素的性质)
    ① 如果 \( a \) 和 \( b \) 互素,则存在整数 \( x, y \) 使得 \( ax + by = 1 \) (裴蜀定理的特例)。
    ② 如果 \( c | ab \) 且 \( \text{gcd}(a, c) = 1 \),则 \( c | b \)。
    ▮▮▮▮证明:由 \( \text{gcd}(a, c) = 1 \),根据裴蜀定理,存在整数 \( x, y \) 使得 \( ax + cy = 1 \)。
    ▮▮▮▮将等式两边同乘以 \( b \),得 \( abx + cby = b \)。
    ▮▮▮▮由 \( c | ab \),存在整数 \( k \) 使得 \( ab = ck \)。
    ▮▮▮▮代入上式,得 \( (ck)x + cby = b \),即 \( c(kx + by) = b \)。
    ▮▮▮▮由于 \( k, x, b, y \) 都是整数,所以 \( kx + by \) 也是整数。
    ▮▮▮▮根据定义,\( c | b \)。
    ▮▮▮▮⚝ 这个性质非常重要,它被称为欧几里得引理 (Euclid's Lemma)。

    ③ 如果 \( a | c \) 且 \( b | c \),且 \( \text{gcd}(a, b) = 1 \),则 \( ab | c \)。
    ▮▮▮▮证明:由 \( a | c \),存在整数 \( k_1 \) 使得 \( c = ak_1 \)。
    ▮▮▮▮由 \( b | c \),存在整数 \( k_2 \) 使得 \( c = bk_2 \)。
    ▮▮▮▮由 \( \text{gcd}(a, b) = 1 \),根据裴蜀定理,存在整数 \( x, y \) 使得 \( ax + by = 1 \)。
    ▮▮▮▮将等式两边同乘以 \( c \),得 \( acx + bcy = c \)。
    ▮▮▮▮将 \( c = bk_2 \) 代入第一项,将 \( c = ak_1 \) 代入第二项,得 \( a(bk_2)x + b(ak_1)y = c \)。
    ▮▮▮▮整理得 \( ab(k_2 x) + ab(k_1 y) = c \),即 \( ab(k_2 x + k_1 y) = c \)。
    ▮▮▮▮由于 \( k_1, k_2, x, y \) 都是整数,所以 \( k_2 x + k_1 y \) 也是整数。
    ▮▮▮▮根据定义,\( ab | c \)。

    2.3.3 最小公倍数 (Least Common Multiple, LCM)

    定义 2.4 设 \( a \) 和 \( b \) 是两个非零整数。\( a \) 和 \( b \) 的最小公倍数是指同时是 \( a \) 和 \( b \) 的倍数的所有正整数中最小的那个数,记作 \( \text{lcm}(a, b) \) 或 \( [a, b] \)。

    例子 2.5
    ⚝ \( a=12, b=18 \)。\( 12 \) 的正倍数有 \( 12, 24, 36, 48, 60, 72, \dots \)。\( 18 \) 的正倍数有 \( 18, 36, 54, 72, \dots \)。它们的正公倍数有 \( 36, 72, \dots \)。其中最小的正整数是 \( 36 \)。所以 \( \text{lcm}(12, 18) = 36 \)。
    ⚝ \( \text{lcm}(-12, 18) = \text{lcm}(12, 18) = 36 \)。
    ⚝ \( \text{lcm}(7, 11) = 77 \)。
    ⚝ \( \text{lcm}(10, 0) \) 是未定义的,因为 \( 0 \) 的倍数只有 \( 0 \),非零整数的倍数不包含 \( 0 \)。定义要求 \( a, b \) 非零。

    2.3.4 GCD 与 LCM 的关系 (Relationship between GCD and LCM)

    最大公约数和最小公倍数之间存在一个重要的关系。

    定理 2.2 设 \( a \) 和 \( b \) 是两个非零整数。则 \( \text{gcd}(a, b) \cdot \text{lcm}(a, b) = |ab| \)。

    证明:
    我们将在下一章学习算术基本定理(唯一分解定理),它可以用来证明这个关系。这里我们先接受这个结论。
    设 \( a = p_1^{e_1} \dots p_k^{e_k} \) 和 \( b = p_1^{f_1} \dots p_k^{f_k} \) 是 \( a \) 和 \( b \) 的标准分解式,其中 \( p_i \) 是不同的素数,\( e_i \ge 0, f_i \ge 0 \)。
    则 \( \text{gcd}(a, b) = p_1^{\min(e_1, f_1)} \dots p_k^{\min(e_k, f_k)} \)。
    而 \( \text{lcm}(a, b) = p_1^{\max(e_1, f_1)} \dots p_k^{\max(e_k, f_k)} \)。
    考虑它们的乘积:
    \( \text{gcd}(a, b) \cdot \text{lcm}(a, b) = (p_1^{\min(e_1, f_1)} \dots p_k^{\min(e_k, f_k)}) \cdot (p_1^{\max(e_1, f_1)} \dots p_k^{\max(e_k, f_k)}) \)
    \( = p_1^{\min(e_1, f_1) + \max(e_1, f_1)} \dots p_k^{\min(e_k, f_k) + \max(e_k, f_k)} \)
    对于任意两个实数 \( x, y \),有 \( \min(x, y) + \max(x, y) = x + y \)。
    所以,\( \min(e_i, f_i) + \max(e_i, f_i) = e_i + f_i \)。
    因此,
    \( \text{gcd}(a, b) \cdot \text{lcm}(a, b) = p_1^{e_1 + f_1} \dots p_k^{e_k + f_k} \)
    \( = (p_1^{e_1} \dots p_k^{e_k}) \cdot (p_1^{f_1} \dots p_k^{f_k}) = ab \)。
    由于 GCD 和 LCM 定义为正数,所以对于任意非零整数 \( a, b \),有 \( \text{gcd}(a, b) \cdot \text{lcm}(a, b) = |ab| \)。

    这个定理提供了一种计算 LCM 的方法:先用欧几里得算法计算 GCD,然后利用公式 \( \text{lcm}(a, b) = \frac{|ab|}{\text{gcd}(a, b)} \)。

    例子 2.6 计算 \( \text{lcm}(252, 198) \)。
    我们已经计算出 \( \text{gcd}(252, 198) = 18 \)。
    根据公式,\( \text{lcm}(252, 198) = \frac{|252 \times 198|}{\text{gcd}(252, 198)} = \frac{252 \times 198}{18} = 14 \times 198 = 2772 \)。

    2.4 裴蜀定理 (Bézout's Identity)

    裴蜀定理是数论中一个非常重要的线性丢番图方程存在性定理,它将最大公约数与整数的线性组合联系起来。

    2.4.1 定理陈述 (Statement of the Theorem)

    定理 2.3 (裴蜀定理) 设 \( a \) 和 \( b \) 是不全为零的整数。则存在整数 \( x \) 和 \( y \),使得 \( ax + by = \text{gcd}(a, b) \)。
    ▮▮▮▮⚝ 换句话说,\( \text{gcd}(a, b) \) 可以表示为 \( a \) 和 \( b \) 的一个整数线性组合 (integer linear combination)。

    证明:
    考虑集合 \( S = \{ ax + by \mid x, y \in \mathbb{Z}, ax + by > 0 \} \)。
    由于 \( a, b \) 不全为零,例如 \( a \neq 0 \)。如果 \( a > 0 \),取 \( x=1, y=0 \),则 \( ax+by = a > 0 \),所以 \( a \in S \)。如果 \( a < 0 \),取 \( x=-1, y=0 \),则 \( ax+by = -a > 0 \),所以 \( -a \in S \)。因此,\( S \) 是一个非空的正整数集合。
    根据良序原理 (Well-Ordering Principle),\( S \) 必有最小元。设这个最小元为 \( d \)。由 \( d \in S \),存在整数 \( x_0 \) 和 \( y_0 \) 使得 \( d = ax_0 + by_0 \)。

    现在我们证明 \( d = \text{gcd}(a, b) \)。
    首先证明 \( d \) 是 \( a \) 和 \( b \) 的公约数。
    对 \( a \) 应用带余除法除以 \( d \),得 \( a = dq + r \),其中 \( 0 \le r < d \)。
    则 \( r = a - dq = a - (ax_0 + by_0)q = a(1 - x_0 q) + b(-y_0 q) \)。
    如果 \( r > 0 \),则 \( r \) 是 \( a \) 和 \( b \) 的一个正的线性组合,所以 \( r \in S \)。
    但是 \( r < d \),这与 \( d \) 是 \( S \) 中的最小元矛盾。
    因此,必有 \( r = 0 \)。这意味着 \( a = dq \),即 \( d | a \)。
    同理,对 \( b \) 应用带余除法除以 \( d \),可以证明 \( d | b \)。
    所以,\( d \) 是 \( a \) 和 \( b \) 的公约数。

    接下来证明 \( d \) 是最大的公约数。
    设 \( c \) 是 \( a \) 和 \( b \) 的任意一个公约数。则 \( c | a \) 且 \( c | b \)。
    由 \( d = ax_0 + by_0 \),根据整除的线性性 (性质③),\( c \) 整除 \( ax_0 + by_0 \),即 \( c | d \)。
    由于 \( c | d \),根据整除的比较性质 (性质⑥),如果 \( d \neq 0 \),则 \( |c| \le |d| \)。因为 \( d \in S \),所以 \( d > 0 \),即 \( |d| = d \)。所以 \( |c| \le d \)。
    这意味着任何公约数 \( c \) 的绝对值都不超过 \( d \)。因此,\( d \) 是最大的公约数。
    综上所述,\( d = \text{gcd}(a, b) \)。
    所以,存在整数 \( x_0, y_0 \) 使得 \( ax_0 + by_0 = \text{gcd}(a, b) \)。

    推论 2.3.1 整数 \( a \) 和 \( b \) 互素当且仅当存在整数 \( x \) 和 \( y \) 使得 \( ax + by = 1 \)。
    ▮▮▮▮证明:如果 \( a \) 和 \( b \) 互素,则 \( \text{gcd}(a, b) = 1 \)。由裴蜀定理,存在整数 \( x, y \) 使得 \( ax + by = 1 \)。
    ▮▮▮▮反之,如果存在整数 \( x, y \) 使得 \( ax + by = 1 \)。设 \( d = \text{gcd}(a, b) \)。则 \( d | a \) 且 \( d | b \)。根据整除的线性性,\( d | (ax + by) \),即 \( d | 1 \)。由于 \( d \) 是正整数,所以 \( d = 1 \)。因此 \( a \) 和 \( b \) 互素。

    2.4.2 扩展欧几里得算法 (Extended Euclidean Algorithm)

    裴蜀定理证明了整数 \( x \) 和 \( y \) 的存在性,而扩展欧几里得算法提供了一种计算这些系数的方法。

    扩展欧几里得算法是在欧几里得算法计算 \( \text{gcd}(a, b) \) 的过程中,同时追踪每一步的余数如何表示成 \( a \) 和 \( b \) 的线性组合。

    回顾欧几里得算法的步骤:
    \( a = bq_1 + r_1 \)
    \( b = r_1 q_2 + r_2 \)
    \( r_1 = r_2 q_3 + r_3 \)
    ...
    \( r_{n-2} = r_{n-1} q_n + r_n \)
    \( r_{n-1} = r_n q_{n+1} + 0 \)
    其中 \( r_n = \text{gcd}(a, b) \)。

    我们可以从倒数第二个等式开始,将 \( r_n \) 表示为 \( r_{n-2} \) 和 \( r_{n-1} \) 的线性组合:
    \( r_n = r_{n-2} - r_{n-1} q_n \)
    然后,将 \( r_{n-1} \) 表示为 \( r_{n-3} \) 和 \( r_{n-2} \) 的线性组合 (从前一个等式 \( r_{n-3} = r_{n-2} q_{n-1} + r_{n-1} \),得 \( r_{n-1} = r_{n-3} - r_{n-2} q_{n-1} \)),代入上式:
    \( r_n = r_{n-2} - (r_{n-3} - r_{n-2} q_{n-1}) q_n = r_{n-2} - r_{n-3} q_n + r_{n-2} q_{n-1} q_n = r_{n-3}(-q_n) + r_{n-2}(1 + q_{n-1} q_n) \)
    这样,我们将 \( r_n \) 表示为 \( r_{n-3} \) 和 \( r_{n-2} \) 的线性组合。
    重复这个过程,逐步向上回代,直到将 \( r_n \) 表示为 \( a \) 和 \( b \) 的线性组合 \( ax + by \)。

    例子 2.7 使用扩展欧几里得算法计算 \( \text{gcd}(252, 198) \) 并找到整数 \( x, y \) 使得 \( 252x + 198y = \text{gcd}(252, 198) \)。
    欧几里得算法步骤:
    ① \( 252 = 1 \times 198 + 54 \) => \( 54 = 252 - 1 \times 198 \)
    ② \( 198 = 3 \times 54 + 36 \) => \( 36 = 198 - 3 \times 54 \)
    ③ \( 54 = 1 \times 36 + 18 \) => \( 18 = 54 - 1 \times 36 \)
    ④ \( 36 = 2 \times 18 + 0 \)

    最后一个非零余数是 \( 18 \),所以 \( \text{gcd}(252, 198) = 18 \)。
    现在回代:
    从 ③ 式:\( 18 = 54 - 1 \times 36 \)
    将 ② 式中的 \( 36 \) 代入:\( 18 = 54 - 1 \times (198 - 3 \times 54) \)
    \( 18 = 54 - 1 \times 198 + 3 \times 54 \)
    \( 18 = 4 \times 54 - 1 \times 198 \)
    将 ① 式中的 \( 54 \) 代入:\( 18 = 4 \times (252 - 1 \times 198) - 1 \times 198 \)
    \( 18 = 4 \times 252 - 4 \times 198 - 1 \times 198 \)
    \( 18 = 4 \times 252 + (-4 - 1) \times 198 \)
    \( 18 = 4 \times 252 + (-5) \times 198 \)
    所以,我们找到了 \( x = 4 \) 和 \( y = -5 \) 使得 \( 252x + 198y = 18 \)。

    扩展欧几里得算法的迭代实现通常更系统:
    设 \( r_i \) 是第 \( i \) 步的余数,\( q_i \) 是商。
    \( r_{-2} = a, r_{-1} = b \)
    \( r_i = r_{i-2} - q_i r_{i-1} \)
    我们希望找到 \( x_i, y_i \) 使得 \( r_i = ax_i + by_i \)。
    \( r_{-2} = a = a \times 1 + b \times 0 \Rightarrow x_{-2}=1, y_{-2}=0 \)
    \( r_{-1} = b = a \times 0 + b \times 1 \Rightarrow x_{-1}=0, y_{-1}=1 \)
    对于 \( i \ge 0 \),\( r_i = r_{i-2} - q_i r_{i-1} \)。
    \( ax_i + by_i = (ax_{i-2} + by_{i-2}) - q_i (ax_{i-1} + by_{i-1}) \)
    \( ax_i + by_i = a(x_{i-2} - q_i x_{i-1}) + b(y_{i-2} - q_i y_{i-1}) \)
    所以,我们可以得到递推关系:
    \( x_i = x_{i-2} - q_i x_{i-1} \)
    \( y_i = y_{i-2} - q_i y_{i-1} \)
    初始值:\( (x_{-2}, y_{-2}) = (1, 0) \), \( (x_{-1}, y_{-1}) = (0, 1) \)。
    在计算欧几里得算法的同时,记录商 \( q_i \),然后使用上述递推关系计算 \( x_i, y_i \)。当 \( r_n = \text{gcd}(a, b) \) 时,对应的 \( x_n, y_n \) 就是满足 \( ax_n + by_n = \text{gcd}(a, b) \) 的一对解。

    1.双击鼠标左键复制此行;2.单击复制所有代码。
                                    
                                        
    1 def extended_euclidean_algorithm(a, b):
    2 """
    3 计算 gcd(a, b) 并找到整数 x, y 使得 ax + by = gcd(a, b)。
    4 返回 (gcd, x, y)。
    5 """
    6 if b == 0:
    7 return (a, 1, 0)
    8 else:
    9 gcd, x_prev, y_prev = extended_euclidean_algorithm(b, a % b)
    10 q = a // b
    11 x = y_prev
    12 y = x_prev - q * y_prev
    13 return (gcd, x, y)
    14
    15 # 示例
    16 # print(extended_euclidean_algorithm(252, 198)) # 输出 (18, 4, -5)
    17 # print(extended_euclidean_algorithm(101, 103)) # 输出 (1, 50, -49)

    裴蜀定理及其通过扩展欧几里得算法求解的系数在密码学(如 RSA 算法中的模逆元计算)、线性同余方程求解等领域有广泛应用。

    本章我们深入学习了整除的基本概念、性质,掌握了计算最大公约数的欧几里得算法,理解了最大公约数与最小公倍数的关系,并学习了裴蜀定理及其求解方法——扩展欧几里得算法。这些是数论中最基础也是最重要的工具,为后续章节的学习奠定了坚实的基础。

    3. chapter 素数 (Prime Numbers)

    欢迎来到数论中最迷人、最核心的领域之一:素数的世界。素数是构建所有整数的“原子”,它们在数论中扮演着基石的角色。理解素数,以及它们如何分布,是深入学习数论的关键。本章将带您探索素数的基本概念、最重要的定理以及它们神秘的分布规律。

    3.1 素数与合数 (Prime and Composite Numbers) 的定义

    我们从最基本的概念开始。在整数的世界里,除了 \(1\) 和 \(-1\) 之外,有些数只能被自身和 \(1\) 整除,而有些数则可以被更多的数整除。

    定义 3.1.1 一个大于 \(1\) 的整数 \(p\) 如果除了 \(1\) 和 \(p\) 自身以外没有其他正因数 (positive divisors),则称 \(p\) 为 素数 (prime number)质数

    定义 3.1.2 一个大于 \(1\) 的整数 \(n\) 如果不是素数,则称 \(n\) 为 合数 (composite number)

    定义 3.1.3 整数 \(1\) 既不是素数也不是合数。它是乘法单位元 (multiplicative identity)。

    为什么 \(1\) 既不是素数也不是合数呢?这主要是为了保证算术基本定理(我们稍后会讨论)的唯一性。如果 \(1\) 是素数,那么任何数都可以有无穷多种素因数分解形式(例如 \(6 = 2 \times 3 = 1 \times 2 \times 3 = 1 \times 1 \times 2 \times 3\)),这将破坏唯一性。

    让我们看一些例子:
    ⚝ \(2\) 是素数,它的正因数只有 \(1\) 和 \(2\)。
    ⚝ \(3\) 是素数,它的正因数只有 \(1\) 和 \(3\)。
    ⚝ \(4\) 是合数,它的正因数有 \(1, 2, 4\)。
    ⚝ \(5\) 是素数,它的正因数只有 \(1\) 和 \(5\)。
    ⚝ \(6\) 是合数,它的正因数有 \(1, 2, 3, 6\)。
    ⚝ \(7\) 是素数,它的正因数只有 \(1\) 和 \(7\)。
    ⚝ \(8\) 是合数,它的正因数有 \(1, 2, 4, 8\)。
    ⚝ \(9\) 是合数,它的正因数有 \(1, 3, 9\)。
    ⚝ \(10\) 是合数,它的正因数有 \(1, 2, 5, 10\)。

    素数是 \(2, 3, 5, 7, 11, 13, 17, 19, 23, \dots\)
    合数是 \(4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 25, 26, 27, 28, \dots\)

    一个整数 \(n > 1\) 是合数当且仅当它有一个正因数 \(d\) 满足 \(1 < d < n\)。进一步,如果 \(n\) 是合数,那么它一定有一个素因数 (prime divisor)。

    定理 3.1.4 任何大于 \(1\) 的整数都有至少一个素因数。

    证明:
    考虑任意大于 \(1\) 的整数 \(n\)。
    ① 如果 \(n\) 是素数,那么 \(n\) 本身就是它的素因数。
    ② 如果 \(n\) 是合数,那么根据定义,它有一个正因数 \(d_1\) 满足 \(1 < d_1 < n\)。
    ③ 如果 \(d_1\) 是素数,那么 \(d_1\) 就是 \(n\) 的一个素因数。
    ④ 如果 \(d_1\) 是合数,那么 \(d_1\) 又有一个正因数 \(d_2\) 满足 \(1 < d_2 < d_1\)。因此 \(d_2\) 也是 \(n\) 的因数。
    ⑤ 我们可以重复这个过程:\(n > d_1 > d_2 > d_3 > \dots > 1\)。这是一个递减的正整数序列。
    ⑥ 由于正整数序列不能无限递减,这个过程最终必须停止。停止的条件是找到一个不能再分解的因数,即一个素数。
    ⑦ 这个最终的素数就是 \(n\) 的一个素因数。
    因此,任何大于 \(1\) 的整数都有至少一个素因数。 ∎

    这个定理是算术基本定理的基础。

    3.2 算术基本定理 (Fundamental Theorem of Arithmetic) - 唯一分解定理 (Unique Factorization Theorem)

    算术基本定理是数论中最重要、最基础的定理之一。它告诉我们,任何大于 \(1\) 的整数都可以唯一地表示为素数的乘积。

    定理 3.2.1 (算术基本定理) 任何大于 \(1\) 的整数 \(n\) 都可以写成素数的乘积,并且这种表示方式在不考虑素数因子的顺序的情况下是唯一的。
    即,对于任何整数 \(n > 1\),存在素数 \(p_1, p_2, \dots, p_k\) (不一定互异) 使得
    \[ n = p_1 p_2 \dots p_k \]
    并且,如果 \(n = q_1 q_2 \dots q_m\) 是 \(n\) 的另一种素数乘积表示,其中 \(q_1, q_2, \dots, q_m\) 也是素数,那么 \(k=m\),并且在适当调整顺序后,有 \(p_i = q_i\) 对于所有 \(i=1, \dots, k\)。

    通常,我们将相同的素数因子合并,写成标准分解式 (standard factorization) 或规范分解式 (canonical factorization):
    \[ n = p_1^{a_1} p_2^{a_2} \dots p_r^{a_r} \]
    其中 \(p_1, p_2, \dots, p_r\) 是互不相同的素数,且 \(a_1, a_2, \dots, a_r\) 都是正整数。这种表示方式是完全唯一的。

    证明 (存在性):
    ① 我们使用数学归纳法 (mathematical induction) 来证明任何大于 \(1\) 的整数都可以写成素数的乘积。
    基本情况 (Base Case): 当 \(n=2\) 时,\(2\) 是素数,它可以写成 \(2\) 的乘积(只有一个因子),满足定理。
    归纳假设 (Inductive Hypothesis): 假设对于所有满足 \(1 < k < n\) 的整数 \(k\),\(k\) 都可以写成素数的乘积。
    归纳步骤 (Inductive Step): 现在考虑整数 \(n\)。
    ▮ 如果 \(n\) 是素数,那么 \(n\) 本身就是素数乘积(只有一个因子)。
    ▮ 如果 \(n\) 是合数,那么根据定义,存在整数 \(d_1, d_2\) 使得 \(n = d_1 d_2\),且 \(1 < d_1 < n\) 且 \(1 < d_2 < n\)。
    ▮ 根据归纳假设,\(d_1\) 和 \(d_2\) 都可以写成素数的乘积。
    ▮ 假设 \(d_1 = p_1 p_2 \dots p_k\) 且 \(d_2 = q_1 q_2 \dots q_m\),其中 \(p_i\) 和 \(q_j\) 都是素数。
    ▮ 那么 \(n = d_1 d_2 = (p_1 p_2 \dots p_k)(q_1 q_2 \dots q_m)\),这表明 \(n\) 可以写成素数的乘积。
    ⑤ 根据数学归纳法原理,所有大于 \(1\) 的整数都可以写成素数的乘积。

    证明 (唯一性):
    唯一性的证明稍微复杂一些,它依赖于欧几里得引理 (Euclid's Lemma)。

    引理 3.2.2 (欧几里得引理) 如果素数 \(p\) 整除乘积 \(ab\),那么 \(p\) 整除 \(a\) 或 \(p\) 整除 \(b\) (或两者都整除)。
    证明 (欧几里得引理):
    ① 假设 \(p\) 整除 \(ab\)。我们需要证明 \(p|a\) 或 \(p|b\)。
    ② 如果 \(p|a\),则结论已成立。
    ③ 如果 \(p \nmid a\),因为 \(p\) 是素数,其正因数只有 \(1\) 和 \(p\)。由于 \(p \nmid a\),所以 \(p\) 和 \(a\) 的最大公约数 \(\gcd(p, a)\) 只能是 \(1\)。
    ④ 根据裴蜀定理 (Bézout's Identity),存在整数 \(x\) 和 \(y\) 使得 \(px + ay = 1\)。
    ⑤ 将等式两边乘以 \(b\),得到 \(pbx + aby = b\)。
    ⑥ 因为 \(p|ab\),所以 \(ab = pk\) 对于某个整数 \(k\)。
    ⑦ 将 \(ab\) 替换,得到 \(pbx + pk y = b\),即 \(p(bx + ky) = b\)。
    ⑧ 这表明 \(p\) 整除 \(b\)。
    ⑨ 因此,如果 \(p|ab\),则 \(p|a\) 或 \(p|b\)。 ∎

    证明 (算术基本定理的唯一性):
    ① 假设整数 \(n > 1\) 有两种素数乘积表示:
    \[ n = p_1 p_2 \dots p_k = q_1 q_2 \dots q_m \]
    其中 \(p_i\) 和 \(q_j\) 都是素数,且 \(p_1 \le p_2 \le \dots \le p_k\) 且 \(q_1 \le q_2 \le \dots \le q_m\)。我们要证明 \(k=m\) 且 \(p_i = q_i\) 对于所有 \(i\)。
    ② 从等式 \(p_1 p_2 \dots p_k = q_1 q_2 \dots q_m\) 开始。
    ③ 素数 \(p_1\) 整除左边的乘积,因此 \(p_1\) 整除右边的乘积 \(q_1 q_2 \dots q_m\)。
    ④ 根据欧几里得引理的推广形式(可以推广到任意有限个因子的乘积),如果一个素数整除一个乘积,那么它必须整除乘积中的至少一个因子。因此,\(p_1\) 必须整除某个 \(q_j\) (\(1 \le j \le m\))。
    ⑤ 因为 \(q_j\) 是素数,它的正因数只有 \(1\) 和 \(q_j\)。由于 \(p_1\) 是素数,\(p_1 > 1\),所以 \(p_1\) 整除 \(q_j\) 意味着 \(p_1\) 必须等于 \(q_j\)。
    ⑥ 同样地,素数 \(q_1\) 整除右边的乘积,因此 \(q_1\) 整除左边的乘积 \(p_1 p_2 \dots p_k\)。所以 \(q_1\) 必须等于某个 \(p_i\) (\(1 \le i \le k\))。
    ⑦ 因为 \(p_1 \le p_i\) 对于所有 \(i\),且 \(q_1 \le q_j\) 对于所有 \(j\),我们有 \(p_1 = q_j \ge q_1\) 且 \(q_1 = p_i \ge p_1\)。这只能意味着 \(p_1 = q_1\)。
    ⑧ 现在我们将等式两边同时除以 \(p_1 (=q_1)\),得到:
    \[ p_2 p_3 \dots p_k = q_2 q_3 \dots q_m \]
    ⑨ 我们可以重复上述过程。\(p_2\) 必须等于某个 \(q_j\) (\(j \ge 2\)),且 \(q_2\) 必须等于某个 \(p_i\) (\(i \ge 2\))。通过排序,我们可以再次证明 \(p_2 = q_2\)。
    ⑩ 持续这个过程,直到一边没有因子为止。如果 \(k < m\),最终我们会得到 \(1 = q_{k+1} \dots q_m\)。但这不可能,因为 \(q_j\) 都是素数,都大于 \(1\)。因此 \(k\) 不能小于 \(m\)。
    ⑪ 同样,如果 \(m < k\),最终我们会得到 \(p_{m+1} \dots p_k = 1\),这也不可能。因此 \(m\) 不能小于 \(k\)。
    ⑫ 唯一的可能性是 \(k=m\),并且 \(p_i = q_i\) 对于所有 \(i=1, \dots, k\)。
    ⑬ 这证明了素数分解的唯一性(不考虑顺序)。 ∎

    算术基本定理是数论的基石,它使得我们可以用素数来“标记”每一个整数。例如:
    ⚝ \(12 = 2 \times 2 \times 3 = 2^2 \times 3^1\)
    ⚝ \(100 = 2 \times 2 \times 5 \times 5 = 2^2 \times 5^2\)
    ⚝ \(999 = 3 \times 3 \times 3 \times 37 = 3^3 \times 37^1\)
    ⚝ \(1000 = 2 \times 2 \times 2 \times 5 \times 5 \times 5 = 2^3 \times 5^3\)
    ⚝ \(1001 = 7 \times 11 \times 13\)

    利用素因数分解,我们可以方便地找到两个整数的最大公约数 (GCD) 和最小公倍数 (LCM)。
    设两个整数 \(a\) 和 \(b\) 的标准分解式分别为:
    \[ a = p_1^{a_1} p_2^{a_2} \dots p_r^{a_r} \]
    \[ b = p_1^{b_1} p_2^{b_2} \dots p_r^{b_r} \]
    其中 \(p_i\) 是所有出现在 \(a\) 或 \(b\) 的分解式中的素数,指数 \(a_i\) 和 \(b_i\) 可以是非负整数(如果某个素数不在分解式中,对应的指数为 \(0\))。
    那么,
    \[ \gcd(a, b) = p_1^{\min(a_1, b_1)} p_2^{\min(a_2, b_2)} \dots p_r^{\min(a_r, b_r)} \]
    \[ \operatorname{lcm}(a, b) = p_1^{\max(a_1, b_1)} p_2^{\max(a_2, b_2)} \dots p_r^{\max(a_r, b_r)} \]
    并且,我们有重要的关系式:
    \[ \gcd(a, b) \cdot \operatorname{lcm}(a, b) = ab \]

    例如,\(a = 12 = 2^2 \times 3^1 \times 5^0\),\(b = 18 = 2^1 \times 3^2 \times 5^0\)。
    \[ \gcd(12, 18) = 2^{\min(2, 1)} \times 3^{\min(1, 2)} \times 5^{\min(0, 0)} = 2^1 \times 3^1 \times 5^0 = 6 \]
    \[ \operatorname{lcm}(12, 18) = 2^{\max(2, 1)} \times 3^{\max(1, 2)} \times 5^{\max(0, 0)} = 2^2 \times 3^2 \times 5^0 = 4 \times 9 = 36 \]
    验证:\(\gcd(12, 18) \cdot \operatorname{lcm}(12, 18) = 6 \times 36 = 216\),而 \(ab = 12 \times 18 = 216\)。关系式成立。

    3.3 素数的无穷性 (Infinitude of Primes)

    一个自然而深刻的问题是:素数有多少个?它们是有限的还是无限的?答案是它们是无限的。这个结论最早由古希腊数学家欧几里得 (Euclid) 证明,他的证明简洁而优雅,至今仍是数学中最著名的证明之一。

    定理 3.3.1 (欧几里得) 存在无限多个素数。

    证明 (欧几里得的证明):
    ① 我们使用反证法 (proof by contradiction)。
    ② 假设素数的个数是有限的。
    ③ 设所有素数都可以列出来,记为 \(p_1, p_2, \dots, p_k\),其中 \(k\) 是一个有限的正整数。也就是说,这是宇宙中所有的素数。
    ④ 考虑构造一个新的整数 \(N\),方法是将所有这些素数相乘,然后加 \(1\)。
    \[ N = p_1 p_2 \dots p_k + 1 \]
    ⑤ 现在考虑整数 \(N\)。根据算术基本定理,任何大于 \(1\) 的整数都有至少一个素因数。由于 \(N > 1\),所以 \(N\) 必须有一个素因数。
    ⑥ 设 \(p\) 是 \(N\) 的任意一个素因数。
    ⑦ 根据我们的假设,所有的素数都在列表 \(p_1, p_2, \dots, p_k\) 中。因此,\(p\) 必须是这个列表中的一个素数,即 \(p = p_i\) 对于某个 \(i \in \{1, 2, \dots, k\}\)。
    ⑧ 这意味着 \(p\) 整除 \(p_i\)。
    ⑨ 同时,根据构造,\(p\) 整除 \(N\)。
    ⑩ 因为 \(p\) 整除 \(p_1 p_2 \dots p_k\) (因为它等于某个 \(p_i\)),并且 \(p\) 整除 \(N = p_1 p_2 \dots p_k + 1\),所以 \(p\) 必须整除它们的差。
    \[ N - (p_1 p_2 \dots p_k) = (p_1 p_2 \dots p_k + 1) - (p_1 p_2 \dots p_k) = 1 \]
    ⑪ 因此,\(p\) 整除 \(1\)。
    ⑫ 然而,\(p\) 是一个素数,根据定义,素数大于 \(1\),所以它的正因数只有 \(1\) 和它自身。一个大于 \(1\) 的数不可能整除 \(1\)。
    ⑬ 这导致了一个矛盾 (contradiction)。
    ⑭ 我们的初始假设“素数的个数是有限的”必然是错误的。
    ⑮ 因此,素数的个数是无限的。 ∎

    这个证明非常巧妙,它不依赖于找到下一个素数是什么,而是通过构造一个数来证明“不可能存在最大的素数”。

    除了欧几里得的证明,还有许多其他证明素数无穷性的方法,例如:
    费马数 (Fermat Numbers) 的证明: 考虑费马数 \(F_n = 2^{2^n} + 1\)。可以证明,如果 \(m \ne n\),那么 \(\gcd(F_m, F_n) = 1\)。这意味着不同的费马数互质。如果每个 \(F_n\) 都有一个素因数,并且这些素因数各不相同,那么素数就是无限的。虽然费马数本身不都是素数(例如 \(F_5\) 是合数),但它们互质的性质足以证明素数无穷。
    解析方法 (Analytic Proof): 欧拉 (Euler) 使用了调和级数 (harmonic series) 的思想。他证明了素数的倒数之和是发散的:
    \[ \sum_{p \text{ prime}} \frac{1}{p} = \frac{1}{2} + \frac{1}{3} + \frac{1}{5} + \frac{1}{7} + \dots \]
    如果素数是有限的,这个级数将是一个有限和,因此是收敛的。但欧拉证明它是发散的,从而得出素数是无限的结论。这开启了解析数论 (analytic number theory) 的大门。

    素数的无穷性保证了我们对整数进行素因数分解的可能性,也为数论的进一步发展奠定了基础。

    3.4 素数分布的初步认识 (Preliminary Understanding of Prime Distribution)

    我们知道素数是无限的,但它们是如何分布在整数序列中的呢?它们是均匀分布的,还是越来越稀疏?这是一个极其困难且深刻的问题,至今仍有许多未解之谜。

    让我们先看一些素数列表:
    \(2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, \dots\)

    在小范围内,素数看起来分布得比较密集。但是随着数字变大,素数似乎变得越来越稀疏。例如,在 \(1\) 到 \(100\) 之间有 \(25\) 个素数,而在 \(101\) 到 \(200\) 之间只有 \(21\) 个素数。存在任意长的连续合数序列。例如,对于任何整数 \(n > 1\),考虑序列 \((n+1)! + 2, (n+1)! + 3, \dots, (n+1)! + n + 1\)。这个序列包含 \(n\) 个连续的整数。对于其中的任何一个数 \((n+1)! + k\),其中 \(2 \le k \le n+1\),我们知道 \(k\) 整除 \((n+1)!\),且 \(k\) 整除 \(k\),所以 \(k\) 整除 \((n+1)! + k\)。由于 \(k > 1\),\((n+1)! + k\) 是合数。因此,我们找到了 \(n\) 个连续的合数。这意味着素数之间的间隔可以任意大。

    尽管素数分布看起来不规则,但数学家们发现了一些关于素数“平均”分布的规律。

    定义 3.4.1 设 \(\pi(x)\) 表示小于或等于 \(x\) 的素数的个数。这个函数称为 素数计数函数 (prime-counting function)

    例如:
    \(\pi(10) = 4\) (素数是 \(2, 3, 5, 7\))
    \(\pi(100) = 25\)
    \(\pi(1000) = 168\)
    \(\pi(10000) = 1229\)

    观察 \(\pi(x)\) 的值,数学家们尝试找到一个函数来近似 \(\pi(x)\)。高斯 (Gauss) 和勒让德 (Legendre) 在18世纪末19世纪初独立地猜测,\(\pi(x)\) 大约等于 \(x / \ln(x)\),其中 \(\ln(x)\) 是 \(x\) 的自然对数。

    定理 3.4.2 (素数定理 - Prime Number Theorem)
    \[ \lim_{x \to \infty} \frac{\pi(x)}{x / \ln(x)} = 1 \]
    这个定理在1896年由阿达马 (Hadamard) 和德拉瓦莱·普桑 (de la Vallée Poussin) 独立证明。它表明,当 \(x\) 趋于无穷大时,小于或等于 \(x\) 的素数的个数 \(\pi(x)\) 与 \(x / \ln(x)\) 是渐近相等的。

    素数定理是解析数论的重大成就之一,它给出了素数在长程上的平均分布规律。它告诉我们,素数在整数序列中确实是越来越稀疏的,大约每 \(\ln(x)\) 个整数中有一个素数。

    素数定理的证明需要用到复变函数论 (complex analysis) 的工具,特别是黎曼ζ函数 (Riemann Zeta Function)。

    定义 3.4.3 黎曼ζ函数 \(\zeta(s)\) 对于复数 \(s = \sigma + it\) (其中 \(\sigma > 1\)) 定义为无穷级数:
    \[ \zeta(s) = \sum_{n=1}^{\infty} \frac{1}{n^s} = \frac{1}{1^s} + \frac{1}{2^s} + \frac{1}{3^s} + \dots \]
    欧拉发现了一个重要的恒等式,将 \(\zeta(s)\) 与素数联系起来:
    \[ \zeta(s) = \prod_{p \text{ prime}} \frac{1}{1 - p^{-s}} \]
    这个乘积称为欧拉乘积 (Euler product),它只包含素数。

    黎曼 (Riemann) 在1859年的一篇划时代论文中研究了 \(\zeta(s)\) 函数在整个复平面上的性质,特别是它的零点 (zeros)。他提出了著名的 黎曼猜想 (Riemann Hypothesis)

    猜想 3.4.4 (黎曼猜想) 黎曼ζ函数 \(\zeta(s)\) 的所有非平凡零点 (non-trivial zeros) 都位于复平面上的直线 \(\operatorname{Re}(s) = 1/2\) 上。

    黎曼猜想是数学中最重要的未解决问题之一,它与素数的分布有着极其深刻的联系。如果黎曼猜想为真,那么素数定理中的误差项 (error term) 将会有一个非常好的界限,这意味着素数的分布比素数定理所描述的更加规律。

    素数分布的研究是一个活跃的数学领域,涉及许多猜想,例如:
    孪生素数猜想 (Twin Prime Conjecture): 存在无限多对相差为 \(2\) 的素数,例如 \((3, 5), (5, 7), (11, 13), (17, 19), \dots\)。
    哥德巴赫猜想 (Goldbach Conjecture): 任何大于 \(2\) 的偶数都可以表示为两个素数之和。

    这些猜想虽然表述简单,但证明却异常困难,它们都反映了素数分布的复杂性和奥秘。

    本章我们学习了素数和合数的基本定义,证明了算术基本定理及其唯一性,并用欧几里得的经典方法证明了素数的无穷性。最后,我们初步了解了素数分布的规律,特别是素数定理,并简要介绍了黎曼ζ函数和黎曼猜想,窥见了素数分布研究的深度和广度。素数是数论永恒的主题,它们简单的定义背后隐藏着极其丰富的结构和未知的奥秘。

    4. chapter 同余 (Congruences)

    亲爱的同学们,欢迎来到数论基础的学习。在前面的章节中,我们探讨了整数的整除性、素数的奥秘以及算术基本定理的强大。今天,我们将引入一个极其重要且贯穿数论始终的概念——同余(Congruence)。同余理论由伟大的数学家高斯(Gauss)在其著作《算术研究》(Disquisitiones Arithmeticae)中系统地提出,它极大地简化了处理整数性质的方式,为数论的发展开辟了新的道路。同余的概念就像是给整数穿上了“模”的衣服,让我们可以在有限的范围内研究无限的整数。这不仅是一个理论工具,更在密码学、计算机科学等领域有着广泛的应用。

    本章我们将从同余的基本定义出发,逐步深入,理解剩余类、完全剩余系和简化剩余系的概念,学习如何求解线性同余方程,并最终掌握数论中一个优美而实用的定理——中国剩余定理。请大家准备好,让我们一起探索同余的精彩世界!✨

    4.1 同余的概念与基本性质 (Concept and Basic Properties of Congruences)

    同余是数论中最基本也是最重要的概念之一。它提供了一种新的视角来考察整数之间的关系。

    4.1.1 同余的定义 (Definition of Congruence)

    定义 4.1.1:设 \( m \) 是一个正整数,如果两个整数 \( a \) 和 \( b \) 的差 \( a-b \) 能够被 \( m \) 整除,即 \( m | (a-b) \),我们就说 \( a \) 对模 \( m \) 同余于 \( b \),记作 \( a \equiv b \pmod{m} \)。

    用数学符号表示就是:
    \( a \equiv b \pmod{m} \iff m | (a-b) \)

    如果 \( m \) 不能整除 \( a-b \),我们就说 \( a \) 对模 \( m \) 不同余于 \( b \),记作 \( a \not\equiv b \pmod{m} \)。

    这里的正整数 \( m \) 称为模 (modulus)。

    这个定义实际上是说,\( a \) 和 \( b \) 除以 \( m \) 具有相同的余数。
    例如:
    \( 17 \equiv 5 \pmod{12} \),因为 \( 17 - 5 = 12 \),而 \( 12 | 12 \)。同时,\( 17 = 1 \cdot 12 + 5 \) 和 \( 5 = 0 \cdot 12 + 5 \),它们除以 12 的余数都是 5。
    \( -3 \equiv 7 \pmod{10} \),因为 \( -3 - 7 = -10 \),而 \( 10 | (-10) \)。同时,\( -3 = -1 \cdot 10 + 7 \) 和 \( 7 = 0 \cdot 10 + 7 \),它们除以 10 的余数都是 7。
    \( 10 \not\equiv 4 \pmod{5} \),因为 \( 10 - 4 = 6 \),而 \( 5 \nmid 6 \)。

    同余关系 \( a \equiv b \pmod{m} \) 也可以写成 \( a = b + km \) 的形式,其中 \( k \) 是某个整数。

    4.1.2 同余的基本性质 (Basic Properties of Congruences)

    同余关系具有类似于等号的一些基本性质,这使得我们可以在同余式上进行类似于方程的运算。设 \( m \) 是一个正整数,\( a, b, c, d \) 是任意整数。

    ① 自反性 (Reflexivity):
    \( a \equiv a \pmod{m} \)
    证明:\( a - a = 0 \),对于任何正整数 \( m \),都有 \( m | 0 \)。因此 \( a \equiv a \pmod{m} \)。

    ② 对称性 (Symmetry):
    如果 \( a \equiv b \pmod{m} \),那么 \( b \equiv a \pmod{m} \)。
    证明:如果 \( a \equiv b \pmod{m} \),则 \( m | (a-b) \)。这意味着 \( a-b = km \) 对于某个整数 \( k \)。于是 \( b-a = -(a-b) = -km = (-k)m \)。由于 \( -k \) 也是整数,所以 \( m | (b-a) \)。因此 \( b \equiv a \pmod{m} \)。

    ③ 传递性 (Transitivity):
    如果 \( a \equiv b \pmod{m} \) 且 \( b \equiv c \pmod{m} \),那么 \( a \equiv c \pmod{m} \)。
    证明:如果 \( a \equiv b \pmod{m} \),则 \( m | (a-b) \),即 \( a-b = k_1 m \) 对于某个整数 \( k_1 \)。
    如果 \( b \equiv c \pmod{m} \),则 \( m | (b-c) \),即 \( b-c = k_2 m \) 对于某个整数 \( k_2 \)。
    将这两个等式相加,得到 \( (a-b) + (b-c) = k_1 m + k_2 m \),即 \( a-c = (k_1 + k_2) m \)。
    由于 \( k_1 + k_2 \) 是整数,所以 \( m | (a-c) \)。因此 \( a \equiv c \pmod{m} \)。

    这三条性质表明,同余关系 \( \equiv \pmod{m} \) 是整数集 \( \mathbb{Z} \) 上的一个等价关系 (equivalence relation)。

    ④ 加法和减法性质 (Addition and Subtraction Properties):
    如果 \( a \equiv b \pmod{m} \) 且 \( c \equiv d \pmod{m} \),那么 \( a \pm c \equiv b \pm d \pmod{m} \)。
    证明:如果 \( a \equiv b \pmod{m} \),则 \( m | (a-b) \),即 \( a-b = k_1 m \)。
    如果 \( c \equiv d \pmod{m} \),则 \( m | (c-d) \),即 \( c-d = k_2 m \)。
    \( (a \pm c) - (b \pm d) = (a-b) \pm (c-d) = k_1 m \pm k_2 m = (k_1 \pm k_2) m \)。
    由于 \( k_1 \pm k_2 \) 是整数,所以 \( m | ((a \pm c) - (b \pm d)) \)。因此 \( a \pm c \equiv b \pm d \pmod{m} \)。
    特别地,如果 \( a \equiv b \pmod{m} \),那么 \( a+c \equiv b+c \pmod{m} \) 且 \( a-c \equiv b-c \pmod{m} \) 对于任意整数 \( c \)。

    ⑤ 乘法性质 (Multiplication Property):
    如果 \( a \equiv b \pmod{m} \) 且 \( c \equiv d \pmod{m} \),那么 \( ac \equiv bd \pmod{m} \)。
    证明:如果 \( a \equiv b \pmod{m} \),则 \( a = b + k_1 m \)。
    如果 \( c \equiv d \pmod{m} \),则 \( c = d + k_2 m \)。
    \( ac = (b + k_1 m)(d + k_2 m) = bd + bk_2 m + dk_1 m + k_1 k_2 m^2 = bd + (bk_2 + dk_1 + k_1 k_2 m) m \)。
    由于 \( bk_2 + dk_1 + k_1 k_2 m \) 是整数,所以 \( m | (ac - bd) \)。因此 \( ac \equiv bd \pmod{m} \)。
    特别地,如果 \( a \equiv b \pmod{m} \),那么 \( ac \equiv bc \pmod{m} \) 对于任意整数 \( c \)。

    ⑥ 幂性质 (Exponentiation Property):
    如果 \( a \equiv b \pmod{m} \),那么对于任意正整数 \( n \),有 \( a^n \equiv b^n \pmod{m} \)。
    证明:这可以通过对 \( n \) 进行数学归纳法 (Mathematical Induction) 来证明。
    基础步骤:当 \( n=1 \) 时,\( a^1 \equiv b^1 \pmod{m} \) 即 \( a \equiv b \pmod{m} \),这是已知的。
    归纳步骤:假设对于某个正整数 \( k \),有 \( a^k \equiv b^k \pmod{m} \)。
    根据乘法性质,我们有 \( a \equiv b \pmod{m} \) 和 \( a^k \equiv b^k \pmod{m} \)。将这两个同余式相乘,得到 \( a \cdot a^k \equiv b \cdot b^k \pmod{m} \),即 \( a^{k+1} \equiv b^{k+1} \pmod{m} \)。
    根据数学归纳法原理,对于所有正整数 \( n \),都有 \( a^n \equiv b^n \pmod{m} \)。

    ⑦ 消去性质 (Cancellation Property):
    这是同余式与等式的一个重要区别。在等式中,如果 \( ac = bc \) 且 \( c \ne 0 \),则 \( a=b \)。但在同余式中,\( ac \equiv bc \pmod{m} \) 并不能直接推出 \( a \equiv b \pmod{m} \)。
    例如:\( 2 \cdot 3 \equiv 2 \cdot 6 \pmod{6} \),因为 \( 6 \equiv 12 \pmod{6} \)。但 \( 3 \not\equiv 6 \pmod{6} \)。
    正确的消去规则如下:
    如果 \( ac \equiv bc \pmod{m} \),则 \( a \equiv b \pmod{m/\gcd(c, m)} \)。
    证明:如果 \( ac \equiv bc \pmod{m} \),则 \( m | (ac - bc) \),即 \( m | c(a-b) \)。
    设 \( d = \gcd(c, m) \)。则 \( c = dx \) 且 \( m = dy \),其中 \( \gcd(x, y) = 1 \)。
    \( dy | dx(a-b) \)。由于 \( d \ne 0 \),我们可以除以 \( d \),得到 \( y | x(a-b) \)。
    因为 \( \gcd(x, y) = 1 \),根据整除的性质,如果 \( y | x(a-b) \) 且 \( \gcd(x, y) = 1 \),那么 \( y | (a-b) \)。
    所以 \( m/d | (a-b) \),即 \( a \equiv b \pmod{m/d} \)。
    特别地,如果 \( \gcd(c, m) = 1 \),则 \( d=1 \),消去规则变为:
    如果 \( ac \equiv bc \pmod{m} \) 且 \( \gcd(c, m) = 1 \),则 \( a \equiv b \pmod{m} \)。

    这些基本性质是进行同余计算和证明的基础。掌握它们对于后续学习至关重要。

    4.2 剩余类 (Residue Classes) 与 完全剩余系 (Complete Residue System)

    同余关系将所有整数分成了若干个集合,每个集合中的整数都对模 \( m \) 互相同余。这些集合就是剩余类。

    4.2.1 剩余类 (Residue Classes)

    定义 4.2.1:对于给定的正整数 \( m \) 和任意整数 \( a \),集合 \( \{ x \in \mathbb{Z} \mid x \equiv a \pmod{m} \} \) 称为模 \( m \) 的一个剩余类 (residue class),记作 \( [a]_m \) 或 \( \bar{a} \)。

    根据同余的定义,\( x \equiv a \pmod{m} \) 等价于 \( x = a + km \) 对于某个整数 \( k \)。所以剩余类 \( [a]_m \) 可以表示为 \( \{ a + km \mid k \in \mathbb{Z} \} \)。

    例如,模 3 的剩余类有:
    \( [0]_3 = \{ \dots, -6, -3, 0, 3, 6, \dots \} \)
    \( [1]_3 = \{ \dots, -5, -2, 1, 4, 7, \dots \} \)
    \( [2]_3 = \{ \dots, -4, -1, 2, 5, 8, \dots \} \)

    注意,\( [a]_m = [b]_m \) 当且仅当 \( a \equiv b \pmod{m} \)。
    例如,\( [3]_3 = [0]_3 \),因为 \( 3 \equiv 0 \pmod{3} \)。\( [5]_3 = [2]_3 \),因为 \( 5 \equiv 2 \pmod{3} \)。

    模 \( m \) 的剩余类共有 \( m \) 个不同的集合。它们分别是 \( [0]_m, [1]_m, \dots, [m-1]_m \)。这 \( m \) 个剩余类构成了整数集 \( \mathbb{Z} \) 的一个划分 (partition),即每个整数都属于且仅属于这 \( m \) 个剩余类中的一个。

    4.2.2 完全剩余系 (Complete Residue System)

    定义 4.2.2:从模 \( m \) 的每一个剩余类中恰好取出一个代表元素所组成的集合,称为模 \( m \) 的一个完全剩余系 (complete residue system)。

    换句话说,一个集合 \( \{r_1, r_2, \dots, r_m\} \) 是模 \( m \) 的一个完全剩余系,如果它满足以下两个条件:
    ① 集合中有 \( m \) 个元素。
    ② 集合中的任意两个元素对模 \( m \) 都不同余,即如果 \( i \ne j \),则 \( r_i \not\equiv r_j \pmod{m} \)。
    或者等价地说,对于任意整数 \( a \),都存在唯一的 \( r_i \) 使得 \( a \equiv r_i \pmod{m} \)。

    最常用的完全剩余系是最小非负剩余组成的集合 \( \{0, 1, 2, \dots, m-1\} \)。
    另一个常用的完全剩余系是绝对值最小剩余组成的集合。如果 \( m \) 是奇数,则是 \( \{ -(m-1)/2, \dots, -1, 0, 1, \dots, (m-1)/2 \} \)。如果 \( m \) 是偶数,则是 \( \{ -m/2 + 1, \dots, -1, 0, 1, \dots, m/2 \} \) 或 \( \{ -m/2, \dots, -1, 0, 1, \dots, m/2 - 1 \} \)。

    例子:
    模 5 的完全剩余系:
    ⚝ \( \{0, 1, 2, 3, 4\} \)
    ⚝ \( \{5, 6, 7, 8, 9\} \)
    ⚝ \( \{-2, -1, 0, 1, 2\} \)
    ⚝ \( \{1, 2, 3, 4, 5\} \)

    性质:如果 \( \{r_1, r_2, \dots, r_m\} \) 是模 \( m \) 的一个完全剩余系,且 \( a \) 是一个整数,\( \gcd(a, m) = 1 \),则 \( \{ar_1, ar_2, \dots, ar_m\} \) 也是模 \( m \) 的一个完全剩余系。
    证明:我们需要证明集合 \( \{ar_1, ar_2, \dots, ar_m\} \) 中的元素对模 \( m \) 互不同余。
    假设 \( ar_i \equiv ar_j \pmod{m} \) 对于 \( i \ne j \)。
    由于 \( \gcd(a, m) = 1 \),我们可以使用消去性质 (Property ⑦),得到 \( r_i \equiv r_j \pmod{m} \)。
    但这与 \( \{r_1, r_2, \dots, r_m\} \) 是完全剩余系(其中任意两个元素互不同余)的条件矛盾。
    因此,如果 \( i \ne j \),则 \( ar_i \not\equiv ar_j \pmod{m} \)。
    集合 \( \{ar_1, ar_2, \dots, ar_m\} \) 包含 \( m \) 个对模 \( m \) 互不同余的整数,所以它构成了一个完全剩余系。

    4.3 简化剩余系 (Reduced Residue System)

    在完全剩余系中,有些元素与模 \( m \) 互质,有些则不互质。与模 \( m \) 互质的剩余类具有特殊的性质,它们构成了简化剩余系。

    4.3.1 简化剩余系 (Reduced Residue System) 的定义

    定义 4.3.1:从模 \( m \) 的每一个与 \( m \) 互质的剩余类中恰好取出一个代表元素所组成的集合,称为模 \( m \) 的一个简化剩余系 (reduced residue system)。

    换句话说,一个集合 \( \{r_1, r_2, \dots, r_k\} \) 是模 \( m \) 的一个简化剩余系,如果它满足以下三个条件:
    ① 集合中的每个元素 \( r_i \) 都与 \( m \) 互质,即 \( \gcd(r_i, m) = 1 \)。
    ② 集合中的任意两个元素对模 \( m \) 都不同余,即如果 \( i \ne j \),则 \( r_i \not\equiv r_j \pmod{m} \)。
    ③ 任何与 \( m \) 互质的整数 \( a \) 都与集合中的某个元素 \( r_i \) 对模 \( m \) 同余,即 \( a \equiv r_i \pmod{m} \)。

    简化剩余系中元素的个数由欧拉函数 (Euler's Totient Function) \( \phi(m) \) 给出。\( \phi(m) \) 定义为小于等于 \( m \) 且与 \( m \) 互质的正整数的个数。我们将在下一章详细讨论欧拉函数,但在这里我们需要知道简化剩余系恰好包含 \( \phi(m) \) 个元素。

    例子:
    模 10 的简化剩余系:
    小于等于 10 且与 10 互质的正整数有 1, 3, 7, 9。所以 \( \phi(10) = 4 \)。
    一个简化剩余系是 \( \{1, 3, 7, 9\} \)。
    另一个简化剩余系可以是 \( \{11, 13, 17, 19\} \),因为 \( 11 \equiv 1 \pmod{10} \),\( 13 \equiv 3 \pmod{10} \),\( 17 \equiv 7 \pmod{10} \),\( 19 \equiv 9 \pmod{10} \)。
    还可以是 \( \{-9, -7, -3, -1\} \),因为 \( -9 \equiv 1 \pmod{10} \),等等。

    性质:如果 \( \{r_1, r_2, \dots, r_{\phi(m)}\} \) 是模 \( m \) 的一个简化剩余系,且 \( a \) 是一个整数,\( \gcd(a, m) = 1 \),则 \( \{ar_1, ar_2, \dots, ar_{\phi(m)}\} \) 也是模 \( m \) 的一个简化剩余系。
    证明:
    ① 对于集合中的每个元素 \( ar_i \),因为 \( \gcd(a, m) = 1 \) 且 \( \gcd(r_i, m) = 1 \),所以 \( \gcd(ar_i, m) = \gcd(a, m) \gcd(r_i, m) = 1 \cdot 1 = 1 \)。所以 \( ar_i \) 都与 \( m \) 互质。
    ② 集合中有 \( \phi(m) \) 个元素。我们需要证明它们对模 \( m \) 互不同余。假设 \( ar_i \equiv ar_j \pmod{m} \) 对于 \( i \ne j \)。由于 \( \gcd(a, m) = 1 \),根据消去性质,得到 \( r_i \equiv r_j \pmod{m} \)。但这与 \( \{r_1, \dots, r_{\phi(m)}\} \) 是简化剩余系(其中任意两个元素互不同余)的条件矛盾。因此,如果 \( i \ne j \),则 \( ar_i \not\equiv ar_j \pmod{m} \)。
    ③ 考虑任意一个与 \( m \) 互质的整数 \( b \)。我们需要证明存在某个 \( r_i \) 使得 \( b \equiv ar_i \pmod{m} \)。由于 \( \gcd(a, m) = 1 \),线性同余方程 \( ax \equiv b \pmod{m} \) 有唯一解模 \( m \)。设这个解为 \( x_0 \)。因为 \( \gcd(a, m) = 1 \) 且 \( \gcd(b, m) = 1 \),所以 \( \gcd(ax_0, m) = \gcd(b, m) = 1 \)。这意味着 \( \gcd(x_0, m) = 1 \)。由于 \( \{r_1, \dots, r_{\phi(m)}\} \) 是简化剩余系,\( x_0 \) 必然与某个 \( r_i \) 对模 \( m \) 同余,即 \( x_0 \equiv r_i \pmod{m} \)。于是 \( ax_0 \equiv ar_i \pmod{m} \)。因为 \( ax_0 \equiv b \pmod{m} \),所以 \( b \equiv ar_i \pmod{m} \)。
    综上,\( \{ar_1, ar_2, \dots, ar_{\phi(m)}\} \) 构成了模 \( m \) 的一个简化剩余系。

    简化剩余系在研究模 \( m \) 下的乘法结构时非常有用,它是理解欧拉定理和原根等概念的基础。

    4.4 线性同余方程 (Linear Congruence Equations)

    线性同余方程是形如 \( ax \equiv b \pmod{m} \) 的方程,其中 \( a, b \) 是整数,\( m \) 是正整数,\( x \) 是未知数。求解线性同余方程是同余理论的一个基本应用。

    4.4.1 方程解的存在性 (Existence of Solutions)

    考虑线性同余方程 \( ax \equiv b \pmod{m} \)。
    根据同余的定义,这等价于 \( ax - b = km \) 对于某个整数 \( k \),即 \( ax - km = b \)。
    这是一个关于未知数 \( x \) 和 \( k \) 的线性丢番图方程 (Linear Diophantine Equation)。
    根据第二章裴蜀定理 (Bézout's Identity) 的推论,线性丢番图方程 \( ax + my = b \) 有解当且仅当 \( \gcd(a, m) \) 整除 \( b \)。
    因此,线性同余方程 \( ax \equiv b \pmod{m} \) 有解当且仅当 \( \gcd(a, m) | b \)。

    4.4.2 方程解的个数 (Number of Solutions)

    如果 \( \gcd(a, m) | b \),设 \( d = \gcd(a, m) \)。线性丢番图方程 \( ax - km = b \) 有解。
    如果 \( (x_0, k_0) \) 是它的一组特解,那么通解为:
    \( x = x_0 + t \cdot (m/d) \)
    \( k = k_0 + t \cdot (a/d) \)
    其中 \( t \) 是任意整数。

    我们关心的是 \( x \) 对模 \( m \) 的解。
    考虑通解 \( x = x_0 + t \cdot (m/d) \)。
    当 \( t \) 取 \( 0, 1, \dots, d-1 \) 时,我们得到 \( d \) 个不同的解:
    \( x_0, x_0 + m/d, x_0 + 2(m/d), \dots, x_0 + (d-1)(m/d) \)。
    这些解对模 \( m \) 互不同余。
    例如,假设 \( x_0 + t_1 (m/d) \equiv x_0 + t_2 (m/d) \pmod{m} \) 对于 \( 0 \le t_1, t_2 < d \)。
    则 \( t_1 (m/d) \equiv t_2 (m/d) \pmod{m} \)。
    根据消去性质,由于 \( \gcd(m/d, m) = m/d \),我们可以消去 \( m/d \),得到 \( t_1 \equiv t_2 \pmod{m/(m/d)} \),即 \( t_1 \equiv t_2 \pmod{d} \)。
    因为 \( 0 \le t_1, t_2 < d \),所以 \( t_1 = t_2 \)。
    这说明这 \( d \) 个解对模 \( m \) 互不同余。

    如果 \( t \) 取其他整数值,例如 \( t = qd + r \) 其中 \( 0 \le r < d \),则
    \( x = x_0 + (qd + r)(m/d) = x_0 + qm + r(m/d) \equiv x_0 + r(m/d) \pmod{m} \)。
    这个解与 \( t=r \) 时得到的解对模 \( m \) 同余。
    因此,如果 \( \gcd(a, m) | b \),则线性同余方程 \( ax \equiv b \pmod{m} \) 恰好有 \( d = \gcd(a, m) \) 个对模 \( m \) 互不同余的解。

    特别地,如果 \( \gcd(a, m) = 1 \),则方程 \( ax \equiv b \pmod{m} \) 恰好有 \( 1 \) 个对模 \( m \) 的解。

    4.4.3 求解方法 (Method of Solving)

    求解线性同余方程 \( ax \equiv b \pmod{m} \) 的步骤:
    ① 计算 \( d = \gcd(a, m) \)。
    ② 检查 \( d \) 是否整除 \( b \)。如果 \( d \nmid b \),则方程无解。
    ③ 如果 \( d | b \),则方程有 \( d \) 个解。我们可以先求解对应的线性丢番图方程 \( ax + my = b \)。
    使用扩展欧几里得算法 (Extended Euclidean Algorithm) 找到整数 \( x_0' \) 和 \( y_0' \) 使得 \( ax_0' + my_0' = \gcd(a, m) = d \)。
    因为 \( d | b \),令 \( b = b'd \)。将等式两边乘以 \( b'/d \),得到 \( a(x_0' \cdot b/d) + m(y_0' \cdot b/d) = b \)。
    所以 \( x_p = x_0' \cdot (b/d) \) 是线性丢番图方程的一个特解。
    这个特解 \( x_p \) 也是同余方程 \( ax \equiv b \pmod{m} \) 的一个特解。
    ④ 方程的全部解为 \( x \equiv x_p + k \cdot (m/d) \pmod{m} \),其中 \( k = 0, 1, \dots, d-1 \)。

    例子:求解同余方程 \( 6x \equiv 4 \pmod{8} \)。
    ① 计算 \( d = \gcd(6, 8) = 2 \)。
    ② 检查 \( d | b \):\( 2 | 4 \)。方程有解,且有 \( d=2 \) 个解。
    ③ 求解 \( 6x + 8y = 4 \)。
    使用扩展欧几里得算法求解 \( 6x' + 8y' = \gcd(6, 8) = 2 \):
    \( 8 = 1 \cdot 6 + 2 \)
    \( 2 = 8 - 1 \cdot 6 \)
    所以 \( 6(-1) + 8(1) = 2 \)。这里 \( x_0' = -1 \)。
    将等式两边乘以 \( b/d = 4/2 = 2 \):
    \( 6(-1 \cdot 2) + 8(1 \cdot 2) = 4 \)
    \( 6(-2) + 8(2) = 4 \)
    所以 \( x_p = -2 \) 是一个特解。
    ④ 全部解为 \( x \equiv -2 + k \cdot (8/2) \pmod{8} \),其中 \( k = 0, 1 \)。
    当 \( k=0 \),\( x \equiv -2 \pmod{8} \),即 \( x \equiv 6 \pmod{8} \)。
    当 \( k=1 \),\( x \equiv -2 + 1 \cdot 4 \pmod{8} \),即 \( x \equiv 2 \pmod{8} \)。
    所以方程的解是 \( x \equiv 2 \pmod{8} \) 和 \( x \equiv 6 \pmod{8} \)。
    我们可以验证:
    \( 6 \cdot 2 = 12 \equiv 4 \pmod{8} \)
    \( 6 \cdot 6 = 36 \equiv 4 \pmod{8} \)

    另一种求解 \( ax \equiv b \pmod{m} \) 当 \( \gcd(a, m) = 1 \) 的方法是找到 \( a \) 对模 \( m \) 的乘法逆元 (multiplicative inverse)。
    如果 \( \gcd(a, m) = 1 \),则存在唯一的整数 \( a^{-1} \) (模 \( m \)) 使得 \( aa^{-1} \equiv 1 \pmod{m} \)。
    将方程 \( ax \equiv b \pmod{m} \) 两边同时乘以 \( a^{-1} \),得到 \( a^{-1} (ax) \equiv a^{-1} b \pmod{m} \),即 \( (a^{-1} a) x \equiv a^{-1} b \pmod{m} \),所以 \( 1 \cdot x \equiv a^{-1} b \pmod{m} \),即 \( x \equiv a^{-1} b \pmod{m} \)。
    乘法逆元 \( a^{-1} \) 可以通过扩展欧几里得算法求解 \( ax + my = 1 \) 得到。如果 \( ax_0 + my_0 = 1 \),则 \( ax_0 \equiv 1 \pmod{m} \),所以 \( x_0 \) 就是 \( a \) 对模 \( m \) 的乘法逆元。

    例子:求解同余方程 \( 3x \equiv 5 \pmod{7} \)。
    ① 计算 \( d = \gcd(3, 7) = 1 \)。
    ② 检查 \( d | b \):\( 1 | 5 \)。方程有解,且有 \( d=1 \) 个解。
    ③ 求解 \( 3x \equiv 5 \pmod{7} \)。
    我们可以尝试找到 3 对模 7 的乘法逆元。
    \( 3 \cdot 1 = 3 \equiv 3 \pmod{7} \)
    \( 3 \cdot 2 = 6 \equiv 6 \pmod{7} \)
    \( 3 \cdot 3 = 9 \equiv 2 \pmod{7} \)
    \( 3 \cdot 4 = 12 \equiv 5 \pmod{7} \)
    \( 3 \cdot 5 = 15 \equiv 1 \pmod{7} \)。所以 5 是 3 对模 7 的乘法逆元。\( 3^{-1} \equiv 5 \pmod{7} \)。
    将方程两边乘以 5:
    \( 5 \cdot (3x) \equiv 5 \cdot 5 \pmod{7} \)
    \( 15x \equiv 25 \pmod{7} \)
    \( x \equiv 4 \pmod{7} \)
    方程的解是 \( x \equiv 4 \pmod{7} \)。
    验证:\( 3 \cdot 4 = 12 \equiv 5 \pmod{7} \)。

    使用扩展欧几里得算法求解 \( 3x + 7y = 1 \):
    \( 7 = 2 \cdot 3 + 1 \)
    \( 1 = 7 - 2 \cdot 3 \)
    所以 \( 3(-2) + 7(1) = 1 \)。\( x_0 = -2 \)。
    \( -2 \equiv 5 \pmod{7} \)。所以 \( 3^{-1} \equiv 5 \pmod{7} \)。
    \( x \equiv 3^{-1} \cdot 5 \equiv 5 \cdot 5 \equiv 25 \equiv 4 \pmod{7} \)。

    4.5 中国剩余定理 (Chinese Remainder Theorem, CRT)

    中国剩余定理是数论中一个非常重要的定理,它解决了这样一个问题:给定一组模数两两互质的同余方程组,是否存在一个整数解能够同时满足所有方程。这个问题最早出现在中国古代数学著作《孙子算经》中,因此得名。

    4.5.1 定理的陈述 (Statement of the Theorem)

    定理 4.5.1 (中国剩余定理):设 \( m_1, m_2, \dots, m_k \) 是两两互质 (pairwise coprime) 的正整数,即当 \( i \ne j \) 时,\( \gcd(m_i, m_j) = 1 \)。则对于任意整数 \( a_1, a_2, \dots, a_k \),同余方程组
    \[ \begin{cases} x \equiv a_1 \pmod{m_1} \\ x \equiv a_2 \pmod{m_2} \\ \vdots \\ x \equiv a_k \pmod{m_k} \end{cases} \]
    存在一个整数解 \( x \),且在模 \( M = m_1 m_2 \dots m_k \) 的意义下是唯一的。

    这意味着存在唯一的解 \( x_0 \) 满足 \( 0 \le x_0 < M \),使得任何满足方程组的解 \( x \) 都有 \( x \equiv x_0 \pmod{M} \)。

    4.5.2 构造性证明与求解方法 (Constructive Proof and Solving Method)

    我们可以通过构造一个解来证明定理的存在性,同时这也提供了一种求解方法。
    设 \( M = m_1 m_2 \dots m_k \)。对于每一个 \( i \in \{1, 2, \dots, k\} \),令 \( M_i = M/m_i \)。
    由于 \( m_1, m_2, \dots, m_k \) 两两互质,所以 \( M_i \) 与 \( m_i \) 互质,即 \( \gcd(M_i, m_i) = 1 \)。
    根据线性同余方程的理论,同余方程 \( M_i y_i \equiv 1 \pmod{m_i} \) 存在唯一的解 \( y_i \) 模 \( m_i \)。这个 \( y_i \) 就是 \( M_i \) 对模 \( m_i \) 的乘法逆元。

    考虑构造一个解 \( x \) 的形式:
    \( x = a_1 M_1 y_1 + a_2 M_2 y_2 + \dots + a_k M_k y_k \)

    我们来验证这个 \( x \) 是否满足方程组中的每一个方程。
    考虑第 \( i \) 个方程 \( x \equiv a_i \pmod{m_i} \)。
    对于 \( j \ne i \),\( m_j \) 是 \( M_i = m_1 \dots m_j \dots m_k / m_i \) 的一个因子。由于 \( m_j | M_j \),所以 \( M_j \equiv 0 \pmod{m_i} \) 当 \( j \ne i \)。
    因此,在模 \( m_i \) 的意义下,除了第 \( i \) 项 \( a_i M_i y_i \) 外,其他项 \( a_j M_j y_j \) (其中 \( j \ne i \)) 都同余于 0。
    所以,
    \( x = a_1 M_1 y_1 + \dots + a_i M_i y_i + \dots + a_k M_k y_k \)
    \( x \equiv 0 + \dots + a_i M_i y_i + \dots + 0 \pmod{m_i} \)
    \( x \equiv a_i (M_i y_i) \pmod{m_i} \)
    根据我们对 \( y_i \) 的选择,\( M_i y_i \equiv 1 \pmod{m_i} \)。
    所以,\( x \equiv a_i \cdot 1 \pmod{m_i} \),即 \( x \equiv a_i \pmod{m_i} \)。
    这表明我们构造的 \( x \) 满足方程组中的每一个方程。因此,方程组存在解。

    接下来证明解的唯一性。
    假设 \( x_1 \) 和 \( x_2 \) 都是方程组的解。
    则对于每一个 \( i \in \{1, 2, \dots, k\} \),我们有:
    \( x_1 \equiv a_i \pmod{m_i} \)
    \( x_2 \equiv a_i \pmod{m_i} \)
    由此可得 \( x_1 - x_2 \equiv a_i - a_i \equiv 0 \pmod{m_i} \)。
    这意味着 \( m_i | (x_1 - x_2) \) 对于所有的 \( i = 1, 2, \dots, k \)。
    由于 \( m_1, m_2, \dots, m_k \) 两两互质,它们的最小公倍数 (Least Common Multiple, LCM) 等于它们的乘积 \( M = m_1 m_2 \dots m_k \)。
    因为 \( x_1 - x_2 \) 是每一个 \( m_i \) 的倍数,所以 \( x_1 - x_2 \) 也是它们的最小公倍数 \( M \) 的倍数。
    即 \( M | (x_1 - x_2) \),所以 \( x_1 \equiv x_2 \pmod{M} \)。
    这证明了方程组的解在模 \( M \) 的意义下是唯一的。

    求解步骤总结:
    ① 计算 \( M = m_1 m_2 \dots m_k \)。
    ② 对于每一个 \( i = 1, \dots, k \),计算 \( M_i = M/m_i \)。
    ③ 对于每一个 \( i = 1, \dots, k \),求解线性同余方程 \( M_i y_i \equiv 1 \pmod{m_i} \) 得到 \( y_i \)。这可以通过扩展欧几里得算法实现。
    ④ 方程组的一个特解为 \( x_p = \sum_{i=1}^k a_i M_i y_i \)。
    ⑤ 方程组的通解为 \( x \equiv x_p \pmod{M} \)。

    例子:求解同余方程组
    \[ \begin{cases} x \equiv 2 \pmod{3} \\ x \equiv 3 \pmod{5} \\ x \equiv 2 \pmod{7} \end{cases} \]
    ① 模数是 3, 5, 7。它们两两互质。
    \( M = 3 \cdot 5 \cdot 7 = 105 \)。
    ② 计算 \( M_i \):
    \( M_1 = 105/3 = 35 \)
    \( M_2 = 105/5 = 21 \)
    \( M_3 = 105/7 = 15 \)
    ③ 求解 \( M_i y_i \equiv 1 \pmod{m_i} \):
    对于 \( i=1 \):\( 35 y_1 \equiv 1 \pmod{3} \)。
    \( 35 \equiv 2 \pmod{3} \),所以 \( 2 y_1 \equiv 1 \pmod{3} \)。
    \( 2 \cdot 2 = 4 \equiv 1 \pmod{3} \)。所以 \( y_1 \equiv 2 \pmod{3} \)。
    对于 \( i=2 \):\( 21 y_2 \equiv 1 \pmod{5} \)。
    \( 21 \equiv 1 \pmod{5} \),所以 \( 1 y_2 \equiv 1 \pmod{5} \)。所以 \( y_2 \equiv 1 \pmod{5} \)。
    对于 \( i=3 \):\( 15 y_3 \equiv 1 \pmod{7} \)。
    \( 15 \equiv 1 \pmod{7} \),所以 \( 1 y_3 \equiv 1 \pmod{7} \)。所以 \( y_3 \equiv 1 \pmod{7} \)。
    ④ 计算特解 \( x_p \):
    \( x_p = a_1 M_1 y_1 + a_2 M_2 y_2 + a_3 M_3 y_3 \)
    \( x_p = 2 \cdot 35 \cdot 2 + 3 \cdot 21 \cdot 1 + 2 \cdot 15 \cdot 1 \)
    \( x_p = 140 + 63 + 30 = 233 \)
    ⑤ 通解为 \( x \equiv x_p \pmod{M} \):
    \( x \equiv 233 \pmod{105} \)。
    \( 233 = 2 \cdot 105 + 23 \)。
    所以 \( x \equiv 23 \pmod{105} \)。
    方程组的解是 \( x \equiv 23 \pmod{105} \)。

    验证:
    \( 23 \equiv 2 \pmod{3} \) (因为 \( 23 = 7 \cdot 3 + 2 \))
    \( 23 \equiv 3 \pmod{5} \) (因为 \( 23 = 4 \cdot 5 + 3 \))
    \( 23 \equiv 2 \pmod{7} \) (因为 \( 23 = 3 \cdot 7 + 2 \))
    解是正确的。

    4.5.3 应用 (Applications)

    中国剩余定理在许多领域都有应用:
    ⚝ 密码学 (Cryptography):例如 RSA 公钥密码系统中的计算。
    ⚝ 计算机科学 (Computer Science):例如大整数计算、并行计算中的任务分配。
    ⚝ 编码理论 (Coding Theory)。
    ⚝ 模形式 (Modular Forms) 等纯数学领域。

    中国剩余定理是数论中一个非常优美且实用的工具,它将多个模下的问题转化为一个大模下的问题,极大地简化了分析。

    本章我们深入学习了同余的概念、性质、剩余类以及如何求解线性同余方程和同余方程组。同余是数论的基石之一,掌握好这些内容对于后续学习更高级的数论知识至关重要。在下一章,我们将利用同余的工具,探索一些重要的同余定理,如费马小定理、欧拉定理和威尔逊定理。

    5. chapter 重要的同余定理 (Important Congruence Theorems)

    在前面的章节中,我们学习了同余的基本概念、性质以及如何求解线性同余方程和同余方程组。同余理论是数论中一个极其强大且应用广泛的工具。本章将深入探讨几个在数论发展史上和现代应用中都占据核心地位的重要同余定理:费马小定理、欧拉定理、威尔逊定理,以及与素性检验相关的伪素数和卡迈克尔数。这些定理不仅揭示了整数之间深刻的同余关系,更是许多高级数论概念和算法的基础。

    5.1 费马小定理 (Fermat's Little Theorem)

    费马小定理是数论中一个基础且优美的定理,由皮埃尔·德·费马 (Pierre de Fermat) 于17世纪提出。它描述了当一个整数与一个素数互质时,该整数的幂与素数之间的同余关系。

    5.1.1 定理的陈述 (Statement of the Theorem)

    定理 5.1.1 (费马小定理):如果 \( p \) 是一个素数 (prime number),而 \( a \) 是一个不被 \( p \) 整除的整数 (integer),即 \( \gcd(a, p) = 1 \),那么有
    \[ a^{p-1} \equiv 1 \pmod{p} \]
    如果 \( a \) 是任意整数,则有
    \[ a^p \equiv a \pmod{p} \]

    解释
    ① 第一种形式说明,当 \( a \) 与素数 \( p \) 互质时,将 \( a \) 连乘 \( p-1 \) 次后对 \( p \) 取余,结果总是 1。
    ② 第二种形式是第一种形式的推广,它对所有整数 \( a \) 都成立。如果 \( \gcd(a, p) = 1 \),则两边同除以 \( a \) (在模 \( p \) 的意义下,因为 \( a \) 有模 \( p \) 的乘法逆元),就得到第一种形式。如果 \( p | a \),那么 \( a \equiv 0 \pmod{p} \), \( a^p \equiv 0^p \equiv 0 \pmod{p} \) (对于 \( p \ge 2 \)),所以 \( a^p \equiv a \pmod{p} \) 也成立。

    5.1.2 证明思路 (Proof Idea)

    费马小定理有多种证明方法,这里介绍一种基于同余性质的证明思路。

    证明 (对于 \( \gcd(a, p) = 1 \))
    考虑集合 \( S = \{1, 2, \dots, p-1\} \)。这个集合包含了模 \( p \) 的所有非零剩余类 (non-zero residue classes)。
    考虑将集合 \( S \) 中的每个元素都乘以 \( a \) 后对 \( p \) 取余,得到集合 \( S' = \{a \cdot 1 \pmod{p}, a \cdot 2 \pmod{p}, \dots, a \cdot (p-1) \pmod{p}\} \)。

    我们需要证明集合 \( S' \) 实际上就是集合 \( S \) 的元素重新排列。
    ⚝ 首先,对于任意 \( i \in S \), \( a \cdot i \pmod{p} \) 不可能为 0。因为 \( \gcd(a, p) = 1 \) 且 \( p \) 是素数,如果 \( a \cdot i \equiv 0 \pmod{p} \),则 \( p | (a \cdot i) \)。由于 \( p \) 是素数,这蕴含着 \( p | a \) 或 \( p | i \)。但我们已知 \( \gcd(a, p) = 1 \) (即 \( p \nmid a \)),且 \( i \in \{1, 2, \dots, p-1\} \) (即 \( p \nmid i \))。这导致矛盾。因此,\( a \cdot i \pmod{p} \in \{1, 2, \dots, p-1\} \)。
    ⚝ 其次,集合 \( S' \) 中的元素互不相同。假设对于 \( i, j \in S \) 且 \( i \ne j \),有 \( a \cdot i \equiv a \cdot j \pmod{p} \)。由于 \( \gcd(a, p) = 1 \), \( a \) 在模 \( p \) 意义下有乘法逆元。将同余式的两边同乘以 \( a \) 的逆元,得到 \( i \equiv j \pmod{p} \)。由于 \( i, j \in \{1, 2, \dots, p-1\} \),这蕴含着 \( i = j \),与假设矛盾。因此,集合 \( S' \) 中的 \( p-1 \) 个元素是 \( \{1, 2, \dots, p-1\} \) 的一个排列。

    这意味着集合 \( S \) 中所有元素的乘积与集合 \( S' \) 中所有元素的乘积在模 \( p \) 意义下是同余的。
    \[ 1 \cdot 2 \cdot \dots \cdot (p-1) \equiv (a \cdot 1) \cdot (a \cdot 2) \cdot \dots \cdot (a \cdot (p-1)) \pmod{p} \]
    \[ (p-1)! \equiv a^{p-1} \cdot (1 \cdot 2 \cdot \dots \cdot (p-1)) \pmod{p} \]
    \[ (p-1)! \equiv a^{p-1} \cdot (p-1)! \pmod{p} \]
    由于 \( p \) 是素数,且 \( p > p-1 \ge 1 \),所以 \( \gcd((p-1)!, p) = 1 \)。这意味着 \( (p-1)! \) 在模 \( p \) 意义下有乘法逆元。将同余式的两边同乘以 \( (p-1)! \) 的逆元,得到
    \[ 1 \equiv a^{p-1} \pmod{p} \]
    证毕。

    5.1.3 例子 (Examples)

    例 5.1.2:取素数 \( p = 5 \),整数 \( a = 3 \)。 \( \gcd(3, 5) = 1 \)。
    根据费马小定理,应有 \( 3^{5-1} \equiv 1 \pmod{5} \)。
    计算 \( 3^4 = 81 \)。 \( 81 = 16 \times 5 + 1 \),所以 \( 81 \equiv 1 \pmod{5} \)。定理成立。

    例 5.1.3:取素数 \( p = 7 \),整数 \( a = 10 \)。 \( \gcd(10, 7) = 1 \)。
    根据费马小定理,应有 \( 10^{7-1} \equiv 1 \pmod{7} \)。
    计算 \( 10^6 = 1,000,000 \)。
    \( 10 \equiv 3 \pmod{7} \)。
    所以 \( 10^6 \equiv 3^6 \pmod{7} \)。
    \( 3^1 \equiv 3 \pmod{7} \)
    \( 3^2 \equiv 9 \equiv 2 \pmod{7} \)
    \( 3^3 \equiv 3 \cdot 2 = 6 \pmod{7} \)
    \( 3^6 = (3^3)^2 \equiv 6^2 = 36 \pmod{7} \)。
    \( 36 = 5 \times 7 + 1 \),所以 \( 36 \equiv 1 \pmod{7} \)。定理成立。

    例 5.1.4:取素数 \( p = 5 \),整数 \( a = 10 \)。 \( \gcd(10, 5) = 5 \ne 1 \)。
    使用第二种形式:\( a^p \equiv a \pmod{p} \)。
    应有 \( 10^5 \equiv 10 \pmod{5} \)。
    \( 10 \equiv 0 \pmod{5} \)。
    \( 10^5 \equiv 0^5 = 0 \pmod{5} \)。
    所以 \( 10^5 \equiv 0 \equiv 10 \pmod{5} \)。定理成立。

    5.1.4 应用 (Applications)

    费马小定理在数论中有许多应用,其中最著名的是用于素性检验 (primality testing)。如果对于某个整数 \( n > 1 \) 和某个整数 \( a \) 满足 \( \gcd(a, n) = 1 \),但 \( a^{n-1} \not\equiv 1 \pmod{n} \),那么 \( n \) 一定是合数 (composite number)。这是因为如果 \( n \) 是素数,费马小定理保证 \( a^{n-1} \equiv 1 \pmod{n} \) 成立。

    然而,费马小定理的逆命题不总是成立的。也就是说,即使对于某个 \( a \) 满足 \( a^{n-1} \equiv 1 \pmod{n} \), \( n \) 也可能不是素数。满足这个条件的合数被称为基于底数 \( a \) 的伪素数 (pseudoprime to base \( a \))。我们将在本章的最后一节讨论伪素数和卡迈克尔数。

    5.2 欧拉定理 (Euler's Theorem) 与 欧拉函数 (Euler's Totient Function, Phi Function)

    欧拉定理是费马小定理的推广,它将模数从素数推广到了任意正整数。为了陈述欧拉定理,我们需要先引入欧拉函数。

    5.2.1 欧拉函数 \( \phi(n) \) (Euler's Totient Function \( \phi(n) \))

    定义 5.2.1 (欧拉函数):对于正整数 \( n \),欧拉函数 \( \phi(n) \) 定义为小于或等于 \( n \) 的正整数中与 \( n \) 互质 (coprime or relatively prime) 的数的个数。
    \[ \phi(n) = |\{k \in \mathbb{Z}^+ \mid 1 \le k \le n, \gcd(k, n) = 1\}| \]

    例子
    ⚝ \( \phi(1) = 1 \) (只有 1 与 1 互质)
    ⚝ \( \phi(2) = 1 \) (只有 1 与 2 互质)
    ⚝ \( \phi(3) = 2 \) (1, 2 与 3 互质)
    ⚝ \( \phi(4) = 2 \) (1, 3 与 4 互质)
    ⚝ \( \phi(5) = 4 \) (1, 2, 3, 4 与 5 互质)
    ⚝ \( \phi(6) = 2 \) (1, 5 与 6 互质)

    计算欧拉函数的值
    欧拉函数是一个积性函数 (multiplicative function)。这意味着如果 \( \gcd(m, n) = 1 \),那么 \( \phi(mn) = \phi(m)\phi(n) \)。
    利用这个性质,我们可以通过 \( n \) 的素因数分解来计算 \( \phi(n) \)。
    如果 \( n = p_1^{k_1} p_2^{k_2} \dots p_r^{k_r} \) 是 \( n \) 的标准素因数分解 (standard prime factorization),其中 \( p_i \) 是不同的素数,\( k_i \ge 1 \),那么
    \[ \phi(n) = n \prod_{i=1}^r \left(1 - \frac{1}{p_i}\right) = n \left(1 - \frac{1}{p_1}\right) \left(1 - \frac{1}{p_2}\right) \dots \left(1 - \frac{1}{p_r}\right) \]
    \[ \phi(n) = p_1^{k_1} \left(1 - \frac{1}{p_1}\right) \cdot p_2^{k_2} \left(1 - \frac{1}{p_2}\right) \cdot \dots \cdot p_r^{k_r} \left(1 - \frac{1}{p_r}\right) \]
    \[ \phi(n) = (p_1^{k_1} - p_1^{k_1-1}) \cdot (p_2^{k_2} - p_2^{k_2-1}) \cdot \dots \cdot (p_r^{k_r} - p_r^{k_r-1}) \]
    \[ \phi(n) = p_1^{k_1-1}(p_1 - 1) \cdot p_2^{k_2-1}(p_2 - 1) \cdot \dots \cdot p_r^{k_r-1}(p_r - 1) \]

    例子
    ⚝ \( \phi(12) \)。 \( 12 = 2^2 \cdot 3^1 \)。 \( p_1=2, k_1=2; p_2=3, k_2=1 \)。
    \( \phi(12) = 12 \left(1 - \frac{1}{2}\right) \left(1 - \frac{1}{3}\right) = 12 \cdot \frac{1}{2} \cdot \frac{2}{3} = 4 \)。
    或者 \( \phi(12) = (2^2 - 2^1)(3^1 - 3^0) = (4-2)(3-1) = 2 \cdot 2 = 4 \)。
    小于等于 12 且与 12 互质的数是 1, 5, 7, 11,共 4 个。

    5.2.2 定理的陈述 (Statement of the Theorem)

    定理 5.2.2 (欧拉定理):如果 \( n \) 是一个正整数,而 \( a \) 是一个与 \( n \) 互质的整数,即 \( \gcd(a, n) = 1 \),那么有
    \[ a^{\phi(n)} \equiv 1 \pmod{n} \]

    解释:欧拉定理是费马小定理的直接推广。当 \( n \) 是素数 \( p \) 时,\( \phi(p) = p-1 \),欧拉定理就退化为费马小定理的第一种形式 \( a^{p-1} \equiv 1 \pmod{p} \)。

    5.2.3 证明思路 (Proof Idea)

    欧拉定理的证明思路与费马小定理类似,但需要使用简化剩余系 (reduced residue system)。

    定义 5.2.3 (简化剩余系):模 \( n \) 的一个简化剩余系是与 \( n \) 互质的 \( \phi(n) \) 个整数组成的集合,它们模 \( n \) 两两不同余。
    例如,模 6 的简化剩余系可以是 \( \{1, 5\} \),因为 \( \phi(6)=2 \),且 \( \gcd(1, 6)=1, \gcd(5, 6)=1 \)。另一个简化剩余系可以是 \( \{7, 11\} \),因为 \( 7 \equiv 1 \pmod{6} \) 且 \( 11 \equiv 5 \pmod{6} \)。

    证明 (欧拉定理)
    设 \( \{r_1, r_2, \dots, r_{\phi(n)}\} \) 是模 \( n \) 的一个简化剩余系。
    考虑集合 \( S = \{r_1, r_2, \dots, r_{\phi(n)}\} \)。
    由于 \( \gcd(a, n) = 1 \),考虑将集合 \( S \) 中的每个元素都乘以 \( a \) 后对 \( n \) 取余,得到集合 \( S' = \{a r_1 \pmod{n}, a r_2 \pmod{n}, \dots, a r_{\phi(n)} \pmod{n}\} \)。

    我们需要证明集合 \( S' \) 也是模 \( n \) 的一个简化剩余系。
    ⚝ 首先,对于任意 \( r_i \in S \), \( \gcd(r_i, n) = 1 \)。由于 \( \gcd(a, n) = 1 \) 且 \( \gcd(r_i, n) = 1 \),所以 \( \gcd(a r_i, n) = 1 \)。这意味着 \( a r_i \pmod{n} \) 与 \( n \) 互质,因此 \( a r_i \pmod{n} \) 属于模 \( n \) 的简化剩余类。
    ⚝ 其次,集合 \( S' \) 中的元素模 \( n \) 两两不同余。假设对于 \( r_i, r_j \in S \) 且 \( i \ne j \),有 \( a r_i \equiv a r_j \pmod{n} \)。由于 \( \gcd(a, n) = 1 \), \( a \) 在模 \( n \) 意义下有乘法逆元。将同余式的两边同乘以 \( a \) 的逆元,得到 \( r_i \equiv r_j \pmod{n} \)。由于 \( \{r_1, \dots, r_{\phi(n)}\} \) 是一个简化剩余系,其元素模 \( n \) 两两不同余,这蕴含着 \( i = j \),与假设矛盾。因此,集合 \( S' \) 中的 \( \phi(n) \) 个元素模 \( n \) 两两不同余。

    综上所述,集合 \( S' \) 也是模 \( n \) 的一个简化剩余系。这意味着集合 \( S \) 中所有元素的乘积与集合 \( S' \) 中所有元素的乘积在模 \( n \) 意义下是同余的。
    \[ r_1 r_2 \dots r_{\phi(n)} \equiv (a r_1) (a r_2) \dots (a r_{\phi(n)}) \pmod{n} \]
    \[ \prod_{i=1}^{\phi(n)} r_i \equiv a^{\phi(n)} \left(\prod_{i=1}^{\phi(n)} r_i\right) \pmod{n} \]
    设 \( R = \prod_{i=1}^{\phi(n)} r_i \)。由于每个 \( r_i \) 都与 \( n \) 互质,它们的乘积 \( R \) 也与 \( n \) 互质。即 \( \gcd(R, n) = 1 \)。这意味着 \( R \) 在模 \( n \) 意义下有乘法逆元。将同余式的两边同乘以 \( R \) 的逆元,得到
    \[ 1 \equiv a^{\phi(n)} \pmod{n} \]
    证毕。

    5.2.4 例子 (Examples)

    例 5.2.4:取 \( n = 12 \), \( a = 5 \)。 \( \gcd(5, 12) = 1 \)。 \( \phi(12) = 4 \)。
    根据欧拉定理,应有 \( 5^{\phi(12)} \equiv 1 \pmod{12} \),即 \( 5^4 \equiv 1 \pmod{12} \)。
    计算 \( 5^4 = 625 \)。
    \( 625 = 52 \times 12 + 1 \),所以 \( 625 \equiv 1 \pmod{12} \)。定理成立。

    例 5.2.5:取 \( n = 10 \), \( a = 3 \)。 \( \gcd(3, 10) = 1 \)。 \( \phi(10) \)。 \( 10 = 2 \cdot 5 \)。 \( \phi(10) = \phi(2)\phi(5) = 1 \cdot 4 = 4 \)。
    根据欧拉定理,应有 \( 3^{\phi(10)} \equiv 1 \pmod{10} \),即 \( 3^4 \equiv 1 \pmod{10} \)。
    计算 \( 3^4 = 81 \)。 \( 81 = 8 \times 10 + 1 \),所以 \( 81 \equiv 1 \pmod{10} \)。定理成立。

    5.2.5 应用 (Applications)

    欧拉定理在数论和密码学中有极其重要的应用。最著名的例子是 RSA 公钥加密算法 (RSA public-key cryptosystem),其安全性就依赖于大整数分解的困难性以及欧拉定理。在 RSA 中,加密和解密过程都利用了欧拉定理 \( a^{\phi(n)} \equiv 1 \pmod{n} \)。

    5.3 威尔逊定理 (Wilson's Theorem)

    威尔逊定理是另一个关于素数判定的优美定理,它给出了素数的一个充要条件。

    5.3.1 定理的陈述 (Statement of the Theorem)

    定理 5.3.1 (威尔逊定理):一个正整数 \( p > 1 \) 是素数当且仅当
    \[ (p-1)! \equiv -1 \pmod{p} \]

    解释
    ① 如果 \( p \) 是素数,那么 \( (p-1)! \equiv -1 \pmod{p} \)。
    ② 如果 \( (p-1)! \equiv -1 \pmod{p} \),那么 \( p \) 是素数。

    5.3.2 证明思路 (Proof Idea)

    证明 (充分性:如果 \( p \) 是素数,则 \( (p-1)! \equiv -1 \pmod{p} \))
    考虑模 \( p \) 的乘法群 \( (\mathbb{Z}/p\mathbb{Z})^* = \{1, 2, \dots, p-1\} \)。这个群的阶是 \( p-1 \)。
    我们要计算 \( (p-1)! = 1 \cdot 2 \cdot \dots \cdot (p-1) \) 在模 \( p \) 意义下的值。
    在模 \( p \) 意义下,对于集合 \( \{1, 2, \dots, p-1\} \) 中的每一个元素 \( a \),都存在唯一的逆元 \( a^{-1} \) 也在这个集合中,使得 \( a \cdot a^{-1} \equiv 1 \pmod{p} \)。
    考虑乘积 \( (p-1)! \pmod{p} \)。我们可以将乘积中的元素两两配对,使得每一对的乘积模 \( p \) 为 1。
    即,将 \( a \) 与其逆元 \( a^{-1} \) 配对。
    只有当 \( a \equiv a^{-1} \pmod{p} \) 时,元素才与自身配对。这等价于 \( a^2 \equiv 1 \pmod{p} \),即 \( a^2 - 1 \equiv 0 \pmod{p} \),或 \( (a-1)(a+1) \equiv 0 \pmod{p} \)。
    由于 \( p \) 是素数,这蕴含着 \( p | (a-1) \) 或 \( p | (a+1) \)。
    ⚝ \( p | (a-1) \) 意味着 \( a \equiv 1 \pmod{p} \)。在集合 \( \{1, 2, \dots, p-1\} \) 中,只有 \( a=1 \) 满足此条件。
    ⚝ \( p | (a+1) \) 意味着 \( a \equiv -1 \pmod{p} \)。在集合 \( \{1, 2, \dots, p-1\} \) 中,只有 \( a=p-1 \) 满足此条件。

    因此,在乘积 \( 1 \cdot 2 \cdot \dots \cdot (p-1) \) 中,除了 1 和 \( p-1 \) 之外,其余的 \( p-3 \) 个元素 \( \{2, 3, \dots, p-2\} \) 都可以与它们各自的逆元配对,且逆元不等于自身。这些配对的乘积模 \( p \) 都为 1。
    所以,
    \[ (p-1)! \equiv 1 \cdot (p-1) \cdot \prod_{a=2}^{p-2} (a \cdot a^{-1}) \pmod{p} \]
    \[ (p-1)! \equiv 1 \cdot (p-1) \cdot \prod_{a=2}^{p-2} 1 \pmod{p} \]
    \[ (p-1)! \equiv p-1 \pmod{p} \]
    \[ (p-1)! \equiv -1 \pmod{p} \]
    这个证明对于 \( p > 2 \) 的素数成立。
    对于 \( p=2 \), \( (2-1)! = 1! = 1 \)。 \( -1 \equiv 1 \pmod{2} \)。定理也成立。

    证明 (必要性:如果 \( (p-1)! \equiv -1 \pmod{p} \),则 \( p \) 是素数)
    假设 \( (p-1)! \equiv -1 \pmod{p} \),但 \( p \) 是合数。
    如果 \( p \) 是合数,则存在一个整数 \( d \) 使得 \( 1 < d < p \) 且 \( d | p \)。
    由于 \( 1 < d < p \), \( d \) 是 \( (p-1)! = 1 \cdot 2 \cdot \dots \cdot d \cdot \dots \cdot (p-1) \) 的一个因子。
    因此,\( d | (p-1)! \)。
    我们已知 \( (p-1)! \equiv -1 \pmod{p} \),这意味着 \( p | ((p-1)! - (-1)) \),即 \( p | ((p-1)! + 1) \)。
    由于 \( d | p \) 且 \( p | ((p-1)! + 1) \),根据整除的传递性,有 \( d | ((p-1)! + 1) \)。
    我们已经有 \( d | (p-1)! \)。
    所以 \( d \) 同时整除 \( (p-1)! \) 和 \( (p-1)! + 1 \)。
    这意味着 \( d \) 整除它们的差:\( d | ((p-1)! + 1) - (p-1)! \),即 \( d | 1 \)。
    这蕴含着 \( d = 1 \)。但这与我们假设 \( 1 < d < p \) 矛盾。
    因此,假设 \( p \) 是合数不成立,所以 \( p \) 必须是素数。
    证毕。

    5.3.3 例子 (Examples)

    例 5.3.2:取 \( p = 5 \) (素数)。
    \( (5-1)! = 4! = 1 \cdot 2 \cdot 3 \cdot 4 = 24 \)。
    \( 24 = 4 \times 5 + 4 \),所以 \( 24 \equiv 4 \pmod{5} \)。
    \( 4 \equiv -1 \pmod{5} \)。定理成立。

    例 5.3.3:取 \( p = 6 \) (合数)。
    \( (6-1)! = 5! = 1 \cdot 2 \cdot 3 \cdot 4 \cdot 5 = 120 \)。
    \( 120 = 20 \times 6 + 0 \),所以 \( 120 \equiv 0 \pmod{6} \)。
    \( 0 \not\equiv -1 \pmod{6} \)。定理成立 (对于合数不满足条件)。

    5.3.4 应用 (Applications)

    威尔逊定理提供了一个判断一个数是否为素数的理论方法。然而,对于大数来说,计算 \( (p-1)! \) 是非常耗时的,因此它在实际的素性检验中并不常用。它更多地作为一个理论工具,在数论证明中使用。

    5.4 伪素数 (Pseudoprimes) 与 卡迈克尔数 (Carmichael Numbers)

    费马小定理提供了一个素性检验的思路:如果 \( n \) 是素数,那么对于任意与 \( n \) 互质的 \( a \),有 \( a^{n-1} \equiv 1 \pmod{n} \)。自然会问,如果对于某个 \( a \) 与 \( n \) 互质,有 \( a^{n-1} \equiv 1 \pmod{n} \),那么 \( n \) 一定是素数吗?答案是否定的。满足这个条件的合数被称为伪素数。

    5.4.1 伪素数 (Pseudoprimes)

    定义 5.4.1 (伪素数):一个合数 \( n \) 如果满足 \( a^{n-1} \equiv 1 \pmod{n} \) 对于某个整数 \( a \) 且 \( \gcd(a, n) = 1 \),则称 \( n \) 是基于底数 \( a \) 的伪素数 (pseudoprime to base \( a \))。

    例子
    最小的基于底数 2 的伪素数是 341。
    \( 341 = 11 \times 31 \),是合数。
    我们来计算 \( 2^{340} \pmod{341} \)。
    根据费马小定理,对于素数 11,\( 2^{10} \equiv 1 \pmod{11} \)。
    \( 2^{340} = (2^{10})^{34} \equiv 1^{34} = 1 \pmod{11} \)。
    对于素数 31,\( 2^{30} \equiv 1 \pmod{31} \)。
    \( 2^{340} = 2^{330} \cdot 2^{10} = (2^{30})^{11} \cdot 2^{10} \equiv 1^{11} \cdot 2^{10} = 1024 \pmod{31} \)。
    \( 1024 = 33 \times 31 + 1 \),所以 \( 1024 \equiv 1 \pmod{31} \)。
    我们有 \( 2^{340} \equiv 1 \pmod{11} \) 和 \( 2^{340} \equiv 1 \pmod{31} \)。
    由于 \( \gcd(11, 31) = 1 \),根据中国剩余定理 (Chinese Remainder Theorem),这蕴含着 \( 2^{340} \equiv 1 \pmod{11 \times 31} \),即 \( 2^{340} \equiv 1 \pmod{341} \)。
    所以,341 是一个合数,但它满足费马小定理的形式 \( 2^{340} \equiv 1 \pmod{341} \)。因此,341 是一个基于底数 2 的伪素数。

    伪素数的存在表明,仅仅通过一个底数 \( a \) 来检验 \( a^{n-1} \equiv 1 \pmod{n} \) 并不能完全确定 \( n \) 是否为素数。

    5.4.2 卡迈克尔数 (Carmichael Numbers)

    有些合数更加“顽固”,它们对于所有与自身互质的底数 \( a \) 都满足费马小定理的形式。

    定义 5.4.2 (卡迈克尔数):一个合数 \( n \) 如果对于所有满足 \( \gcd(a, n) = 1 \) 的整数 \( a \) 都满足 \( a^{n-1} \equiv 1 \pmod{n} \),则称 \( n \) 是一个卡迈克尔数 (Carmichael number)。

    卡迈克尔数是费马小定理逆命题的最强反例。它们是合数,但在费马素性检验 (Fermat primality test) 中表现得像素数一样。

    性质 (卡迈克尔数的判定):一个合数 \( n \) 是卡迈克尔数当且仅当 \( n \) 是无平方因子数 (square-free number),且对于 \( n \) 的每一个素因数 \( p \),都有 \( (p-1) | (n-1) \)。

    例子
    最小的卡迈克尔数是 561。
    \( 561 = 3 \times 11 \times 17 \)。它是合数,且无平方因子。
    检查其素因数:
    ⚝ \( p=3 \):\( p-1 = 2 \)。 \( n-1 = 560 \)。 \( 560 = 280 \times 2 \)。 \( 2 | 560 \)。
    ⚝ \( p=11 \):\( p-1 = 10 \). \( n-1 = 560 \). \( 560 = 56 \times 10 \). \( 10 | 560 \).
    ⚝ \( p=17 \):\( p-1 = 16 \). \( n-1 = 560 \). \( 560 = 35 \times 16 \). \( 16 | 560 \).
    所有条件都满足,所以 561 是一个卡迈克尔数。

    这意味着对于任何与 561 互质的整数 \( a \),都有 \( a^{560} \equiv 1 \pmod{561} \)。

    历史上曾猜测卡迈克尔数是有限的,但 1994 年 Alford, Granville, 和 Pomerance 证明了卡迈克尔数是无限的。

    5.4.3 更强的素性检验 (Stronger Primality Tests)

    由于伪素数和卡迈克尔数的存在,费马素性检验并不能确定一个数是否为素数,只能证明一个数是合数。为了进行更可靠的素性检验,需要使用更强的测试方法,例如:
    ⚝ 米勒-拉宾素性检验 (Miller-Rabin primality test):这是一个概率性素性检验 (probabilistic primality test),它基于费马小定理的推广以及平方根模 \( n \) 的性质。对于任何合数,米勒-拉宾检验在随机选择的底数下,以很高的概率判定其为合数。
    ⚝ AKS 素性检验 (AKS primality test):这是一个确定性素性检验 (deterministic primality test),由 Agrawal, Kayal, 和 Saxena 于 2002 年提出。它证明了素性可以在多项式时间内被确定性地判定。

    这些更高级的素性检验方法超出了本书“基础”部分的范围,但了解伪素数和卡迈克尔数的存在,有助于理解为什么简单的费马检验不足以证明素性,并为进一步学习更高级的素性检验算法奠定基础。

    本章我们学习了费马小定理、欧拉定理和威尔逊定理这三个重要的同余定理,它们揭示了整数在模意义下的深刻性质,并在理论和应用中扮演着关键角色。同时,我们也了解了伪素数和卡迈克尔数,它们是费马小定理逆命题的反例,促使人们发展更强大的素性检验方法。这些定理和概念是数论基础的重要组成部分,也是通往更高级数论领域的桥梁。

    6. chapter 算术函数 (Arithmetic Functions)

    亲爱的同学们,欢迎来到数论基础的第六章:算术函数。在前面的章节中,我们深入探讨了整数的整除性、素数的奥秘以及同余的性质。这些概念构成了数论的基石。本章我们将引入一类特殊的函数,它们定义在正整数集上,取值可以是复数,我们称之为算术函数。这些函数在数论研究中扮演着极其重要的角色,它们能够帮助我们系统地研究整数的性质,特别是与因数相关的性质。我们将学习一些重要的算术函数,理解它们的性质,并探索它们之间的关系,特别是通过一种强大的工具——狄利克雷卷积(Dirichlet Convolution)。

    6.1 算术函数的定义与例子 (Definition and Examples of Arithmetic Functions)

    我们首先给出算术函数的严格定义。

    定义 6.1.1 一个算术函数(Arithmetic Function)是指一个定义域为正整数集 \( \mathbb{Z}^+ \)(或 \( \mathbb{N} \),取决于约定,本书采用 \( \mathbb{Z}^+ = \{1, 2, 3, \dots\} \))而值域为复数集 \( \mathbb{C} \) 的函数。

    \[ f: \mathbb{Z}^+ \to \mathbb{C} \]

    虽然值域可以是复数,但在基础数论中,我们遇到的许多重要算术函数的值域通常是整数或实数。

    算术函数为我们提供了一种量化整数性质的方式。例如,我们可以定义一个函数来计算一个数有多少个因数,或者它的所有因数之和是多少。

    让我们看几个最基本的算术函数例子:

    单位函数(Unit Function) \( \delta(n) \):
    \[ \delta(n) = \begin{cases} 1 & \text{if } n = 1 \\ 0 & \text{if } n > 1 \end{cases} \]
    这个函数在狄利克雷卷积中扮演着“单位元”的角色,类似于乘法中的数字 1。

    常数函数(Constant Function) \( I(n) \):
    \[ I(n) = 1 \quad \text{for all } n \in \mathbb{Z}^+ \]
    这个函数很简单,但它在莫比乌斯反演公式中非常关键。

    恒等函数(Identity Function) \( id(n) \):
    \[ id(n) = n \quad \text{for all } n \in \mathbb{Z}^+ \]
    这个函数直接返回输入的正整数本身。有时也用 \( N(n) \) 表示。

    除数个数函数(Number of Divisors Function) \( \tau(n) \) 或 \( d(n) \):
    \[ \tau(n) = \sum_{d|n} 1 \]
    这个函数计算正整数 \( n \) 的正因数的个数。例如,\( \tau(6) \) 的因数有 1, 2, 3, 6,所以 \( \tau(6) = 4 \)。\( \tau(p) = 2 \) 对于素数 \( p \)。\( \tau(p^a) = a+1 \) 对于素数 \( p \) 和正整数 \( a \)。

    除数和函数(Sum of Divisors Function) \( \sigma(n) \):
    \[ \sigma(n) = \sum_{d|n} d \]
    这个函数计算正整数 \( n \) 的所有正因数的和。例如,\( \sigma(6) = 1 + 2 + 3 + 6 = 12 \)。\( \sigma(p) = 1+p \) 对于素数 \( p \)。\( \sigma(p^a) = 1 + p + \dots + p^a = \frac{p^{a+1}-1}{p-1} \) 对于素数 \( p \) 和正整数 \( a \)。

    欧拉函数(Euler's Totient Function) \( \phi(n) \):
    \[ \phi(n) = |\{ k \in \mathbb{Z}^+ \mid 1 \le k \le n, \gcd(k, n) = 1 \}| \]
    这个函数计算小于等于 \( n \) 且与 \( n \) 互素的正整数的个数。我们在第四章和第五章已经见过它,它在同余理论中非常重要。例如,\( \phi(6) \):小于等于 6 且与 6 互素的数有 1, 5,所以 \( \phi(6) = 2 \)。\( \phi(p) = p-1 \) 对于素数 \( p \)。\( \phi(p^a) = p^a - p^{a-1} = p^a(1 - 1/p) \) 对于素数 \( p \) 和正整数 \( a \).

    这些函数只是众多算术函数中的几个例子。研究这些函数的值的分布、性质以及它们之间的关系是解析数论和初等数论的重要内容。

    6.2 积性函数 (Multiplicative Functions)

    在算术函数中,有一类函数具有非常好的性质,它们与整数的素因数分解紧密相关,这类函数就是积性函数。

    定义 6.2.1 一个算术函数 \( f \) 称为积性函数(Multiplicative Function),如果对于任意两个互素(coprime)的正整数 \( m \) 和 \( n \)(即 \( \gcd(m, n) = 1 \)),都有 \( f(mn) = f(m)f(n) \)。

    定义 6.2.2 一个算术函数 \( f \) 称为完全积性函数(Completely Multiplicative Function),如果对于任意两个正整数 \( m \) 和 \( n \)(不要求互素),都有 \( f(mn) = f(m)f(n) \)。

    显然,完全积性函数一定是积性函数,但反之不成立。

    例子 6.2.3
    ⚝ 单位函数 \( \delta(n) \) 是完全积性函数。如果 \( m=1 \),\( \delta(n) = \delta(1)\delta(n) = 1 \cdot \delta(n) \)。如果 \( n=1 \),\( \delta(m) = \delta(m)\delta(1) = \delta(m) \cdot 1 \)。如果 \( m, n > 1 \),则 \( mn > 1 \),\( \delta(mn) = 0 \),\( \delta(m)\delta(n) = 0 \cdot 0 = 0 \)。所以 \( \delta(mn) = \delta(m)\delta(n) \) 对所有 \( m, n \) 成立。
    ⚝ 恒等函数 \( id(n) = n \) 是完全积性函数。\( id(mn) = mn = id(m)id(n) \)。
    ⚝ 对于任何复数 \( k \),函数 \( f(n) = n^k \) 是完全积性函数。\( (mn)^k = m^k n^k \)。这包含了 \( id(n) \) 当 \( k=1 \) 的情况,以及常数函数 \( I(n) = 1 \) 当 \( k=0 \) 的情况。
    ⚝ 除数个数函数 \( \tau(n) \) 是积性函数,但不是完全积性函数。例如,\( \tau(4) = \tau(2^2) = 3 \),但 \( \tau(2)\tau(2) = 2 \cdot 2 = 4 \ne 3 \)。
    ⚝ 除数和函数 \( \sigma(n) \) 是积性函数,但不是完全积性函数。例如,\( \sigma(4) = 1+2+4 = 7 \),但 \( \sigma(2)\sigma(2) = (1+2)(1+2) = 3 \cdot 3 = 9 \ne 7 \)。
    ⚝ 欧拉函数 \( \phi(n) \) 是积性函数,但不是完全积性函数。例如,\( \phi(4) = 2 \),但 \( \phi(2)\phi(2) = 1 \cdot 1 = 1 \ne 2 \)。

    积性函数有一个非常重要的性质,它完全由其在素数幂上的取值决定。

    定理 6.2.4 如果 \( f \) 是一个积性函数,且 \( n = p_1^{a_1} p_2^{a_2} \cdots p_k^{a_k} \) 是 \( n \) 的标准素因数分解(其中 \( p_i \) 是不同的素数,\( a_i \ge 1 \)),则
    \[ f(n) = f(p_1^{a_1}) f(p_2^{a_2}) \cdots f(p_k^{a_k}) \]
    特别地,如果 \( f \) 是完全积性函数,则 \( f(n) = f(p_1)^{a_1} f(p_2)^{a_2} \cdots f(p_k)^{a_k} \)。

    证明纲要: 由于 \( p_i^{a_i} \) 两两互素,根据积性函数的定义,我们可以逐步分解 \( f(n) \)。例如,\( f(p_1^{a_1} p_2^{a_2}) = f(p_1^{a_1}) f(p_2^{a_2}) \) 因为 \( \gcd(p_1^{a_1}, p_2^{a_2}) = 1 \)。重复此过程即可得到结论。

    这个定理极大地简化了积性函数的研究。要计算一个积性函数在任何正整数上的值,我们只需要知道它在素数幂上的值即可。

    另一个重要的概念是算术函数的狄利克雷卷积。

    定义 6.2.5 设 \( f \) 和 \( g \) 是两个算术函数,它们的狄利克雷卷积(Dirichlet Convolution) \( f * g \) 是一个新的算术函数,定义为:
    \[ (f * g)(n) = \sum_{d|n} f(d) g(n/d) \]
    其中求和遍及 \( n \) 的所有正因数 \( d \)。

    例子 6.2.6
    ⚝ \( (I * I)(n) = \sum_{d|n} I(d) I(n/d) = \sum_{d|n} 1 \cdot 1 = \sum_{d|n} 1 = \tau(n) \)。所以 \( \tau = I * I \)。
    ⚝ \( (I * id)(n) = \sum_{d|n} I(d) id(n/d) = \sum_{d|n} 1 \cdot (n/d) = \sum_{d|n} n/d \)。令 \( k = n/d \),当 \( d \) 遍历 \( n \) 的所有因数时,\( k \) 也遍历 \( n \) 的所有因数。所以 \( \sum_{d|n} n/d = \sum_{k|n} k = \sigma(n) \)。所以 \( \sigma = I * id \)。

    狄利克雷卷积具有以下重要性质:

    交换律(Commutativity): \( f * g = g * f \)。
    证明:\( (f * g)(n) = \sum_{d|n} f(d)g(n/d) \)。令 \( k = n/d \),则 \( d = n/k \)。当 \( d \) 遍历 \( n \) 的因数时,\( k \) 也遍历 \( n \) 的因数。所以 \( \sum_{d|n} f(d)g(n/d) = \sum_{k|n} f(n/k)g(k) = \sum_{k|n} g(k)f(n/k) = (g * f)(n) \)。
    结合律(Associativity): \( (f * g) * h = f * (g * h) \)。
    证明:\( ((f * g) * h)(n) = \sum_{d|n} (f * g)(d) h(n/d) = \sum_{d|n} \left( \sum_{k|d} f(k)g(d/k) \right) h(n/d) = \sum_{k|n} \sum_{m|n/k} f(k)g(m)h(n/km) \)。令 \( d=km \),则 \( k|d \) 且 \( m|n/k \iff km|n \iff d|n \)。所以求和可以写成 \( \sum_{d|n} \sum_{k|d} f(k)g(d/k)h(n/d) \)。
    另一方面,\( (f * (g * h))(n) = \sum_{d|n} f(d) (g * h)(n/d) = \sum_{d|n} f(d) \left( \sum_{k|n/d} g(k)h((n/d)/k) \right) = \sum_{d|n} \sum_{k|n/d} f(d)g(k)h(n/dk) \)。令 \( m=dk \),则 \( d|m \) 且 \( k|n/d \iff dk|n \iff m|n \)。所以求和可以写成 \( \sum_{m|n} \sum_{d|m} f(d)g(m/d)h(n/m) \)。
    两个表达式都等于 \( \sum_{d_1 d_2 d_3 = n} f(d_1)g(d_2)h(d_3) \),其中求和遍及所有满足 \( d_1 d_2 d_3 = n \) 的正整数三元组 \( (d_1, d_2, d_3) \)。因此结合律成立。
    单位元(Identity Element): 单位函数 \( \delta \) 是狄利克雷卷积的单位元,即 \( f * \delta = \delta * f = f \)。
    证明:\( (f * \delta)(n) = \sum_{d|n} f(d)\delta(n/d) \)。由于 \( \delta(n/d) \) 只有当 \( n/d = 1 \),即 \( d=n \) 时才非零(等于 1),所以求和中只有一项非零,即当 \( d=n \) 时。\( (f * \delta)(n) = f(n)\delta(n/n) = f(n)\delta(1) = f(n) \cdot 1 = f(n) \)。

    逆元(Inverse Element): 如果 \( f(1) \ne 0 \),则 \( f \) 关于狄利克雷卷积存在唯一的逆函数 \( f^{-1} \),使得 \( f * f^{-1} = f^{-1} * f = \delta \)。
    逆函数可以通过递推定义:
    \( f^{-1}(1) = 1/f(1) \)
    对于 \( n > 1 \),\( \sum_{d|n} f(d)f^{-1}(n/d) = \delta(n) = 0 \)。将 \( d=n \) 的项移到一边:
    \( f(n)f^{-1}(1) + \sum_{d|n, d \( f(n)/f(1) + \sum_{d|n, d \( f^{-1}(n) = - \frac{1}{f(1)} \sum_{d|n, d 这个公式允许我们计算 \( f^{-1}(n) \) 的值,前提是 \( f^{-1}(k) \) 对于所有 \( k < n \) 的值已知。

    积性函数的卷积(Convolution of Multiplicative Functions): 如果 \( f \) 和 \( g \) 都是积性函数,则它们的狄利克雷卷积 \( f * g \) 也是积性函数。
    这个性质非常重要,它使得我们可以通过卷积构造新的积性函数。
    证明纲要: 设 \( h = f * g \)。要证明 \( h \) 是积性函数,我们需要证明对于任意互素的 \( m, n \),有 \( h(mn) = h(m)h(n) \)。
    \( h(mn) = \sum_{d|mn} f(d)g(mn/d) \)。由于 \( \gcd(m, n) = 1 \),\( mn \) 的任何因数 \( d \) 都可以唯一地写成 \( d = d_1 d_2 \),其中 \( d_1|m \) 且 \( d_2|n \),并且 \( \gcd(d_1, d_2) = 1 \)。类似地,\( mn/d = (m/d_1)(n/d_2) \),其中 \( \gcd(m/d_1, n/d_2) = 1 \)。
    因此,求和可以写成遍及所有 \( d_1|m \) 和 \( d_2|n \) 的项的和:
    \( h(mn) = \sum_{d_1|m} \sum_{d_2|n} f(d_1 d_2) g((m/d_1)(n/d_2)) \)
    由于 \( f \) 和 \( g \) 是积性函数,且 \( \gcd(d_1, d_2) = 1 \) 且 \( \gcd(m/d_1, n/d_2) = 1 \),我们有 \( f(d_1 d_2) = f(d_1)f(d_2) \) 和 \( g((m/d_1)(n/d_2)) = g(m/d_1)g(n/d_2) \)。
    \( h(mn) = \sum_{d_1|m} \sum_{d_2|n} f(d_1)f(d_2) g(m/d_1)g(n/d_2) \)
    \( h(mn) = \left( \sum_{d_1|m} f(d_1)g(m/d_1) \right) \left( \sum_{d_2|n} f(d_2)g(n/d_2) \right) \)
    \( h(mn) = h(m)h(n) \)。
    所以 \( h = f * g \) 是积性函数。

    这个性质非常强大。例如,我们知道 \( I(n)=1 \) 和 \( id(n)=n \) 都是完全积性函数(因此也是积性函数),所以它们的卷积 \( \tau = I * I \) 和 \( \sigma = I * id \) 都是积性函数。

    6.3 莫比乌斯函数 (Möbius Function) 与 莫比乌斯反演公式 (Möbius Inversion Formula)

    莫比乌斯函数是数论中一个非常重要的积性函数,它在莫比乌斯反演公式中扮演核心角色。

    定义 6.3.1 莫比乌斯函数(Möbius Function) \( \mu(n) \) 定义为:
    \[ \mu(n) = \begin{cases} 1 & \text{if } n = 1 \\ 0 & \text{if } n \text{ has a squared prime factor (i.e., } p^2|n \text{ for some prime } p) \\ (-1)^k & \text{if } n \text{ is a product of } k \text{ distinct primes (i.e., } n = p_1 p_2 \cdots p_k \text{, where } p_i \text{ are distinct primes)} \end{cases} \]
    如果一个正整数没有平方因子(除了 1),我们称它为无平方数(square-free)。所以 \( \mu(n) = 0 \) 当且仅当 \( n \) 不是无平方数。

    例子 6.3.2
    ⚝ \( \mu(1) = 1 \)
    ⚝ \( \mu(2) = -1 \) (2 是一个素数)
    ⚝ \( \mu(3) = -1 \) (3 是一个素数)
    ⚝ \( \mu(4) = \mu(2^2) = 0 \) (4 有平方因子 \( 2^2 \))
    ⚝ \( \mu(5) = -1 \) (5 是一个素数)
    ⚝ \( \mu(6) = \mu(2 \cdot 3) = (-1)^2 = 1 \) (6 是两个不同素数的乘积)
    ⚝ \( \mu(10) = \mu(2 \cdot 5) = (-1)^2 = 1 \)
    ⚝ \( \mu(12) = \mu(2^2 \cdot 3) = 0 \) (12 有平方因子 \( 2^2 \))

    定理 6.3.3 莫比乌斯函数 \( \mu(n) \) 是一个积性函数。

    证明纲要: 设 \( m, n \) 是互素的正整数。
    ⚝ 如果 \( m=1 \) 或 \( n=1 \),则 \( \mu(mn) = \mu(m)\mu(n) \) 显然成立(因为 \( \mu(1)=1 \)).
    ⚝ 如果 \( m, n > 1 \)。
    ▮ 如果 \( m \) 或 \( n \) 有平方因子,例如 \( p^2|m \),则 \( p^2|mn \),所以 \( \mu(mn) = 0 \)。同时 \( \mu(m) = 0 \),所以 \( \mu(mn) = 0 = 0 \cdot \mu(n) = \mu(m)\mu(n) \)。
    ▮ 如果 \( m \) 和 \( n \) 都是无平方数。设 \( m = p_1 \cdots p_k \) 和 \( n = q_1 \cdots q_j \),其中 \( p_i \) 是不同的素数,\( q_i \) 是不同的素数。由于 \( \gcd(m, n) = 1 \),所有的 \( p_i \) 都与所有的 \( q_i \) 不同。因此 \( mn = p_1 \cdots p_k q_1 \cdots q_j \) 是 \( k+j \) 个不同素数的乘积。
    根据定义,\( \mu(m) = (-1)^k \),\( \mu(n) = (-1)^j \),\( \mu(mn) = (-1)^{k+j} \)。
    \( \mu(m)\mu(n) = (-1)^k (-1)^j = (-1)^{k+j} = \mu(mn) \)。
    综上,\( \mu \) 是积性函数。

    莫比乌斯函数最重要的性质体现在它与常数函数 \( I(n)=1 \) 的狄利克雷卷积上。

    定理 6.3.4 对于任意正整数 \( n \),有
    \[ \sum_{d|n} \mu(d) = \begin{cases} 1 & \text{if } n = 1 \\ 0 & \text{if } n > 1 \end{cases} \]
    用狄利克雷卷积表示,就是 \( \mu * I = \delta \)。这意味着 \( \mu \) 是 \( I \) 在狄利克雷卷积下的逆函数 \( I^{-1} \)。

    证明:
    ⚝ 当 \( n=1 \) 时,\( \sum_{d|1} \mu(d) = \mu(1) = 1 \)。
    ⚝ 当 \( n > 1 \) 时,设 \( n = p_1^{a_1} \cdots p_k^{a_k} \) 是 \( n \) 的标准素因数分解。求和 \( \sum_{d|n} \mu(d) \) 遍及 \( n \) 的所有因数 \( d \)。
    根据 \( \mu(d) \) 的定义,只有当 \( d \) 是无平方数时,\( \mu(d) \) 才可能非零。这意味着 \( d \) 必须是 \( p_1 \cdots p_k \) 的因数,即 \( d \) 的形式为 \( p_{i_1} \cdots p_{i_j} \),其中 \( \{i_1, \dots, i_j\} \) 是 \( \{1, \dots, k\} \) 的一个子集。
    对于这样的 \( d \),\( \mu(d) = (-1)^j \),其中 \( j \) 是 \( d \) 的不同素因数的个数。
    因此,\( \sum_{d|n} \mu(d) = \sum_{d|p_1 \cdots p_k} \mu(d) \)。
    这个求和可以看作是选择 \( p_1, \dots, p_k \) 中的任意 \( j \) 个素数作为因数构成 \( d \),然后计算 \( \mu(d) = (-1)^j \)。
    对于固定的 \( j \)(\( 0 \le j \le k \)),选择 \( j \) 个素数的方式有 \( \binom{k}{j} \) 种,每种选择对应的 \( \mu(d) \) 值为 \( (-1)^j \)。
    所以,\( \sum_{d|n} \mu(d) = \sum_{j=0}^k \binom{k}{j} (-1)^j \)。
    根据二项式定理,\( \sum_{j=0}^k \binom{k}{j} x^j y^{k-j} = (x+y)^k \)。令 \( x = -1 \),\( y = 1 \),则 \( \sum_{j=0}^k \binom{k}{j} (-1)^j 1^{k-j} = (-1+1)^k = 0^k \)。
    如果 \( k \ge 1 \)(即 \( n > 1 \)),则 \( 0^k = 0 \)。
    如果 \( k = 0 \)(即 \( n=1 \)),则 \( 0^0 \) 通常定义为 1,这与 \( \mu(1)=1 \) 一致。
    所以,对于 \( n > 1 \)(即 \( k \ge 1 \)),\( \sum_{d|n} \mu(d) = 0 \)。
    证毕。

    有了 \( \mu * I = \delta \) 这个关系,我们就可以推导出强大的莫比乌斯反演公式。

    定理 6.3.5 (莫比乌斯反演公式 - Möbius Inversion Formula)
    设 \( f \) 和 \( g \) 是两个算术函数。如果对于所有正整数 \( n \),有
    \[ g(n) = \sum_{d|n} f(d) \]
    则对于所有正整数 \( n \),有
    \[ f(n) = \sum_{d|n} \mu(d) g(n/d) \]
    反之,如果 \( f(n) = \sum_{d|n} \mu(d) g(n/d) \),则 \( g(n) = \sum_{d|n} f(d) \)。

    证明:
    ⚝ 前半部分:已知 \( g(n) = \sum_{d|n} f(d) \)。用狄利克雷卷积表示,这是 \( g = f * I \)。
    我们将等式两边与 \( \mu \) 进行卷积:
    \( g * \mu = (f * I) * \mu \)
    根据结合律:
    \( g * \mu = f * (I * \mu) \)
    根据定理 6.3.4,\( I * \mu = \delta \):
    \( g * \mu = f * \delta \)
    根据单位元的性质,\( f * \delta = f \):
    \( g * \mu = f \)
    展开狄利克雷卷积的定义:
    \( f(n) = (g * \mu)(n) = \sum_{d|n} g(d) \mu(n/d) \)。
    将求和变量 \( d \) 替换为 \( n/d' \),其中 \( d' \) 遍历 \( n \) 的因数。当 \( d \) 遍历 \( n \) 的因数时,\( n/d \) 也遍历 \( n \) 的因数。令 \( k = n/d \),则 \( d = n/k \)。
    \( f(n) = \sum_{k|n} g(n/k) \mu(k) = \sum_{d|n} \mu(d) g(n/d) \)。
    证毕前半部分。

    ⚝ 后半部分:已知 \( f(n) = \sum_{d|n} \mu(d) g(n/d) \)。用狄利克雷卷积表示,这是 \( f = \mu * g \)。
    我们将等式两边与 \( I \) 进行卷积:
    \( f * I = (\mu * g) * I \)
    根据结合律:
    \( f * I = \mu * (g * I) \)
    根据交换律,\( g * I = I * g \)。
    \( f * I = \mu * (I * g) \)
    根据结合律:
    \( f * I = (\mu * I) * g \)
    根据定理 6.3.4,\( \mu * I = \delta \):
    \( f * I = \delta * g \)
    根据单位元的性质,\( \delta * g = g \):
    \( f * I = g \)
    展开狄利克雷卷积的定义:
    \( g(n) = (f * I)(n) = \sum_{d|n} f(d) I(n/d) = \sum_{d|n} f(d) \cdot 1 = \sum_{d|n} f(d) \)。
    证毕后半部分。

    莫比乌斯反演公式是一个非常实用的工具,它可以用来反演求和关系。

    例子 6.3.6 我们知道对于欧拉函数 \( \phi(n) \),有恒等式 \( n = \sum_{d|n} \phi(d) \)。
    这里,令 \( g(n) = n \) 和 \( f(n) = \phi(n) \)。关系是 \( g(n) = \sum_{d|n} f(d) \)。
    根据莫比乌斯反演公式,我们可以得到 \( f(n) = \sum_{d|n} \mu(d) g(n/d) \)。
    即 \( \phi(n) = \sum_{d|n} \mu(d) (n/d) \)。
    这个公式给出了计算 \( \phi(n) \) 的另一种方法。例如:
    \( \phi(6) = \sum_{d|6} \mu(d) (6/d) = \mu(1)(6/1) + \mu(2)(6/2) + \mu(3)(6/3) + \mu(6)(6/6) \)
    \( \phi(6) = 1 \cdot 6 + (-1) \cdot 3 + (-1) \cdot 2 + 1 \cdot 1 = 6 - 3 - 2 + 1 = 2 \)。
    这与我们之前计算的 \( \phi(6) = 2 \) 结果一致。

    6.4 除数函数 (Divisor Function) 与 和函数 (Sum of Divisors Function)

    我们在 6.1 节已经定义了除数个数函数 \( \tau(n) \) 和除数和函数 \( \sigma(n) \)。现在我们利用积性函数的性质和狄利克雷卷积来深入理解它们。

    定义 6.4.1
    除数个数函数(Number of Divisors Function) \( \tau(n) = \sum_{d|n} 1 \)。
    除数和函数(Sum of Divisors Function) \( \sigma(n) = \sum_{d|n} d \)。

    我们已经看到,\( \tau = I * I \) 且 \( \sigma = I * id \)。由于 \( I(n)=1 \) 和 \( id(n)=n \) 都是完全积性函数(因此是积性函数),根据积性函数的卷积性质,\( \tau \) 和 \( \sigma \) 都是积性函数。

    利用积性函数的性质,我们可以根据素因数分解来计算 \( \tau(n) \) 和 \( \sigma(n) \)。
    设 \( n = p_1^{a_1} p_2^{a_2} \cdots p_k^{a_k} \) 是 \( n \) 的标准素因数分解。

    首先考虑素数幂 \( p^a \)。
    ⚝ \( \tau(p^a) \):\( p^a \) 的因数是 \( 1, p, p^2, \dots, p^a \),共有 \( a+1 \) 个。所以 \( \tau(p^a) = a+1 \)。
    ⚝ \( \sigma(p^a) \):\( p^a \) 的因数和是 \( 1 + p + p^2 + \dots + p^a \)。这是一个几何级数求和,其和为 \( \frac{p^{a+1}-1}{p-1} \)。所以 \( \sigma(p^a) = \frac{p^{a+1}-1}{p-1} \)。

    由于 \( \tau \) 和 \( \sigma \) 是积性函数,对于 \( n = p_1^{a_1} \cdots p_k^{a_k} \),我们有:
    \[ \tau(n) = \tau(p_1^{a_1}) \tau(p_2^{a_2}) \cdots \tau(p_k^{a_k}) = (a_1+1)(a_2+1) \cdots (a_k+1) \]
    \[ \sigma(n) = \sigma(p_1^{a_1}) \sigma(p_2^{a_2}) \cdots \sigma(p_k^{a_k}) = \frac{p_1^{a_1+1}-1}{p_1-1} \frac{p_2^{a_2+1}-1}{p_2-1} \cdots \frac{p_k^{a_k+1}-1}{p_k-1} \]

    例子 6.4.2 计算 \( \tau(12) \) 和 \( \sigma(12) \)。
    \( 12 = 2^2 \cdot 3^1 \)。
    \( \tau(12) = \tau(2^2) \tau(3^1) = (2+1)(1+1) = 3 \cdot 2 = 6 \)。
    12 的因数是 1, 2, 3, 4, 6, 12,共 6 个,结果正确。
    \( \sigma(12) = \sigma(2^2) \sigma(3^1) = \frac{2^{2+1}-1}{2-1} \frac{3^{1+1}-1}{3-1} = \frac{2^3-1}{1} \frac{3^2-1}{2} = \frac{7}{1} \frac{8}{2} = 7 \cdot 4 = 28 \)。
    12 的因数和是 \( 1+2+3+4+6+12 = 28 \),结果正确。

    除数和函数 \( \sigma(n) \) 与完全数(Perfect Numbers)的概念密切相关。
    定义 6.4.3 一个正整数 \( n \) 称为完全数,如果它的所有真因数(即除了 \( n \) 本身以外的因数)之和等于 \( n \)。
    真因数之和等于所有因数之和减去 \( n \),即 \( \sigma(n) - n \)。所以完全数的定义等价于 \( \sigma(n) - n = n \),即 \( \sigma(n) = 2n \)。

    例子 6.4.4
    ⚝ 6 是完全数,因为 \( \sigma(6) = 12 = 2 \cdot 6 \)。6 的真因数是 1, 2, 3,它们的和是 \( 1+2+3=6 \)。
    ⚝ 28 是完全数,因为 \( \sigma(28) = \sigma(2^2 \cdot 7) = \sigma(2^2)\sigma(7) = \frac{2^3-1}{1} \frac{7^2-1}{6} = 7 \cdot \frac{48}{6} = 7 \cdot 8 = 56 = 2 \cdot 28 \)。28 的真因数是 1, 2, 4, 7, 14,它们的和是 \( 1+2+4+7+14 = 28 \)。

    欧几里得(Euclid)在《几何原本》(Elements)中给出了构造偶完全数的方法:如果 \( 2^p-1 \) 是一个素数(称为梅森素数(Mersenne Prime)),则 \( 2^{p-1}(2^p-1) \) 是一个完全数。
    欧拉(Euler)后来证明了所有偶完全数都具有这种形式。
    目前,是否奇完全数存在仍然是一个未解决的数学问题 🧐。

    本章我们学习了算术函数的基本概念,特别是积性函数及其重要性质。我们引入了狄利克雷卷积作为连接算术函数的工具,并重点研究了莫比乌斯函数及其强大的反演公式。最后,我们利用积性函数的性质推导了除数个数函数和除数和函数的计算公式,并简要介绍了完全数。这些算术函数和工具在数论的许多分支中都有广泛的应用。

    7. chapter 原根与指标 (Primitive Roots and Indices)

    欢迎来到数论中一个既美妙又极其有用的章节:原根与指标。在前面的章节中,我们学习了同余、欧拉函数以及一些重要的同余定理。这些工具帮助我们理解了整数在模 \(n\) 意义下的乘法结构。然而,我们还没有完全揭示这种结构的深层秘密。

    本章将引入“阶”的概念,它是描述一个整数在模 \(n\) 意义下乘法行为周期性的关键。基于阶的概念,我们将定义“原根”,这是一种特殊的整数,它的阶恰好等于 \(\phi(n)\)。如果一个模 \(n\) 存在原根,那么模 \(n\) 的简化剩余系(即与 \(n\) 互素的数的集合)在乘法下就构成一个循环群。这意味着我们可以像处理实数对数一样处理模 \(n\) 意义下的乘法,这就是“指标”的概念。

    理解原根与指标不仅能加深我们对模算术结构的理解,它们在密码学(例如 Diffie-Hellman 密钥交换)、计算数论以及其他数学领域都有着重要的应用。

    我们将从整数的阶开始,逐步深入,最终掌握原根与指标的强大工具。请准备好,我们将一起探索模世界中的“对数”!

    7.1 整数的阶 (Order of an Integer) 模 n

    在模 \(n\) 的世界里,我们关心的是整数的幂次在模 \(n\) 意义下的行为。考虑一个整数 \(a\) 和一个正整数 \(n > 1\)。如果我们计算 \(a^1, a^2, a^3, \dots\) 模 \(n\),我们会发现这些值最终会重复。例如,考虑 \(a=2, n=7\):
    \(2^1 \equiv 2 \pmod 7\)
    \(2^2 \equiv 4 \pmod 7\)
    \(2^3 \equiv 8 \equiv 1 \pmod 7\)
    \(2^4 \equiv 2 \cdot 1 \equiv 2 \pmod 7\)
    \(2^5 \equiv 4 \pmod 7\)
    \(2^6 \equiv 1 \pmod 7\)
    序列 \(2, 4, 1, 2, 4, 1, \dots\) 是周期性的。

    为了使阶的概念有意义,我们通常只考虑与模数 \(n\) 互素的整数 \(a\),即 \(\gcd(a, n) = 1\)。根据欧拉定理(Euler's Theorem),如果 \(\gcd(a, n) = 1\),那么 \(a^{\phi(n)} \equiv 1 \pmod n\)。这意味着至少存在一个正整数 \(k\) 使得 \(a^k \equiv 1 \pmod n\)。

    定义 7.1.1 设 \(a\) 和 \(n\) 是整数,其中 \(n > 1\) 且 \(\gcd(a, n) = 1\)。使得 \(a^k \equiv 1 \pmod n\) 成立的最小正整数 \(k\) 称为 \(a\) 模 \(n\) 的阶 (order of \(a\) modulo \(n\)),记作 \(ord_n(a)\) 或 \(o_n(a)\)。

    为什么我们要求 \(\gcd(a, n) = 1\) 呢?如果 \(\gcd(a, n) = d > 1\),那么对于任何正整数 \(k\),\(a^k\) 总是能被 \(d\) 整除。而 \(1\) 模 \(n\) 只有在 \(n=1\) 时才能被大于 1 的数整除。所以如果 \(n > 1\) 且 \(d > 1\),\(a^k \equiv 1 \pmod n\) 意味着 \(a^k - 1\) 是 \(n\) 的倍数,从而也是 \(d\) 的倍数。但这要求 \(d | (a^k - 1)\)。由于 \(d | a^k\),这只有在 \(d | 1\) 时才可能,矛盾。因此,当 \(\gcd(a, n) > 1\) 且 \(n > 1\) 时,不存在正整数 \(k\) 使得 \(a^k \equiv 1 \pmod n\)。

    定理 7.1.2 设 \(a\) 和 \(n\) 是整数,其中 \(n > 1\) 且 \(\gcd(a, n) = 1\)。则 \(a^k \equiv 1 \pmod n\) 当且仅当 \(ord_n(a) | k\)。

    证明:
    \((\Rightarrow)\) 假设 \(a^k \equiv 1 \pmod n\)。根据除法原理(Division Algorithm),存在整数 \(q\) 和 \(r\) 使得 \(k = q \cdot ord_n(a) + r\),其中 \(0 \le r < ord_n(a)\)。
    则 \(a^k = a^{q \cdot ord_n(a) + r} = (a^{ord_n(a)})^q \cdot a^r\)。
    因为 \(a^{ord_n(a)} \equiv 1 \pmod n\),所以 \((a^{ord_n(a)})^q \equiv 1^q \equiv 1 \pmod n\)。
    因此,\(a^k \equiv 1 \cdot a^r \equiv a^r \pmod n\)。
    我们已知 \(a^k \equiv 1 \pmod n\),所以 \(a^r \equiv 1 \pmod n\)。
    由于 \(0 \le r < ord_n(a)\) 且 \(ord_n(a)\) 是使得 \(a^k \equiv 1 \pmod n\) 成立的最小正整数,这只有在 \(r = 0\) 时才可能。
    所以 \(k = q \cdot ord_n(a)\),即 \(ord_n(a) | k\)。

    \((\Leftarrow)\) 假设 \(ord_n(a) | k\)。则存在整数 \(m\) 使得 \(k = m \cdot ord_n(a)\)。
    于是 \(a^k = a^{m \cdot ord_n(a)} = (a^{ord_n(a)})^m\)。
    因为 \(a^{ord_n(a)} \equiv 1 \pmod n\),所以 \((a^{ord_n(a)})^m \equiv 1^m \equiv 1 \pmod n\)。
    因此,\(a^k \equiv 1 \pmod n\)。
    证毕。

    这个定理非常重要,它告诉我们一个整数的幂次模 \(n\) 等于 1 的所有指数都是其阶的倍数。

    推论 7.1.3 设 \(a\) 和 \(n\) 是整数,其中 \(n > 1\) 且 \(\gcd(a, n) = 1\)。则 \(ord_n(a) | \phi(n)\)。

    证明: 根据欧拉定理(Euler's Theorem),我们知道 \(a^{\phi(n)} \equiv 1 \pmod n\)。由定理 7.1.2 可知,\(ord_n(a)\) 必须整除 \(\phi(n)\)。证毕。

    这个推论限制了阶的可能取值范围,它必须是 \(\phi(n)\) 的约数。

    例子 7.1.4
    ① 计算 \(ord_7(3)\)。
    \(\gcd(3, 7) = 1\)。
    \(3^1 \equiv 3 \pmod 7\)
    \(3^2 \equiv 9 \equiv 2 \pmod 7\)
    \(3^3 \equiv 3 \cdot 2 = 6 \pmod 7\)
    \(3^4 \equiv 3 \cdot 6 = 18 \equiv 4 \pmod 7\)
    \(3^5 \equiv 3 \cdot 4 = 12 \equiv 5 \pmod 7\)
    \(3^6 \equiv 3 \cdot 5 = 15 \equiv 1 \pmod 7\)
    所以 \(ord_7(3) = 6\)。注意 \(\phi(7) = 6\),且 \(6 | 6\)。

    ② 计算 \(ord_{10}(3)\)。
    \(\gcd(3, 10) = 1\)。\(\phi(10) = \phi(2)\phi(5) = 1 \cdot 4 = 4\)。阶必须是 4 的约数(1, 2, 4)。
    \(3^1 \equiv 3 \pmod{10}\)
    \(3^2 \equiv 9 \pmod{10}\)
    \(3^3 \equiv 27 \equiv 7 \pmod{10}\\)
    \(3^4 \equiv 3 \cdot 7 = 21 \equiv 1 \pmod{10}\)
    所以 \(ord_{10}(3) = 4\)。

    ③ 计算 \(ord_8(3)\)。
    \(\gcd(3, 8) = 1\)。\(\phi(8) = 8(1 - 1/2) = 4\)。阶必须是 4 的约数(1, 2, 4)。
    \(3^1 \equiv 3 \pmod 8\)
    \(3^2 \equiv 9 \equiv 1 \pmod 8\)
    所以 \(ord_8(3) = 2\)。

    ④ 计算 \(ord_8(5)\)。
    \(\gcd(5, 8) = 1\)。\(\phi(8) = 4\)。阶必须是 4 的约数(1, 2, 4)。
    \(5^1 \equiv 5 \pmod 8\)
    \(5^2 \equiv 25 \equiv 1 \pmod 8\)
    所以 \(ord_8(5) = 2\)。

    ⑤ 计算 \(ord_8(7)\)。
    \(\gcd(7, 8) = 1\)。\(\phi(8) = 4\)。阶必须是 4 的约数(1, 2, 4)。
    \(7^1 \equiv 7 \pmod 8\)
    \(7^2 \equiv 49 \equiv 1 \pmod 8\)
    所以 \(ord_8(7) = 2\)。

    从上面的例子可以看出,对于模 8,\(\phi(8)=4\),但没有任何一个与 8 互素的数的阶是 4。它们的阶都是 2。这引出了下一个重要的概念:原根。

    定理 7.1.5 设 \(a\) 和 \(n\) 是整数,其中 \(n > 1\) 且 \(\gcd(a, n) = 1\)。则 \(a^i \equiv a^j \pmod n\) 当且仅当 \(i \equiv j \pmod{ord_n(a)}\)。

    证明:
    不失一般性,假设 \(i \ge j\)。
    \((\Rightarrow)\) 假设 \(a^i \equiv a^j \pmod n\)。由于 \(\gcd(a, n) = 1\),我们可以乘以 \(a^{-j}\) (模 \(n\) 的逆元存在) 得到 \(a^{i-j} \equiv 1 \pmod n\)。根据定理 7.1.2,这当且仅当 \(ord_n(a) | (i-j)\),即 \(i \equiv j \pmod{ord_n(a)}\)。

    \((\Leftarrow)\) 假设 \(i \equiv j \pmod{ord_n(a)}\)。则 \(i-j = k \cdot ord_n(a)\) 对于某个整数 \(k\)。
    于是 \(a^{i-j} = a^{k \cdot ord_n(a)} = (a^{ord_n(a)})^k\).
    因为 \(a^{ord_n(a)} \equiv 1 \pmod n\),所以 \((a^{ord_n(a)})^k \equiv 1^k \equiv 1 \pmod n\).
    即 \(a^{i-j} \equiv 1 \pmod n\).
    乘以 \(a^j\) (注意 \(\gcd(a^j, n) = 1\)),得到 \(a^i \equiv a^j \pmod n\).
    证毕。

    这个定理表明,与 \(n\) 互素的整数 \(a\) 的幂次 \(a^0, a^1, a^2, \dots, a^{ord_n(a)-1}\) 在模 \(n\) 意义下是两两不同的。这些幂次构成了由 \(a\) 生成的循环子群。

    7.2 原根 (Primitive Root) 的定义与存在性 (Existence)

    在上一节中,我们看到 \(ord_n(a)\) 总是 \(\phi(n)\) 的约数。一个自然的问题是:是否存在一个整数 \(a\) 使得 \(ord_n(a)\) 恰好等于 \(\phi(n)\) 呢?

    定义 7.2.1 设 \(g\) 和 \(n\) 是整数,其中 \(n > 1\) 且 \(\gcd(g, n) = 1\)。如果 \(ord_n(g) = \phi(n)\),则称 \(g\) 是模 \(n\) 的一个原根 (primitive root modulo \(n\))。

    如果模 \(n\) 存在原根 \(g\),那么 \(g^0, g^1, g^2, \dots, g^{\phi(n)-1}\) 这 \(\phi(n)\) 个数在模 \(n\) 意义下是两两不同的(根据定理 7.1.5)。由于与 \(n\) 互素的数的个数恰好是 \(\phi(n)\),这意味着集合 \(\{g^0, g^1, \dots, g^{\phi(n)-1}\}\) 模 \(n\) 的余数恰好构成了模 \(n\) 的简化剩余系 (reduced residue system)。换句话说,如果模 \(n\) 存在原根,那么模 \(n\) 的简化剩余系在乘法下构成一个循环群,这个群由原根生成。

    例子 7.2.2
    ① 模 7 的原根:\(\phi(7) = 6\)。我们需要找到一个数 \(g\) 使得 \(ord_7(g) = 6\)。
    与 7 互素的数有 1, 2, 3, 4, 5, 6。
    \(ord_7(1) = 1\)
    \(ord_7(2) = 3\) (因为 \(2^1=2, 2^2=4, 2^3=8 \equiv 1 \pmod 7\))
    \(ord_7(3) = 6\) (见例子 7.1.4)
    \(ord_7(4) = ord_7(2^2)\). \( (2^2)^k \equiv 1 \pmod 7 \Leftrightarrow 2^{2k} \equiv 1 \pmod 7 \Leftrightarrow 3 | 2k\). 最小正整数 \(k\) 是 3. 所以 \(ord_7(4) = 3\).
    \(ord_7(5) = ord_7(-2)\). \((-2)^1 \equiv -2 \equiv 5\), \((-2)^2 \equiv 4\), \((-2)^3 \equiv -8 \equiv -1 \equiv 6\), \((-2)^6 \equiv (-1)^2 \equiv 1 \pmod 7\). \(ord_7(5) = 6\).
    \(ord_7(6) = ord_7(-1)\). \((-1)^1 \equiv -1 \equiv 6\), \((-1)^2 \equiv 1 \pmod 7\). \(ord_7(6) = 2\).
    模 7 的原根是 3 和 5。

    ② 模 10 的原根:\(\phi(10) = 4\)。我们需要找到一个数 \(g\) 使得 \(ord_{10}(g) = 4\)。
    与 10 互素的数有 1, 3, 7, 9。
    \(ord_{10}(1) = 1\)
    \(ord_{10}(3) = 4\) (见例子 7.1.4)
    \(ord_{10}(7) = ord_{10}(-3)\). \((-3)^1 \equiv -3 \equiv 7\), \((-3)^2 \equiv 9\), \((-3)^3 \equiv -27 \equiv 3\), \((-3)^4 \equiv 81 \equiv 1 \pmod{10}\). \(ord_{10}(7) = 4\).
    \(ord_{10}(9) = ord_{10}(-1)\). \((-1)^1 \equiv -1 \equiv 9\), \((-1)^2 \equiv 1 \pmod{10}\). \(ord_{10}(9) = 2\).
    模 10 的原根是 3 和 7。

    ③ 模 8 的原根:\(\phi(8) = 4\)。我们需要找到一个数 \(g\) 使得 \(ord_8(g) = 4\)。
    与 8 互素的数有 1, 3, 5, 7。
    \(ord_8(1) = 1\)
    \(ord_8(3) = 2\) (见例子 7.1.4)
    \(ord_8(5) = 2\) (见例子 7.1.4)
    \(ord_8(7) = 2\) (见例子 7.1.4)
    模 8 不存在原根。

    从上面的例子可以看出,有些模数存在原根,有些则不存在。那么,哪些模数存在原根呢?这是数论中的一个重要问题。

    在回答这个问题之前,我们先来探讨一下,如果模 \(n\) 存在原根,那么它有多少个原根。

    定理 7.2.3 如果模 \(n\) 存在原根,那么它恰好有 \(\phi(\phi(n))\) 个原根。

    证明思路:
    设 \(g\) 是模 \(n\) 的一个原根。则与 \(n\) 互素的数的集合 \(\{a \pmod n \mid \gcd(a, n) = 1\}\) 等于集合 \(\{g^k \pmod n \mid k = 0, 1, \dots, \phi(n)-1\}\)。
    一个元素 \(g^k\) 是原根当且仅当 \(ord_n(g^k) = \phi(n)\)。
    我们知道 \(ord_n(g^k) = \frac{ord_n(g)}{\gcd(k, ord_n(g))}\).
    因为 \(g\) 是原根,\(ord_n(g) = \phi(n)\)。所以 \(ord_n(g^k) = \frac{\phi(n)}{\gcd(k, \phi(n))}\).
    要使 \(g^k\) 是原根,我们需要 \(ord_n(g^k) = \phi(n)\),即 \(\frac{\phi(n)}{\gcd(k, \phi(n))} = \phi(n)\)。
    这等价于 \(\gcd(k, \phi(n)) = 1\)。
    所以,\(g^k\) 是原根当且仅当 \(k\) 与 \(\phi(n)\) 互素。
    在 \(k \in \{0, 1, \dots, \phi(n)-1\}\) 中,与 \(\phi(n)\) 互素的整数的个数恰好是 \(\phi(\phi(n))\)。
    因此,如果模 \(n\) 存在原根,那么它恰好有 \(\phi(\phi(n))\) 个原根。证毕。

    例子 7.2.4
    ① 模 7 的原根个数:\(\phi(7) = 6\)。原根个数为 \(\phi(\phi(7)) = \phi(6) = \phi(2)\phi(3) = 1 \cdot 2 = 2\)。我们找到了 3 和 5,确实是 2 个。
    ② 模 10 的原根个数:\(\phi(10) = 4\)。原根个数为 \(\phi(\phi(10)) = \phi(4) = 4(1 - 1/2) = 2\)。我们找到了 3 和 7,确实是 2 个。

    7.3 存在原根的模 (Moduli Having Primitive Roots)

    现在我们来揭示哪些正整数 \(n\) 存在原根。这是一个重要的定理。

    定理 7.3.1 模 \(n\) 存在原根当且仅当 \(n\) 等于 \(1, 2, 4, p^k\) 或 \(2p^k\),其中 \(p\) 是奇素数,\(k\) 是正整数。

    这意味着除了 1, 2, 4 之外,只有奇素数的幂次以及奇素数幂次的两倍存在原根。例如,模 3, 5, 6, 7, 10, 11, 13, 14, 17, 18, 19, 22, 23, 25, 26, ... 存在原根,而模 8, 9, 12, 15, 16, 20, 21, 24, ... 不存在原根。

    证明思路 (非完全证明):
    证明这个定理需要分几个部分:
    ① 证明对于 \(n = 1, 2, 4, p^k, 2p^k\) (p为奇素数, k>=1) 存在原根。
    ② 证明对于其他形式的 \(n\) 不存在原根。

    部分证明思路:

    情况 1:\(n = p^k\),\(p\) 是奇素数,\(k \ge 1\)。
    可以证明对于任何奇素数 \(p\),模 \(p\) 总是存在原根。证明过程通常涉及多项式同余的根的个数以及 Cauchy 定理在有限阿贝尔群上的应用(这里的群是 \((\mathbb{Z}/p\mathbb{Z})^*\))。
    进一步,可以证明如果 \(g\) 是模 \(p\) 的原根,那么 \(g\) 或者 \(g+p\) 是模 \(p^2\) 的原根。然后通过归纳法可以证明模 \(p^k\) 存在原根。

    情况 2:\(n = 2p^k\),\(p\) 是奇素数,\(k \ge 1\)。
    如果 \(g\) 是模 \(p^k\) 的原根,可以证明存在一个整数 \(a\) (它是 \(g\) 或 \(g+p^k\)) 使得 \(a\) 是模 \(2p^k\) 的原根。

    情况 3:\(n = 2^k\),\(k \ge 3\)。
    我们证明对于 \(k \ge 3\),模 \(2^k\) 不存在原根。
    考虑与 \(2^k\) 互素的奇数 \(a\)。我们来计算 \(a^2 \pmod{2^k}\)。
    对于任何奇数 \(a\),\(a\) 可以写成 \(2m+1\) 的形式。
    \(a^2 = (2m+1)^2 = 4m^2 + 4m + 1 = 4m(m+1) + 1\).
    由于 \(m(m+1)\) 总是偶数,设 \(m(m+1) = 2j\),则 \(a^2 = 4(2j) + 1 = 8j + 1\).
    所以对于任何奇数 \(a\),\(a^2 \equiv 1 \pmod 8\)。
    这意味着对于 \(n=8\),所有与 8 互素的数 (1, 3, 5, 7) 的平方都模 8 余 1。它们的阶最大是 2。而 \(\phi(8) = 4\)。所以模 8 不存在原根。
    对于 \(k > 3\),我们可以证明更强的结论:对于任何奇数 \(a\),\(a^{2^{k-2}} \equiv 1 \pmod{2^k}\)。
    证明思路:使用数学归纳法。
    基础步骤:\(k=3\),\(a^{2^{3-2}} = a^2 \equiv 1 \pmod 8\),已证。
    归纳步骤:假设 \(a^{2^{k-2}} \equiv 1 \pmod{2^k}\) 对于 \(k \ge 3\) 成立。这意味着 \(a^{2^{k-2}} = 1 + c \cdot 2^k\) 对于某个整数 \(c\)。
    则 \(a^{2^{k-1}} = (a^{2^{k-2}})^2 = (1 + c \cdot 2^k)^2 = 1 + 2 \cdot c \cdot 2^k + c^2 \cdot 2^{2k} = 1 + c \cdot 2^{k+1} + c^2 \cdot 2^{2k}\).
    因为 \(k \ge 3\),所以 \(2k \ge k+3\). \(c^2 \cdot 2^{2k}\) 是 \(2^{k+1}\) 的倍数。
    所以 \(a^{2^{k-1}} \equiv 1 \pmod{2^{k+1}}\).
    根据数学归纳法,对于任何奇数 \(a\) 和 \(k \ge 3\),\(a^{2^{k-2}} \equiv 1 \pmod{2^k}\)。
    这意味着与 \(2^k\) 互素的数的阶 \(ord_{2^k}(a)\) 必须整除 \(2^{k-2}\)。
    而 \(\phi(2^k) = 2^k(1 - 1/2) = 2^{k-1}\).
    对于 \(k \ge 3\),\(2^{k-2} < 2^{k-1}\)。所以没有任何一个数的阶能达到 \(\phi(2^k)\)。
    因此,对于 \(k \ge 3\),模 \(2^k\) 不存在原根。

    情况 4:\(n\) 可以分解为两个互素的因子 \(n = n_1 n_2\),其中 \(n_1 > 2\) 且 \(n_2 > 2\),\(\gcd(n_1, n_2) = 1\)。
    假设模 \(n\) 存在原根 \(g\)。则 \(ord_n(g) = \phi(n) = \phi(n_1)\phi(n_2)\).
    根据中国剩余定理(Chinese Remainder Theorem),同余式 \(x \equiv a_1 \pmod{n_1}\) 和 \(x \equiv a_2 \pmod{n_2}\) 存在唯一解模 \(n_1 n_2\).
    考虑任意与 \(n\) 互素的整数 \(a\). 则 \(\gcd(a, n_1) = 1\) 且 \(\gcd(a, n_2) = 1\).
    根据欧拉定理,\(a^{\phi(n_1)} \equiv 1 \pmod{n_1}\) 且 \(a^{\phi(n_2)} \equiv 1 \pmod{n_2}\).
    由于 \(n_1 > 2\) 且 \(n_2 > 2\),\(\phi(n_1)\) 和 \(\phi(n_2)\) 都是偶数。
    设 \(L = \text{lcm}(\phi(n_1), \phi(n_2))\). 由于 \(\phi(n_1)\) 和 \(\phi(n_2)\) 都是偶数,\(L \le \frac{\phi(n_1)\phi(n_2)}{2} = \frac{\phi(n)}{2}\).
    对于任何与 \(n\) 互素的 \(a\),我们有 \(a^{\phi(n_1)} \equiv 1 \pmod{n_1}\) 和 \(a^{\phi(n_2)} \equiv 1 \pmod{n_2}\).
    因此,\(a^L = (a^{\phi(n_1)})^{\dots} \equiv 1^{\dots} \equiv 1 \pmod{n_1}\) 且 \(a^L = (a^{\phi(n_2)})^{\dots} \equiv 1^{\dots} \equiv 1 \pmod{n_2}\).
    根据中国剩余定理,由于 \(\gcd(n_1, n_2) = 1\),\(a^L \equiv 1 \pmod{n_1 n_2}\).
    这意味着任何与 \(n\) 互素的数的阶 \(ord_n(a)\) 都必须整除 \(L\).
    但是 \(L \le \phi(n)/2 < \phi(n)\).
    所以没有任何一个数的阶能达到 \(\phi(n)\)。
    因此,在这种情况下,模 \(n\) 不存在原根。

    综合以上情况,定理得证。

    这个定理为我们提供了判断一个模数是否存在原根的准则。找到一个原根通常没有通用的简单公式,对于较大的模数,可能需要通过试验或者更高级的算法来寻找。

    7.4 指标 (Index) 的概念与性质

    如果模 \(n\) 存在原根 \(g\),那么与 \(n\) 互素的数的集合 \(\{a \pmod n \mid \gcd(a, n) = 1\}\) 恰好是 \(\{g^0, g^1, \dots, g^{\phi(n)-1}\}\) 模 \(n\) 的余数集合。这意味着对于任何与 \(n\) 互素的整数 \(a\),都存在唯一的整数 \(k \in \{0, 1, \dots, \phi(n)-1\}\) 使得 \(a \equiv g^k \pmod n\)。这个指数 \(k\) 扮演了类似于对数在实数乘法中的角色。

    定义 7.4.1 设模 \(n\) 存在原根 \(g\)。对于任何与 \(n\) 互素的整数 \(a\),使得 \(g^k \equiv a \pmod n\) 成立的最小非负整数 \(k\) 称为 \(a\) 以 \(g\) 为底的指标 (index of \(a\) with respect to \(g\)) 模 \(\phi(n)\),记作 \(ind_g(a)\) 或 \(I_g(a)\)。

    注意,指标是定义在模 \(\phi(n)\) 意义下的,因为 \(g^{\phi(n)} \equiv 1 \pmod n\),所以 \(g^k \equiv g^{k'} \pmod n\) 当且仅当 \(k \equiv k' \pmod{\phi(n)}\) (根据定理 7.1.5)。因此,\(ind_g(a)\) 是模 \(\phi(n)\) 意义下唯一的。通常我们取 \(ind_g(a)\) 为 \(0, 1, \dots, \phi(n)-1\) 中的那个值。

    指标的概念将模 \(n\) 意义下的乘法运算转化为了模 \(\phi(n)\) 意义下的加法运算,这与实数对数的性质非常相似。

    指标的基本性质 (Properties of Index):
    设模 \(n\) 存在原根 \(g\),且 \(a, b\) 是与 \(n\) 互素的整数。则:

    ① \(ind_g(1) \equiv 0 \pmod{\phi(n)}\)
    解释: \(g^0 \equiv 1 \pmod n\),且 0 是最小非负整数。

    ② \(ind_g(g) \equiv 1 \pmod{\phi(n)}\)
    解释: \(g^1 \equiv g \pmod n\),且 1 是最小正整数。

    ③ \(ind_g(ab) \equiv ind_g(a) + ind_g(b) \pmod{\phi(n)}\)
    证明: 设 \(ind_g(a) \equiv k_a \pmod{\phi(n)}\) 且 \(ind_g(b) \equiv k_b \pmod{\phi(n)}\)。
    则 \(a \equiv g^{k_a} \pmod n\) 且 \(b \equiv g^{k_b} \pmod n\)。
    于是 \(ab \equiv g^{k_a} g^{k_b} = g^{k_a + k_b} \pmod n\)。
    根据指标的定义,\(ind_g(ab)\) 是使得 \(g^k \equiv ab \pmod n\) 成立的指数。
    所以 \(ind_g(ab) \equiv k_a + k_b \pmod{\phi(n)}\),即 \(ind_g(ab) \equiv ind_g(a) + ind_g(b) \pmod{\phi(n)}\)。

    ④ \(ind_g(a^k) \equiv k \cdot ind_g(a) \pmod{\phi(n)}\) 对于任何正整数 \(k\)。
    证明: 设 \(ind_g(a) \equiv k_a \pmod{\phi(n)}\)。则 \(a \equiv g^{k_a} \pmod n\)。
    于是 \(a^k \equiv (g^{k_a})^k = g^{k \cdot k_a} \pmod n\)。
    根据指标的定义,\(ind_g(a^k) \equiv k \cdot k_a \pmod{\phi(n)}\),即 \(ind_g(a^k) \equiv k \cdot ind_g(a) \pmod{\phi(n)}\)。
    这个性质对于负整数 \(k\) 也成立,只要 \(a^k\) 模 \(n\) 的逆元存在(即 \(\gcd(a, n) = 1\),则 \(a^{-1}\) 存在,\(a^k\) 存在)。

    ⑤ \(a \equiv b \pmod n\) 当且仅当 \(ind_g(a) \equiv ind_g(b) \pmod{\phi(n)}\) (对于 \(\gcd(a, n) = \gcd(b, n) = 1\))。
    证明:
    \((\Rightarrow)\) 如果 \(a \equiv b \pmod n\),则 \(g^{ind_g(a)} \equiv a \equiv b \equiv g^{ind_g(b)} \pmod n\)。根据定理 7.1.5,\(ind_g(a) \equiv ind_g(b) \pmod{ord_n(g)}\)。因为 \(g\) 是原根,\(ord_n(g) = \phi(n)\),所以 \(ind_g(a) \equiv ind_g(b) \pmod{\phi(n)}\)。
    \((\Leftarrow)\) 如果 \(ind_g(a) \equiv ind_g(b) \pmod{\phi(n)}\),则 \(ind_g(a) = ind_g(b) + m \cdot \phi(n)\) 对于某个整数 \(m\)。
    \(a \equiv g^{ind_g(a)} = g^{ind_g(b) + m \cdot \phi(n)} = g^{ind_g(b)} \cdot (g^{\phi(n)})^m \pmod n\).
    因为 \(g^{\phi(n)} \equiv 1 \pmod n\),所以 \(a \equiv g^{ind_g(b)} \cdot 1^m \equiv g^{ind_g(b)} \equiv b \pmod n\).

    这些性质使得我们可以利用指标来解决一些同余方程。

    应用:解同余方程 \(x^k \equiv a \pmod n\)
    假设模 \(n\) 存在原根 \(g\),且 \(\gcd(a, n) = 1\)。我们要解方程 \(x^k \equiv a \pmod n\),其中 \(\gcd(x, n) = 1\)。
    对两边取以 \(g\) 为底的指标:
    \(ind_g(x^k) \equiv ind_g(a) \pmod{\phi(n)}\)
    \(k \cdot ind_g(x) \equiv ind_g(a) \pmod{\phi(n)}\)

    这是一个关于未知数 \(ind_g(x)\) 的线性同余方程。设 \(y = ind_g(x)\) 且 \(b = ind_g(a)\),方程变为 \(ky \equiv b \pmod{\phi(n)}\)。
    根据线性同余方程的理论(见章节 4.4),这个方程有解当且仅当 \(\gcd(k, \phi(n)) | b\)。
    如果 \(\gcd(k, \phi(n)) | b\),则方程有 \(\gcd(k, \phi(n))\) 个解模 \(\phi(n)\)。
    设 \(d = \gcd(k, \phi(n))\)。如果 \(d | b\),则有 \(d\) 个解 \(y_0, y_1, \dots, y_{d-1}\) 模 \(\phi(n)\)。
    对于每一个解 \(y_i\),我们可以找到对应的 \(x_i\) 模 \(n\):
    \(x_i \equiv g^{y_i} \pmod n\).
    这些 \(x_i\) 就是原方程 \(x^k \equiv a \pmod n\) 的所有模 \(n\) 的解。

    例子 7.4.2 解同余方程 \(x^3 \equiv 4 \pmod 7\)。
    模数 \(n=7\),\(\phi(7) = 6\)。模 7 存在原根,例如 \(g=3\)。
    我们需要计算 \(ind_3(4) \pmod 6\)。
    \(3^1 \equiv 3 \pmod 7\)
    \(3^2 \equiv 2 \pmod 7\)
    \(3^3 \equiv 6 \pmod 7\)
    \(3^4 \equiv 4 \pmod 7\)
    \(3^5 \equiv 5 \pmod 7\)
    \(3^6 \equiv 1 \pmod 7\)
    所以 \(ind_3(4) = 4\).
    方程变为 \(3 \cdot ind_3(x) \equiv ind_3(4) \pmod{\phi(7)}\),即 \(3 \cdot ind_3(x) \equiv 4 \pmod 6\).
    这是一个关于 \(ind_3(x)\) 的线性同余方程。
    计算 \(\gcd(3, 6) = 3\).
    方程有解当且仅当 \(3 | 4\). 但 \(3 \nmid 4\).
    因此,方程 \(3 \cdot ind_3(x) \equiv 4 \pmod 6\) 无解。
    这意味着原方程 \(x^3 \equiv 4 \pmod 7\) 无解。

    例子 7.4.3 解同余方程 \(x^2 \equiv 4 \pmod{10}\).
    模数 \(n=10\),\(\phi(10) = 4\). 模 10 存在原根,例如 \(g=3\).
    我们需要计算 \(ind_3(4) \pmod 4\).
    与 10 互素的数是 1, 3, 7, 9.
    \(3^0 \equiv 1 \pmod{10}\)
    \(3^1 \equiv 3 \pmod{10}\)
    \(3^2 \equiv 9 \pmod{10}\)
    \(3^3 \equiv 7 \pmod{10}\)
    \(3^4 \equiv 1 \pmod{10}\)
    \(ind_3(1) = 0, ind_3(3) = 1, ind_3(7) = 3, ind_3(9) = 2\).
    注意,4 与 10 不互素 (\(\gcd(4, 10) = 2\)). 指标只定义在与模数互素的数上。
    所以我们不能直接使用指标来解 \(x^2 \equiv 4 \pmod{10}\) 的所有解。
    但是,我们可以先考虑与 10 互素的解。如果 \(x\) 与 10 互素,那么 \(x^2\) 也与 10 互素。但 4 与 10 不互素,所以 \(x^2 \equiv 4 \pmod{10}\) 的解 \(x\) 不可能与 10 互素。
    这意味着我们不能直接套用上面的指标方法来找所有解。

    让我们回到方程 \(x^2 \equiv 4 \pmod{10}\).
    这等价于 \(10 | (x^2 - 4)\),即 \(10 | (x-2)(x+2)\).
    因为 \(10 = 2 \cdot 5\),这等价于 \(2 | (x-2)(x+2)\) 且 \(5 | (x-2)(x+2)\).
    \(2 | (x-2)(x+2)\) 总是成立,因为如果 \(x\) 是偶数,\(x-2\) 和 \(x+2\) 都是偶数;如果 \(x\) 是奇数,\(x-2\) 和 \(x+2\) 都是奇数,但它们的差是 4,所以一个奇数乘以一个奇数是奇数,这不对。如果 \(x\) 是奇数,\(x-2\) 是奇数,\(x+2\) 是奇数,它们的乘积是奇数,不可能被 2 整除。所以 \(x\) 必须是偶数。如果 \(x\) 是偶数,\(x-2\) 和 \(x+2\) 都是偶数,乘积是 4 的倍数,当然是 2 的倍数。所以 \(x\) 必须是偶数。

    \(5 | (x-2)(x+2)\) 意味着 \(5 | (x-2)\) 或 \(5 | (x+2)\).
    即 \(x \equiv 2 \pmod 5\) 或 \(x \equiv -2 \equiv 3 \pmod 5\).

    所以我们有同余组:
    ① \(x \equiv 0 \pmod 2\) (因为 \(x\) 是偶数) 且 \(x \equiv 2 \pmod 5\)
    ② \(x \equiv 0 \pmod 2\) 且 \(x \equiv 3 \pmod 5\)

    解同余组 ①:\(x = 2k\). \(2k \equiv 2 \pmod 5\). 乘以 3 (2模5的逆元),\(6k \equiv 6 \pmod 5\),\(k \equiv 1 \pmod 5\). \(k = 5m + 1\). \(x = 2(5m+1) = 10m + 2\). \(x \equiv 2 \pmod{10}\).
    解同余组 ②:\(x = 2k\). \(2k \equiv 3 \pmod 5\). 乘以 3,\(6k \equiv 9 \pmod 5\),\(k \equiv 4 \pmod 5\). \(k = 5m + 4\). \(x = 2(5m+4) = 10m + 8\). \(x \equiv 8 \pmod{10}\).

    所以方程 \(x^2 \equiv 4 \pmod{10}\) 的解是 \(x \equiv 2 \pmod{10}\) 和 \(x \equiv 8 \pmod{10}\).
    注意到 \(x=2\) 和 \(x=8\) 都与 10 不互素。

    这个例子说明,当方程 \(x^k \equiv a \pmod n\) 中的 \(a\) 与 \(n\) 不互素时,不能直接使用指标方法。但是,如果 \(\gcd(a, n) = 1\),指标方法是非常有效的。

    总结:
    本章我们学习了整数的阶、原根以及指标的概念。
    ⚝ 阶 \(ord_n(a)\) 描述了 \(a\) 的幂次模 \(n\) 的周期性。
    ⚝ 原根 \(g\) 是阶等于 \(\phi(n)\) 的整数,它的存在使得模 \(n\) 的简化剩余系成为一个循环群。
    ⚝ 我们了解了哪些模数存在原根:\(1, 2, 4, p^k, 2p^k\) (p为奇素数, k>=1)。
    ⚝ 指标 \(ind_g(a)\) 是模 \(n\) 意义下乘法到模 \(\phi(n)\) 意义下加法的桥梁,类似于对数。
    ⚝ 指标可以用来解决一些同余方程,特别是 \(x^k \equiv a \pmod n\) 当 \(\gcd(a, n) = 1\) 时。

    原根和指标是初等数论中非常重要的工具,它们为我们深入理解模算术的结构打开了大门,并在许多应用领域发挥着关键作用。

    8. chapter 二次剩余与二次互反律 (Quadratic Residues and Quadratic Reciprocity)

    欢迎来到数论中一个既经典又优美的领域:二次剩余与二次互反律。这一章将带领我们探索整数在模一个数意义下的平方根问题。这不仅是一个理论上引人入胜的话题,它在密码学、代数数论等领域也有着重要的应用。我们将从基本概念出发,逐步深入到数论中最著名的定理之一——二次互反律。

    8.1 二次剩余 (Quadratic Residue) 与 二次非剩余 (Quadratic Non-residue)

    在同余理论中,我们研究线性同余方程 \(ax \equiv b \pmod{n}\)。现在,我们将目光转向非线性同余方程中最简单的一种:二次同余方程。

    考虑同余方程
    \[ x^2 \equiv a \pmod{n} \]
    其中 \(x\) 是未知数,\(a\) 和 \(n\) 是给定的整数,且 \(n > 1\)。

    如果这个同余方程有解,我们就称 \(a\) 是模 \(n\) 的一个二次剩余 (Quadratic Residue)。
    如果这个同余方程没有解,我们就称 \(a\) 是模 \(n\) 的一个二次非剩余 (Quadratic Non-residue)。

    为了避免平凡情况和简化讨论,我们通常要求 \(\gcd(a, n) = 1\)。如果 \(\gcd(a, n) \neq 1\),方程 \(x^2 \equiv a \pmod{n}\) 的解的存在性会变得复杂,通常需要先处理公约数。在本章中,除非特别说明,我们讨论二次剩余和二次非剩余时,都假定 \(\gcd(a, n) = 1\)。

    特别地,当模数 \(n\) 是一个素数 \(p\) 时,理论会变得非常简洁和深刻。我们将主要关注模素数 \(p\) 的情况。

    定义 8.1.1 设 \(p\) 是一个素数,\(a\) 是一个整数且 \(p \nmid a\)。如果同余方程 \(x^2 \equiv a \pmod{p}\) 有解,则称 \(a\) 是模 \(p\) 的一个二次剩余 (Quadratic Residue)。如果同余方程 \(x^2 \equiv a \pmod{p}\) 没有解,则称 \(a\) 是模 \(p\) 的一个二次非剩余 (Quadratic Non-residue)。

    注意:根据定义,0 永远不是模 \(p\) 的二次剩余或非剩余,因为我们要求 \(p \nmid a\)。

    例子 8.1.2
    考虑模 5 的情况。我们计算所有与 5 互素的数的平方模 5:
    \(1^2 \equiv 1 \pmod{5}\)
    \(2^2 \equiv 4 \pmod{5}\)
    \(3^2 \equiv 9 \equiv 4 \pmod{5}\)
    \(4^2 \equiv 16 \equiv 1 \pmod{5}\)
    模 5 与 5 互素的数是 1, 2, 3, 4。它们的平方模 5 的结果是 1 和 4。
    因此,模 5 的二次剩余是 1 和 4。
    模 5 的二次非剩余是 2 和 3。

    考虑模 7 的情况。与 7 互素的数是 1, 2, 3, 4, 5, 6。
    \(1^2 \equiv 1 \pmod{7}\)
    \(2^2 \equiv 4 \pmod{7}\)
    \(3^2 \equiv 9 \equiv 2 \pmod{7}\)
    \(4^2 \equiv 16 \equiv 2 \pmod{7}\)
    \(5^2 \equiv 25 \equiv 4 \pmod{7}\)
    \(6^2 \equiv 36 \equiv 1 \pmod{7}\)
    模 7 的二次剩余是 1, 2, 4。
    模 7 的二次非剩余是 3, 5, 6。

    定理 8.1.3 设 \(p\) 是一个奇素数。在模 \(p\) 的完全剩余系 (Complete Residue System) \(\{0, 1, \dots, p-1\}\) 中,与 \(p\) 互素的数共有 \(p-1\) 个。其中恰好有 \((p-1)/2\) 个二次剩余和 \((p-1)/2\) 个二次非剩余。

    证明思路:考虑映射 \(f: \{1, 2, \dots, p-1\} \to \{1, 2, \dots, p-1\}\) 定义为 \(f(x) = x^2 \pmod{p}\)。
    如果 \(x^2 \equiv y^2 \pmod{p}\),则 \(x^2 - y^2 \equiv 0 \pmod{p}\),即 \((x-y)(x+y) \equiv 0 \pmod{p}\)。
    由于 \(p\) 是素数,这蕴含着 \(p | (x-y)\) 或 \(p | (x+y)\)。
    在集合 \(\{1, 2, \dots, p-1\}\) 中,\(x \equiv y \pmod{p}\) 当且仅当 \(x=y\)。
    而 \(x+y \equiv 0 \pmod{p}\) 意味着 \(y \equiv -x \pmod{p}\)。在 \(\{1, 2, \dots, p-1\}\) 中,对于任意 \(x\),恰好有一个 \(y \neq x\) 使得 \(y \equiv -x \pmod{p}\) (即 \(y = p-x\))。
    因此,对于每一个平方值 \(a \equiv x^2 \pmod{p}\),如果 \(a\) 是二次剩余,则恰好有两个不同的解 \(x\) 和 \(p-x\) 满足 \(x^2 \equiv a \pmod{p}\) (除非 \(x \equiv p-x \pmod{p}\),即 \(2x \equiv 0 \pmod{p}\),对于奇素数 \(p\),这只发生在 \(x \equiv 0 \pmod{p}\) 时,但这不在我们的考虑范围内,因为我们只考虑与 \(p\) 互素的数)。
    所以,映射 \(x \mapsto x^2 \pmod{p}\) 将 \(\{1, 2, \dots, p-1\}\) 中的 \(p-1\) 个数两两映射到同一个平方值上。
    因此,不同的平方值(即二次剩余)的个数是 \((p-1)/2\)。
    与 \(p\) 互素的数共有 \(p-1\) 个,其中 \((p-1)/2\) 个是二次剩余,剩下的 \((p-1) - (p-1)/2 = (p-1)/2\) 个就是二次非剩余。

    8.2 勒让德符号 (Legendre Symbol)

    为了方便表示一个数是否是模素数的二次剩余,法国数学家勒让德 (Adrien-Marie Legendre) 引入了一个符号。

    定义 8.2.1 设 \(p\) 是一个奇素数,\(a\) 是一个整数。勒让德符号 (Legendre Symbol) \(\left(\frac{a}{p}\right)\) 定义为:
    \[ \left(\frac{a}{p}\right) = \begin{cases} 1 & \text{如果 } a \text{ 是模 } p \text{ 的二次剩余且 } p \nmid a \\ -1 & \text{如果 } a \text{ 是模 } p \text{ 的二次非剩余} \\ 0 & \text{如果 } p | a \end{cases} \]

    这个符号简洁地表示了 \(a\) 与模 \(p\) 的二次剩余性质。当 \(p \nmid a\) 时,\(\left(\frac{a}{p}\right) = 1\) 当且仅当方程 \(x^2 \equiv a \pmod{p}\) 有解;\(\left(\frac{a}{p}\right) = -1\) 当且仅当方程 \(x^2 \equiv a \pmod{p}\) 无解。

    例子 8.2.2
    根据前面模 5 的例子:
    \(\left(\frac{1}{5}\right) = 1\)
    \(\left(\frac{2}{5}\right) = -1\)
    \(\left(\frac{3}{5}\right) = -1\)
    \(\left(\frac{4}{5}\right) = 1\)
    \(\left(\frac{5}{5}\right) = 0\)

    根据前面模 7 的例子:
    \(\left(\frac{1}{7}\right) = 1\)
    \(\left(\frac{2}{7}\right) = 1\)
    \(\left(\frac{3}{7}\right) = -1\)
    \(\left(\frac{4}{7}\right) = 1\)
    \(\left(\frac{5}{7}\right) = -1\)
    \(\left(\frac{6}{7}\right) = -1\)
    \(\left(\frac{7}{7}\right) = 0\)

    勒让德符号提供了一种方便的记号,但如何计算 \(\left(\frac{a}{p}\right)\) 而不是通过穷举法来检查 \(x^2 \equiv a \pmod{p}\) 是否有解呢?这就需要研究勒让德符号的性质。

    8.3 勒让德符号的性质 (Properties of Legendre Symbol)

    勒让德符号具有许多有用的性质,这些性质使得计算和应用它变得更加容易。

    性质 8.3.1 设 \(p\) 是奇素数,\(a, b\) 是整数。
    ① 如果 \(a \equiv b \pmod{p}\),则 \(\left(\frac{a}{p}\right) = \left(\frac{b}{p}\right)\)。
    ② \(\left(\frac{a^2}{p}\right) = 1\) 如果 \(p \nmid a\)。
    ③ \(\left(\frac{1}{p}\right) = 1\)。
    ④ \(\left(\frac{-1}{p}\right) = (-1)^{(p-1)/2}\)。
    这意味着 \(\left(\frac{-1}{p}\right) = 1\) 如果 \(p \equiv 1 \pmod{4}\),\(\left(\frac{-1}{p}\right) = -1\) 如果 \(p \equiv 3 \pmod{4}\)。
    ⑤ \(\left(\frac{ab}{p}\right) = \left(\frac{a}{p}\right) \left(\frac{b}{p}\right)\) (乘积性 (Multiplicativity))。
    特别地,\(\left(\frac{a^k}{p}\right) = \left(\frac{a}{p}\right)^k\)。
    ⑥ \(\left(\frac{a^2 b}{p}\right) = \left(\frac{b}{p}\right)\) 如果 \(p \nmid a\)。

    证明思路
    ① 这是由同余的性质直接得出的。如果 \(a \equiv b \pmod{p}\),则 \(x^2 \equiv a \pmod{p}\) 有解当且仅当 \(x^2 \equiv b \pmod{p}\) 有解。
    ② 如果 \(p \nmid a\),则 \(x=a\) 是 \(x^2 \equiv a^2 \pmod{p}\) 的一个解。
    ③ 这是性质②的特例,取 \(a=1\)。
    ④ 这是欧拉判别法 (Euler's Criterion) 的一个直接推论。欧拉判别法是勒让德符号最重要的性质之一。

    定理 8.3.2 (欧拉判别法 - Euler's Criterion) 设 \(p\) 是一个奇素数,\(a\) 是一个整数且 \(p \nmid a\)。则
    \[ \left(\frac{a}{p}\right) \equiv a^{(p-1)/2} \pmod{p} \]

    证明思路
    如果 \(a\) 是模 \(p\) 的二次剩余,则存在 \(x\) 使得 \(x^2 \equiv a \pmod{p}\)。由费马小定理 (Fermat's Little Theorem),\(x^{p-1} \equiv 1 \pmod{p}\)。于是 \(a^{(p-1)/2} \equiv (x^2)^{(p-1)/2} = x^{p-1} \equiv 1 \pmod{p}\)。
    如果 \(a\) 是模 \(p\) 的二次非剩余,证明稍微复杂一些,需要利用原根 (Primitive Root) 或威尔逊定理 (Wilson's Theorem) 的思想。考虑多项式 \(x^{(p-1)/2} - 1 \pmod{p}\)。它的根是模 \(p\) 的二次剩余。考虑多项式 \(x^{(p-1)/2} + 1 \pmod{p}\)。它的根是模 \(p\) 的二次非剩余。因此,如果 \(a\) 是二次非剩余,则 \(a^{(p-1)/2} \equiv -1 \pmod{p}\)。
    综合起来,\(\left(\frac{a}{p}\right)\) 和 \(a^{(p-1)/2}\) 在模 \(p\) 意义下同余,且它们的值只能是 1 或 -1 (因为 \(a^{(p-1)/2}\) 是 \(x^2 \equiv 1 \pmod{p}\) 的解,其解只有 1 和 -1 模 \(p\))。

    ⑤ 乘积性是欧拉判别法的直接推论:
    \(\left(\frac{ab}{p}\right) \equiv (ab)^{(p-1)/2} = a^{(p-1)/2} b^{(p-1)/2} \equiv \left(\frac{a}{p}\right) \left(\frac{b}{p}\right) \pmod{p}\)。
    由于 \(\left(\frac{ab}{p}\right)\) 和 \(\left(\frac{a}{p}\right) \left(\frac{b}{p}\right)\) 的值都只能是 1, -1 或 0,且它们在模 \(p\) 意义下同余,对于 \(p > 2\),这蕴含着它们的值相等。如果 \(p|a\) 或 \(p|b\),则 \(p|ab\),此时等式两边都为 0。如果 \(p \nmid a\) 且 \(p \nmid b\),则 \(p \nmid ab\),此时等式两边都为 1 或 -1。

    ⑥ 这是由性质②和性质⑤得出的:\(\left(\frac{a^2 b}{p}\right) = \left(\frac{a^2}{p}\right) \left(\frac{b}{p}\right) = 1 \cdot \left(\frac{b}{p}\right) = \left(\frac{b}{p}\right)\)。

    性质④ \(\left(\frac{-1}{p}\right) = (-1)^{(p-1)/2}\) 告诉我们何时 -1 是模 \(p\) 的二次剩余。
    性质⑤ 乘积性非常重要,它允许我们将 \(\left(\frac{a}{p}\right)\) 的计算分解为计算 \(\left(\frac{q}{p}\right)\),其中 \(q\) 是 \(a\) 的素因数。

    我们还需要知道如何计算 \(\left(\frac{2}{p}\right)\)。

    性质 8.3.3 设 \(p\) 是奇素数。
    \[ \left(\frac{2}{p}\right) = (-1)^{(p^2-1)/8} \]
    这意味着 \(\left(\frac{2}{p}\right) = 1\) 如果 \(p \equiv 1 \pmod{8}\) 或 \(p \equiv 7 \pmod{8}\)。
    \(\left(\frac{2}{p}\right) = -1\) 如果 \(p \equiv 3 \pmod{8}\) 或 \(p \equiv 5 \pmod{8}\)。

    这个性质的证明比 \(\left(\frac{-1}{p}\right)\) 的证明要复杂一些,通常需要使用高斯引理 (Gauss's Lemma)。

    有了这些性质,特别是乘积性,我们可以将计算 \(\left(\frac{a}{p}\right)\) 简化为计算 \(\left(\frac{q}{p}\right)\) 对于 \(a\) 的素因数 \(q\),以及 \(\left(\frac{-1}{p}\right)\) 和 \(\left(\frac{2}{p}\right)\)。
    例如,计算 \(\left(\frac{10}{13}\right)\):
    \(\left(\frac{10}{13}\right) = \left(\frac{2 \cdot 5}{13}\right) = \left(\frac{2}{13}\right) \left(\frac{5}{13}\right)\)。
    对于 \(\left(\frac{2}{13}\right)\),因为 \(13 \equiv 5 \pmod{8}\),所以 \(\left(\frac{2}{13}\right) = -1\)。
    现在我们需要计算 \(\left(\frac{5}{13}\right)\)。这涉及到两个不同的素数 \(5\) 和 \(13\)。如何计算 \(\left(\frac{q}{p}\right)\) 呢?这就引出了二次互反律。

    8.4 二次互反律 (Law of Quadratic Reciprocity)

    二次互反律是数论中最深刻和最重要的定理之一,由高斯 (Carl Friedrich Gauss) 首次给出严格证明。他称其为“黄金定理”。它建立了 \(\left(\frac{p}{q}\right)\) 和 \(\left(\frac{q}{p}\right)\) 之间的关系,其中 \(p\) 和 \(q\) 是不同的奇素数。

    定理 8.4.1 (二次互反律 - Law of Quadratic Reciprocity) 设 \(p\) 和 \(q\) 是两个不同的奇素数。则
    \[ \left(\frac{p}{q}\right) \left(\frac{q}{p}\right) = (-1)^{\frac{(p-1)}{2} \frac{(q-1)}{2}} \]
    或者等价地:
    \[ \left(\frac{p}{q}\right) = \left(\frac{q}{p}\right) \text{ 如果 } p \equiv 1 \pmod{4} \text{ 或 } q \equiv 1 \pmod{4} \]
    \[ \left(\frac{p}{q}\right) = -\left(\frac{q}{p}\right) \text{ 如果 } p \equiv 3 \pmod{4} \text{ 且 } q \equiv 3 \pmod{4} \]

    这个定理的证明非常巧妙,有许多不同的方法,包括高斯的第一个证明(基于二次高斯和)、艾森斯坦 (Gotthold Eisenstein) 的几何证明等。这些证明通常比较高级,超出了基础数论的范围,但理解定理的陈述和应用是基础。

    二次互反律将计算 \(\left(\frac{q}{p}\right)\) 转化为计算 \(\left(\frac{p}{q}\right)\),这通常会简化问题,特别是当 \(p > q\) 时,我们可以将 \(p\) 模 \(q\) 化简,从而处理更小的数。

    结合二次互反律和前面提到的补充定律(对于 \(\left(\frac{-1}{p}\right)\) 和 \(\left(\frac{2}{p}\right)\)),我们可以系统地计算任何 \(\left(\frac{a}{p}\right)\)。

    计算 \(\left(\frac{a}{p}\right)\) 的步骤 (假设 \(p\) 是奇素数,\(p \nmid a\)):
    ① 利用性质①,将 \(a\) 化简到模 \(p\) 的最小正剩余或最小绝对剩余。即计算 \(a' \equiv a \pmod{p}\),其中 \(0 < a' < p\)。则 \(\left(\frac{a}{p}\right) = \left(\frac{a'}{p}\right)\)。
    ② 将 \(a'\) 进行素因数分解:\(a' = (-1)^k 2^m q_1^{e_1} \dots q_r^{e_r}\),其中 \(q_i\) 是奇素数。
    ③ 利用乘积性,\(\left(\frac{a'}{p}\right) = \left(\frac{-1}{p}\right)^k \left(\frac{2}{p}\right)^m \left(\frac{q_1}{p}\right)^{e_1} \dots \left(\frac{q_r}{p}\right)^{e_r}\)。
    ④ 利用性质⑥,如果 \(e_i\) 是偶数,则 \(\left(\frac{q_i}{p}\right)^{e_i} = (\left(\frac{q_i}{p}\right)^2)^{e_i/2} = 1^{e_i/2} = 1\)。所以我们只需要考虑 \(e_i\) 为奇数的情况,即只需要计算 \(\left(\frac{q_i}{p}\right)\) 对于 \(a'\) 的不同的奇素因数 \(q_i\)。
    ⑤ 对于每个奇素因数 \(q_i\),利用二次互反律将 \(\left(\frac{q_i}{p}\right)\) 转化为 \(\left(\frac{p}{q_i}\right)\),可能带一个符号。
    ⑥ 重复步骤①-⑤,直到勒让德符号的上标变成 1 或 -1 或 2。

    例子 8.4.2 计算 \(\left(\frac{10}{13}\right)\)。
    \(\left(\frac{10}{13}\right) = \left(\frac{2}{13}\right) \left(\frac{5}{13}\right)\)。
    对于 \(\left(\frac{2}{13}\right)\):\(13 \equiv 5 \pmod{8}\),所以 \(\left(\frac{2}{13}\right) = -1\)。
    对于 \(\left(\frac{5}{13}\right)\):\(p=13, q=5\)。都是奇素数。\(13 \equiv 1 \pmod{4}\),\(5 \equiv 1 \pmod{4}\)。根据二次互反律,\(\left(\frac{5}{13}\right) = \left(\frac{13}{5}\right)\)。
    现在计算 \(\left(\frac{13}{5}\right)\)。利用性质①,\(13 \equiv 3 \pmod{5}\)。所以 \(\left(\frac{13}{5}\right) = \left(\frac{3}{5}\right)\)。
    现在计算 \(\left(\frac{3}{5}\right)\)。\(p=5, q=3\)。都是奇素数。\(5 \equiv 1 \pmod{4}\),\(3 \equiv 3 \pmod{4}\)。根据二次互反律,\(\left(\frac{3}{5}\right) = \left(\frac{5}{3}\right)\)。
    现在计算 \(\left(\frac{5}{3}\right)\)。利用性质①,\(5 \equiv 2 \pmod{3}\)。所以 \(\left(\frac{5}{3}\right) = \left(\frac{2}{3}\right)\)。
    现在计算 \(\left(\frac{2}{3}\right)\)。\(p=3\)。\(3 \equiv 3 \pmod{8}\)。根据性质 8.3.3,\(\left(\frac{2}{3}\right) = -1\)。
    因此,\(\left(\frac{5}{3}\right) = -1\),\(\left(\frac{3}{5}\right) = -1\),\(\left(\frac{5}{13}\right) = -1\)。
    最后,\(\left(\frac{10}{13}\right) = \left(\frac{2}{13}\right) \left(\frac{5}{13}\right) = (-1) \cdot (-1) = 1\)。
    这意味着 10 是模 13 的二次剩余。我们可以验证:\(6^2 = 36 \equiv 10 \pmod{13}\)。

    例子 8.4.3 计算 \(\left(\frac{35}{101}\right)\)。101 是素数。
    \(\left(\frac{35}{101}\right) = \left(\frac{5 \cdot 7}{101}\right) = \left(\frac{5}{101}\right) \left(\frac{7}{101}\right)\)。
    计算 \(\left(\frac{5}{101}\right)\):\(p=101, q=5\)。\(101 \equiv 1 \pmod{4}\),\(5 \equiv 1 \pmod{4}\)。\(\left(\frac{5}{101}\right) = \left(\frac{101}{5}\right)\)。
    \(101 \equiv 1 \pmod{5}\)。\(\left(\frac{101}{5}\right) = \left(\frac{1}{5}\right) = 1\)。所以 \(\left(\frac{5}{101}\right) = 1\)。
    计算 \(\left(\frac{7}{101}\right)\):\(p=101, q=7\)。\(101 \equiv 1 \pmod{4}\),\(7 \equiv 3 \pmod{4}\)。\(\left(\frac{7}{101}\right) = \left(\frac{101}{7}\right)\)。
    \(101 = 14 \cdot 7 + 3\),所以 \(101 \equiv 3 \pmod{7}\)。\(\left(\frac{101}{7}\right) = \left(\frac{3}{7}\right)\)。
    计算 \(\left(\frac{3}{7}\right)\):\(p=7, q=3\)。\(7 \equiv 3 \pmod{4}\),\(3 \equiv 3 \pmod{4}\)。根据二次互反律,\(\left(\frac{3}{7}\right) = -\left(\frac{7}{3}\right)\)。
    \(7 \equiv 1 \pmod{3}\)。\(\left(\frac{7}{3}\right) = \left(\frac{1}{3}\right) = 1\)。
    所以 \(\left(\frac{3}{7}\right) = -1\)。因此 \(\left(\frac{7}{101}\right) = -1\)。
    最后,\(\left(\frac{35}{101}\right) = \left(\frac{5}{101}\right) \left(\frac{7}{101}\right) = 1 \cdot (-1) = -1\)。
    这意味着 35 是模 101 的二次非剩余。

    二次互反律是判断一个数是否为二次剩余的强大工具。

    8.5 雅可比符号 (Jacobi Symbol)

    勒让德符号只定义在模素数的情况下。为了处理模合数的情况,德国数学家雅可比 (Carl Gustav Jacob Jacobi) 引入了雅可比符号。雅可比符号是勒让德符号的推广。

    定义 8.5.1 设 \(n\) 是一个正奇数,其素因数分解为 \(n = p_1^{e_1} p_2^{e_2} \dots p_k^{e_k}\)。设 \(a\) 是一个整数。雅可比符号 (Jacobi Symbol) \(\left(\frac{a}{n}\right)\) 定义为:
    \[ \left(\frac{a}{n}\right) = \left(\frac{a}{p_1}\right)^{e_1} \left(\frac{a}{p_2}\right)^{e_2} \dots \left(\frac{a}{p_k}\right)^{e_k} \]
    其中 \(\left(\frac{a}{p_i}\right)\) 是勒让德符号。

    注意:雅可比符号 \(\left(\frac{a}{n}\right)\) 的定义要求 \(n\) 是正奇数。如果 \(\gcd(a, n) \neq 1\),则至少存在一个素因数 \(p_i\) 同时整除 \(a\) 和 \(n\),此时 \(\left(\frac{a}{p_i}\right) = 0\),从而 \(\left(\frac{a}{n}\right) = 0\)。如果 \(\gcd(a, n) = 1\),则对于所有的 \(i\),\(p_i \nmid a\),此时所有的 \(\left(\frac{a}{p_i}\right)\) 都为 1 或 -1,因此 \(\left(\frac{a}{n}\right)\) 也为 1 或 -1。

    重要区别:如果 \(\left(\frac{a}{p}\right) = 1\) (其中 \(p\) 是素数),则 \(a\) 是模 \(p\) 的二次剩余。但是,如果 \(\left(\frac{a}{n}\right) = 1\) (其中 \(n\) 是合数),\(a\) 不一定是模 \(n\) 的二次剩余。
    例子:\(\left(\frac{2}{9}\right)\)。\(n=9=3^2\)。根据定义,\(\left(\frac{2}{9}\right) = \left(\frac{2}{3}\right)^2\)。我们知道 \(\left(\frac{2}{3}\right) = -1\)。所以 \(\left(\frac{2}{9}\right) = (-1)^2 = 1\)。
    然而,方程 \(x^2 \equiv 2 \pmod{9}\) 没有解。我们检查:
    \(1^2 \equiv 1 \pmod{9}\)
    \(2^2 \equiv 4 \pmod{9}\)
    \(3^2 \equiv 9 \equiv 0 \pmod{9}\)
    \(4^2 \equiv 16 \equiv 7 \pmod{9}\)
    \(5^2 \equiv 25 \equiv 7 \pmod{9}\)
    \(6^2 \equiv 36 \equiv 0 \pmod{9}\)
    \(7^2 \equiv 49 \equiv 4 \pmod{9}\)
    \(8^2 \equiv 64 \equiv 1 \pmod{9}\)
    模 9 的二次剩余是 1, 4, 7 (与 9 互素的)。2 不是模 9 的二次剩余。
    所以,雅可比符号为 1 仅是 \(a\) 是模 \(n\) 的二次剩余的必要条件,而不是充分条件。

    尽管如此,雅可比符号仍然非常有用,因为它满足与勒让德符号类似的许多性质,并且允许我们使用类似二次互反律的方法来计算它,而无需知道 \(n\) 的素因数分解。

    性质 8.5.2 设 \(n, m\) 是正奇数,\(a, b\) 是整数。
    ① 如果 \(a \equiv b \pmod{n}\),则 \(\left(\frac{a}{n}\right) = \left(\frac{b}{n}\right)\)。
    ② \(\left(\frac{ab}{n}\right) = \left(\frac{a}{n}\right) \left(\frac{b}{n}\right)\)。
    ③ \(\left(\frac{a}{nm}\right) = \left(\frac{a}{n}\right) \left(\frac{a}{m}\right)\)。
    ④ \(\left(\frac{1}{n}\right) = 1\)。
    ⑤ \(\left(\frac{-1}{n}\right) = (-1)^{(n-1)/2}\)。
    这意味着 \(\left(\frac{-1}{n}\right) = 1\) 如果 \(n \equiv 1 \pmod{4}\),\(\left(\frac{-1}{n}\right) = -1\) 如果 \(n \equiv 3 \pmod{4}\)。
    ⑥ \(\left(\frac{2}{n}\right) = (-1)^{(n^2-1)/8}\)。
    这意味着 \(\left(\frac{2}{n}\right) = 1\) 如果 \(n \equiv 1 \pmod{8}\) 或 \(n \equiv 7 \pmod{8}\)。
    \(\left(\frac{2}{n}\right) = -1\) 如果 \(n \equiv 3 \pmod{8}\) 或 \(n \equiv 5 \pmod{8}\)。

    这些性质都可以从雅可比符号的定义和勒让德符号的相应性质推导出来。例如,对于性质⑤:
    设 \(n = p_1^{e_1} \dots p_k^{e_k}\)。
    \(\left(\frac{-1}{n}\right) = \prod_{i=1}^k \left(\frac{-1}{p_i}\right)^{e_i} = \prod_{i=1}^k ((-1)^{(p_i-1)/2})^{e_i} = (-1)^{\sum_{i=1}^k e_i (p_i-1)/2}\)。
    我们需要证明 \(\sum e_i (p_i-1)/2 \equiv (n-1)/2 \pmod{2}\)。
    由于 \(n = \prod p_i^{e_i}\),且 \(n\) 是奇数,所有 \(p_i\) 都是奇素数。
    \(n-1 = \prod p_i^{e_i} - 1\)。
    如果 \(p_i \equiv 1 \pmod{4}\),则 \((p_i-1)/2\) 是偶数。如果 \(p_i \equiv 3 \pmod{4}\),则 \((p_i-1)/2\) 是奇数。
    \(p_i \equiv 1 + 2 \cdot (p_i-1)/2 \pmod{4}\)。
    \(n = \prod (1 + 2 \cdot (p_i-1)/2)^{e_i}\)。
    展开后,\(n \equiv \prod (1 + e_i \cdot 2 \cdot (p_i-1)/2) \pmod{4}\) (忽略高次项,因为我们只关心模 4)。
    \(n \equiv \prod (1 + e_i (p_i-1)) \pmod{4}\)。
    \(n \equiv 1 + \sum e_i (p_i-1) \pmod{4}\)。
    所以 \((n-1)/2 \equiv (\sum e_i (p_i-1))/2 = \sum e_i (p_i-1)/2 \pmod{2}\)。
    这证明了性质⑤。性质⑥的证明类似,但更复杂一些。

    最重要的是,雅可比符号也满足二次互反律的形式!

    定理 8.5.3 (雅可比符号的二次互反律) 设 \(n\) 和 \(m\) 是互素的正奇数。则
    \[ \left(\frac{n}{m}\right) \left(\frac{m}{n}\right) = (-1)^{\frac{(n-1)}{2} \frac{(m-1)}{2}} \]
    或者等价地:
    \[ \left(\frac{n}{m}\right) = \left(\frac{m}{n}\right) \text{ 如果 } n \equiv 1 \pmod{4} \text{ 或 } m \equiv 1 \pmod{4} \]
    \[ \left(\frac{n}{m}\right) = -\left(\frac{m}{n}\right) \text{ 如果 } n \equiv 3 \pmod{4} \text{ 且 } m \equiv 3 \pmod{4} \]

    这个定理的证明可以完全基于勒让德符号的二次互反律和雅可比符号的定义。设 \(n = p_1^{e_1} \dots p_k^{e_k}\) 和 \(m = q_1^{f_1} \dots q_l^{f_l}\) 是 \(n\) 和 \(m\) 的素因数分解。由于 \(\gcd(n, m) = 1\),所有的 \(p_i\) 和 \(q_j\) 都是不同的素数。
    \(\left(\frac{n}{m}\right) = \left(\frac{\prod p_i^{e_i}}{m}\right) = \prod \left(\frac{p_i^{e_i}}{m}\right) = \prod \left(\frac{p_i}{m}\right)^{e_i} = \prod_{i=1}^k \left(\frac{p_i}{\prod q_j^{f_j}}\right)^{e_i} = \prod_{i=1}^k \left(\prod_{j=1}^l \left(\frac{p_i}{q_j}\right)^{f_j}\right)^{e_i} = \prod_{i=1}^k \prod_{j=1}^l \left(\frac{p_i}{q_j}\right)^{e_i f_j}\)。
    类似地,\(\left(\frac{m}{n}\right) = \prod_{j=1}^l \prod_{i=1}^k \left(\frac{q_j}{p_i}\right)^{f_j e_i}\)。
    根据勒让德符号的二次互反律,\(\left(\frac{p_i}{q_j}\right) \left(\frac{q_j}{p_i}\right) = (-1)^{\frac{(p_i-1)}{2} \frac{(q_j-1)}{2}}\)。
    所以 \(\left(\frac{p_i}{q_j}\right) = \left(\frac{q_j}{p_i}\right) (-1)^{\frac{(p_i-1)}{2} \frac{(q_j-1)}{2}}\)。
    \(\left(\frac{n}{m}\right) = \prod_{i,j} \left(\frac{q_j}{p_i}\right)^{e_i f_j} ((-1)^{\frac{(p_i-1)}{2} \frac{(q_j-1)}{2}})^{e_i f_j} = \left(\frac{m}{n}\right) (-1)^{\sum_{i,j} e_i f_j \frac{(p_i-1)}{2} \frac{(q_j-1)}{2}}\)。
    指数部分是 \(\left(\sum e_i \frac{p_i-1}{2}\right) \left(\sum f_j \frac{q_j-1}{2}\right)\)。
    根据前面性质⑤的证明思路,\(\sum e_i \frac{p_i-1}{2} \equiv \frac{n-1}{2} \pmod{2}\) 且 \(\sum f_j \frac{q_j-1}{2} \equiv \frac{m-1}{2} \pmod{2}\)。
    所以指数 \(\sum_{i,j} e_i f_j \frac{(p_i-1)}{2} \frac{(q_j-1)}{2} \equiv \left(\sum e_i \frac{p_i-1}{2}\right) \left(\sum f_j \frac{q_j-1}{2}\right) \equiv \frac{n-1}{2} \frac{m-1}{2} \pmod{2}\)。
    因此,\(\left(\frac{n}{m}\right) = \left(\frac{m}{n}\right) (-1)^{\frac{(n-1)}{2} \frac{(m-1)}{2}}\),这正是雅可比符号的二次互反律。

    雅可比符号的引入极大地简化了勒让德符号的计算过程,因为它避免了对分母进行素因数分解。

    例子 8.5.4 重新计算 \(\left(\frac{35}{101}\right)\) 使用雅可比符号的性质。
    \(\left(\frac{35}{101}\right)\)。\(n=101, m=35\)。101 是素数,35 是奇数,\(\gcd(35, 101)=1\)。
    \(101 \equiv 1 \pmod{4}\),\(35 \equiv 3 \pmod{4}\)。根据雅可比符号的二次互反律,\(\left(\frac{35}{101}\right) = \left(\frac{101}{35}\right)\)。
    \(101 = 2 \cdot 35 + 31\),所以 \(101 \equiv 31 \pmod{35}\)。\(\left(\frac{101}{35}\right) = \left(\frac{31}{35}\right)\)。
    现在计算 \(\left(\frac{31}{35}\right)\)。\(n=35, m=31\)。都是奇数,互素。\(35 \equiv 3 \pmod{4}\),\(31 \equiv 3 \pmod{4}\)。根据雅可比符号的二次互反律,\(\left(\frac{31}{35}\right) = -\left(\frac{35}{31}\right)\)。
    \(35 = 1 \cdot 31 + 4\),所以 \(35 \equiv 4 \pmod{31}\)。\(\left(\frac{35}{31}\right) = \left(\frac{4}{31}\right)\)。
    \(\left(\frac{4}{31}\right) = \left(\frac{2^2}{31}\right)\)。根据性质②,\(\left(\frac{2^2}{31}\right) = \left(\frac{2}{31}\right)^2\)。
    或者更简单地,利用性质⑥,\(\left(\frac{a^2 b}{p}\right) = \left(\frac{b}{p}\right)\) 的推广形式 \(\left(\frac{a^2 b}{n}\right) = \left(\frac{b}{n}\right)\) 如果 \(\gcd(a, n)=1\)。这里 \(a=2, b=1, n=31\)。\(\left(\frac{4}{31}\right) = \left(\frac{2^2 \cdot 1}{31}\right) = \left(\frac{1}{31}\right) = 1\)。
    所以 \(\left(\frac{35}{31}\right) = 1\)。
    因此,\(\left(\frac{31}{35}\right) = -1\)。
    最后,\(\left(\frac{35}{101}\right) = \left(\frac{101}{35}\right) = \left(\frac{31}{35}\right) = -1\)。
    这个结果与使用勒让德符号计算的结果一致,但过程更简洁,因为我们没有对 35 进行素因数分解。

    雅可比符号在计算勒让德符号时非常方便,即使最终我们只关心模素数的二次剩余性质。它也是一些概率素性检验算法(如 Solovay-Strassen 素性检验)的基础。

    本章我们深入探讨了二次剩余的概念,引入了勒让德符号和雅可比符号,并学习了它们的重要性质,特别是数论中著名的二次互反律。这些工具使我们能够有效地判断一个数是否是模另一个数的二次剩余。

    好的,作为一名经验丰富的讲师,我将按照您提供的结构和要求,为您撰写《数论基础》一书的第九章:丢番图方程 (Diophantine Equations)。

    9. chapter 丢番图方程 (Diophantine Equations)

    欢迎来到数论中一个充满挑战与魅力的领域——丢番图方程。丢番图方程得名于古希腊数学家亚历山大港的丢番图(Diophantus of Alexandria),他在其著作《算术》(Arithmetica)中研究了许多只要求有理数解(在当时通常等价于正整数解)的方程。现代数论中的丢番图方程特指那些只寻求整数解(通常包括正整数、负整数和零)的方程。

    与一般的代数方程不同,丢番图方程的解空间被限制在整数范围内,这使得它们的求解变得异常困难,甚至可能没有整数解,或者有无穷多组整数解,其结构也可能非常复杂。本章将从最简单的线性丢番图方程入手,逐步探讨一些著名的非线性丢番图方程,如勾股数组和佩尔方程,并简要介绍一些更复杂的例子,希望能让你感受到丢番图方程的深邃与美妙。

    9.1 线性丢番图方程 (Linear Diophantine Equations)

    我们首先研究最简单的丢番图方程:线性丢番图方程。一个典型的二元线性丢番图方程具有以下形式:

    \[ ax + by = c \]

    其中 \(a, b, c\) 是给定的整数,我们寻求满足此方程的整数对 \((x, y)\)。更一般的,一个 \(n\) 元线性丢番图方程的形式为 \(a_1 x_1 + a_2 x_2 + \dots + a_n x_n = c\),其中 \(a_i\) 和 \(c\) 是整数,我们寻求整数解 \((x_1, x_2, \dots, x_n)\)。本节主要关注二元情况,因为多元情况可以通过迭代方法求解。

    对于二元线性丢番图方程 \(ax + by = c\),并非总是有整数解。存在整数解的充要条件是什么呢?

    存在性条件 (Existence Condition)

    方程 \(ax + by = c\) 有整数解 \((x, y)\) 当且仅当 \(c\) 是 \(a\) 和 \(b\) 的最大公约数 \(\gcd(a, b)\) 的倍数。

    证明:
    必要性: 假设方程 \(ax + by = c\) 有一组整数解 \((x_0, y_0)\),即 \(ax_0 + by_0 = c\)。设 \(d = \gcd(a, b)\)。根据最大公约数的定义,\(d\) 整除 \(a\) 且 \(d\) 整除 \(b\)。因此,\(d\) 整除 \(ax_0\) 且 \(d\) 整除 \(by_0\)。由整除的性质可知,\(d\) 整除它们的和 \(ax_0 + by_0\),即 \(d\) 整除 \(c\)。所以,如果方程有解,则 \(\gcd(a, b)\) 必须整除 \(c\)。

    充分性: 假设 \(\gcd(a, b)\) 整除 \(c\)。根据裴蜀定理 (Bézout's Identity)(参见本书第 2 章),存在整数 \(x', y'\) 使得 \(ax' + by' = \gcd(a, b)\)。由于 \(\gcd(a, b)\) 整除 \(c\),我们可以设 \(c = k \cdot \gcd(a, b)\) 对于某个整数 \(k\)。将裴蜀等式两边同乘以 \(k\),得到 \(a(x'k) + b(y'k) = k \cdot \gcd(a, b) = c\)。令 \(x_0 = x'k\) 和 \(y_0 = y'k\),则 \((x_0, y_0)\) 是方程 \(ax + by = c\) 的一组整数解。所以,如果 \(\gcd(a, b)\) 整除 \(c\),则方程必有整数解。

    求解方法 (Solution Method)

    如果 \(\gcd(a, b)\) 整除 \(c\),我们可以通过以下步骤找到方程 \(ax + by = c\) 的所有整数解:

    ▮▮▮▮ⓐ 找到一个特解 (Find a Particular Solution):
    ▮▮▮▮▮▮▮▮❷ 使用扩展欧几里得算法 (Extended Euclidean Algorithm) 找到整数 \(x'\) 和 \(y'\) 使得 \(ax' + by' = \gcd(a, b)\)。
    ▮▮▮▮▮▮▮▮❸ 由于 \(\gcd(a, b)\) 整除 \(c\),设 \(c = k \cdot \gcd(a, b)\)。将等式 \(ax' + by' = \gcd(a, b)\) 两边同乘以 \(k\),得到 \(a(x'k) + b(y'k) = c\)。因此,\((x_0, y_0) = (x'k, y'k)\) 是方程的一个特解。

    ▮▮▮▮ⓑ 找到通解 (Find the General Solution):
    ▮▮▮▮▮▮▮▮❷ 假设 \((x_0, y_0)\) 是方程 \(ax + by = c\) 的一个特解。考虑任意另一组整数解 \((x, y)\),则有 \(ax + by = c\) 和 \(ax_0 + by_0 = c\)。
    ▮▮▮▮▮▮▮▮❸ 将两式相减,得到 \(a(x - x_0) + b(y - y_0) = 0\),即 \(a(x - x_0) = -b(y - y_0)\)。
    ▮▮▮▮▮▮▮▮❹ 令 \(d = \gcd(a, b)\)。将方程两边同除以 \(d\),得到 \(\frac{a}{d}(x - x_0) = -\frac{b}{d}(y - y_0)\)。
    ▮▮▮▮▮▮▮▮❺ 注意到 \(\gcd(\frac{a}{d}, \frac{b}{d}) = 1\)。根据整除性质,由于 \(\frac{a}{d}\) 整除 \(-\frac{b}{d}(y - y_0)\) 且与 \(\frac{b}{d}\) 互素,所以 \(\frac{a}{d}\) 必须整除 \(y - y_0\)。
    ▮▮▮▮▮▮▮▮❻ 因此,存在一个整数 \(t\) 使得 \(y - y_0 = t \cdot \frac{a}{d}\)。代回方程 \(\frac{a}{d}(x - x_0) = -\frac{b}{d}(y - y_0)\),得到 \(\frac{a}{d}(x - x_0) = -\frac{b}{d} \cdot t \cdot \frac{a}{d}\)。由于 \(a \neq 0\)(如果 \(a=0\),方程变为 \(by=c\),解法更简单),可以消去 \(\frac{a}{d}\),得到 \(x - x_0 = -t \cdot \frac{b}{d}\)。
    ▮▮▮▮▮▮▮▮❼ 于是,通解可以表示为:
    \[ x = x_0 - t \cdot \frac{b}{\gcd(a, b)} \]
    \[ y = y_0 + t \cdot \frac{a}{\gcd(a, b)} \]
    其中 \(t\) 是任意整数。

    注意: 这里的 \(t\) 可以是任意整数,包括正整数、负整数和零。不同的 \(t\) 值对应不同的整数解。

    例子 (Example)

    求解线性丢番图方程 \(18x + 48y = 30\)。

    解:
    ▮▮▮▮ⓐ 计算 \(\gcd(18, 48)\)。
    \[ 48 = 2 \cdot 18 + 12 \]
    \[ 18 = 1 \cdot 12 + 6 \]
    \[ 12 = 2 \cdot 6 + 0 \]
    所以 \(\gcd(18, 48) = 6\)。

    ▮▮▮▮ⓑ 检查存在性条件。由于 \(30\) 是 \(6\) 的倍数(\(30 = 5 \cdot 6\)),方程有整数解。

    ▮▮▮▮ⓒ 使用扩展欧几里得算法找到 \(18x' + 48y' = 6\) 的一个特解。
    从欧几里得算法的倒数第二步开始:
    \[ 6 = 18 - 1 \cdot 12 \]
    将 \(12 = 48 - 2 \cdot 18\) 代入:
    \[ 6 = 18 - 1 \cdot (48 - 2 \cdot 18) \]
    \[ 6 = 18 - 48 + 2 \cdot 18 \]
    \[ 6 = 3 \cdot 18 + (-1) \cdot 48 \]
    所以,对于方程 \(18x' + 48y' = 6\),一个特解是 \((x', y') = (3, -1)\)。

    ▮▮▮▮ⓓ 找到原方程 \(18x + 48y = 30\) 的一个特解。
    由于 \(30 = 5 \cdot 6\),我们将等式 \(18(3) + 48(-1) = 6\) 两边同乘以 \(5\):
    \[ 18(3 \cdot 5) + 48(-1 \cdot 5) = 6 \cdot 5 \]
    \[ 18(15) + 48(-5) = 30 \]
    所以,原方程的一个特解是 \((x_0, y_0) = (15, -5)\)。

    ▮▮▮▮ⓔ 写出通解。
    \(\frac{a}{\gcd(a, b)} = \frac{18}{6} = 3\)
    \(\frac{b}{\gcd(a, b)} = \frac{48}{6} = 8\)
    通解为:
    \[ x = x_0 - t \cdot \frac{b}{\gcd(a, b)} = 15 - t \cdot 8 \]
    \[ y = y_0 + t \cdot \frac{a}{\gcd(a, b)} = -5 + t \cdot 3 \]
    其中 \(t\) 是任意整数。

    例如,当 \(t=0\) 时,得到特解 \((15, -5)\)。
    当 \(t=1\) 时,得到解 \((15 - 8, -5 + 3) = (7, -2)\)。验证:\(18(7) + 48(-2) = 126 - 96 = 30\)。
    当 \(t=-1\) 时,得到解 \((15 - (-8), -5 + (-3)) = (23, -8)\)。验证:\(18(23) + 48(-8) = 414 - 384 = 30\)。

    9.2 勾股数组 (Pythagorean Triples)

    勾股数组是数论中最著名的一类非线性丢番图方程的解。它来源于古老的勾股定理(毕达哥拉斯定理),即在一个直角三角形中,两条直角边的平方和等于斜边的平方。用数学语言表达,我们寻求满足方程 \(x^2 + y^2 = z^2\) 的正整数解 \((x, y, z)\)。

    定义与基本性质 (Definition and Basic Properties)

    一个勾股数组 (Pythagorean Triple) 是指满足方程 \(x^2 + y^2 = z^2\) 的三个正整数 \((x, y, z)\)。
    例如,\((3, 4, 5)\) 是一个勾股数组,因为 \(3^2 + 4^2 = 9 + 16 = 25 = 5^2\)。\((6, 8, 10)\) 也是一个勾股数组,因为 \(6^2 + 8^2 = 36 + 64 = 100 = 10^2\)。

    如果 \((x, y, z)\) 是一个勾股数组,那么对于任何正整数 \(k\),\((kx, ky, kz)\) 也是一个勾股数组,因为 \((kx)^2 + (ky)^2 = k^2 x^2 + k^2 y^2 = k^2(x^2 + y^2) = k^2 z^2 = (kz)^2\)。

    一个原始勾股数组 (Primitive Pythagorean Triple) 是指满足 \(x^2 + y^2 = z^2\) 且 \(\gcd(x, y, z) = 1\) 的正整数数组 \((x, y, z)\)。
    例如,\((3, 4, 5)\) 是原始勾股数组,而 \((6, 8, 10)\) 不是,因为 \(\gcd(6, 8, 10) = 2\)。

    性质:
    ⚝ 在一个原始勾股数组 \((x, y, z)\) 中,\(\gcd(x, y) = \gcd(y, z) = \gcd(x, z) = 1\)。
    ⚝ 在一个原始勾股数组 \((x, y, z)\) 中,\(x\) 和 \(y\) 必须一个为奇数,一个为偶数,而 \(z\) 必须为奇数。
    ▮▮▮▮证明:如果 \(x, y\) 都是偶数,则 \(z^2 = x^2 + y^2\) 也是偶数,\(z\) 也是偶数,则 \(\gcd(x, y, z) \ge 2\),与原始性矛盾。
    ▮▮▮▮如果 \(x, y\) 都是奇数,则 \(x^2 \equiv 1 \pmod 4\),\(y^2 \equiv 1 \pmod 4\),所以 \(z^2 = x^2 + y^2 \equiv 1 + 1 \equiv 2 \pmod 4\)。但是任何整数的平方模 4 只可能余 0 或 1(偶数的平方 \((2k)^2 = 4k^2 \equiv 0 \pmod 4\),奇数的平方 \((2k+1)^2 = 4k^2 + 4k + 1 \equiv 1 \pmod 4\))。因此 \(z^2 \equiv 2 \pmod 4\) 是不可能的。
    ▮▮▮▮所以 \(x, y\) 必须一个为奇数,一个为偶数。此时 \(z^2 = \text{奇数}^2 + \text{偶数}^2 \equiv 1 + 0 \equiv 1 \pmod 4\),所以 \(z^2\) 是奇数,\(z\) 也是奇数。

    生成原始勾股数组的公式 (Formula for Generating Primitive Pythagorean Triples)

    所有原始勾股数组 \((x, y, z)\)(不考虑 \(x, y\) 的顺序)都可以由以下公式生成:
    \[ x = m^2 - n^2 \]
    \[ y = 2mn \]
    \[ z = m^2 + n^2 \]
    其中 \(m\) 和 \(n\) 是满足以下条件的两个正整数:
    ⚝ \(m > n\)
    ⚝ \(\gcd(m, n) = 1\)
    ⚝ \(m\) 和 \(n\) 具有不同的奇偶性(一个为奇数,一个为偶数)

    推导思路:
    假设 \((x, y, z)\) 是一个原始勾股数组,且 \(y\) 是偶数(不失一般性,因为 \(x, y\) 可以互换)。则 \(x\) 是奇数,\(z\) 是奇数。
    方程 \(x^2 + y^2 = z^2\) 可以写成 \(y^2 = z^2 - x^2 = (z - x)(z + x)\)。
    由于 \(x, z\) 都是奇数,\(z - x\) 和 \(z + x\) 都是偶数。设 \(z - x = 2u\) 且 \(z + x = 2v\)。
    则 \(y^2 = (2u)(2v) = 4uv\),所以 \((y/2)^2 = uv\)。
    解出 \(x\) 和 \(z\): \(z = u + v\),\(x = v - u\)。
    现在考虑 \(\gcd(u, v)\)。\(\gcd(u, v) = \gcd(\frac{z-x}{2}, \frac{z+x}{2}) = \frac{1}{2}\gcd(z-x, z+x)\)。
    \(\gcd(z-x, z+x) = \gcd(z-x, (z+x) - (z-x)) = \gcd(z-x, 2x)\)。
    由于 \((x, z)\) 是原始的,\(\gcd(x, z) = 1\)。因此 \(\gcd(z-x, x) = \gcd(z, x) = 1\)。
    所以 \(\gcd(z-x, 2x)\) 只能是 1 或 2。因为 \(z-x\) 是偶数,\(\gcd(z-x, 2x)\) 必须是偶数,所以 \(\gcd(z-x, 2x) = 2\)。
    因此,\(\gcd(u, v) = \frac{1}{2} \cdot 2 = 1\)。
    由于 \(uv = (y/2)^2\) 且 \(\gcd(u, v) = 1\),根据算术基本定理 (Fundamental Theorem of Arithmetic),\(u\) 和 \(v\) 都必须是完全平方数。
    设 \(u = m^2\) 且 \(v = n^2\) 对于某些正整数 \(m, n\)。
    由于 \(\gcd(u, v) = \gcd(m^2, n^2) = 1\),所以 \(\gcd(m, n) = 1\)。
    代回 \(x, y, z\) 的表达式:
    \(x = v - u = n^2 - m^2\)
    \(y/2 = \sqrt{uv} = \sqrt{m^2 n^2} = mn\),所以 \(y = 2mn\)
    \(z = u + v = m^2 + n^2\)
    我们假设 \(y\) 是偶数,\(x\) 是奇数。要使 \(x = n^2 - m^2\) 是奇数,\(n^2\) 和 \(m^2\) 必须一个为奇数一个为偶数,这意味着 \(n\) 和 \(m\) 必须具有不同的奇偶性。
    要使 \(x, y, z\) 为正整数,需要 \(n^2 - m^2 > 0\),即 \(n > m\)。
    所以,原始勾股数组 \((x, y, z)\) 中 \(y\) 为偶数的形式为 \((n^2 - m^2, 2mn, n^2 + m^2)\),其中 \(n > m > 0\),\(\gcd(m, n) = 1\),且 \(m, n\) 奇偶性不同。
    如果 \(x\) 为偶数,则形式为 \((2mn, n^2 - m^2, n^2 + m^2)\),条件相同。
    为了统一,通常将公式写为 \((m^2 - n^2, 2mn, m^2 + n^2)\) 或 \((2mn, m^2 - n^2, m^2 + n^2)\),其中 \(m > n > 0\),\(\gcd(m, n) = 1\),且 \(m, n\) 奇偶性不同。

    生成所有勾股数组 (Generating All Pythagorean Triples)

    所有勾股数组 \((X, Y, Z)\) 都可以由原始勾股数组生成。如果 \((X, Y, Z)\) 是一个勾股数组,设 \(d = \gcd(X, Y, Z)\)。则 \(X = dx\),\(Y = dy\),\(Z = dz\),其中 \((x, y, z)\) 是一个原始勾股数组。
    所以,所有勾股数组的形式为 \((k(m^2 - n^2), k(2mn), k(m^2 + n^2))\) 或 \((k(2mn), k(m^2 - n^2), k(m^2 + n^2))\),其中 \(k\) 是任意正整数,\(m, n\) 是满足上述条件的用于生成原始勾股数组的正整数。

    例子 (Example)

    使用公式生成一些原始勾股数组:
    ⚝ 取 \(m=2, n=1\)。\(m>n\),\(\gcd(2, 1)=1\),奇偶性不同。
    \(x = 2^2 - 1^2 = 4 - 1 = 3\)
    \(y = 2(2)(1) = 4\)
    \(z = 2^2 + 1^2 = 4 + 1 = 5\)
    得到原始勾股数组 \((3, 4, 5)\)。

    ⚝ 取 \(m=3, n=2\)。\(m>n\),\(\gcd(3, 2)=1\),奇偶性不同。
    \(x = 3^2 - 2^2 = 9 - 4 = 5\)
    \(y = 2(3)(2) = 12\)
    \(z = 3^2 + 2^2 = 9 + 4 = 13\)
    得到原始勾股数组 \((5, 12, 13)\)。

    ⚝ 取 \(m=4, n=1\)。\(m>n\),\(\gcd(4, 1)=1\),奇偶性不同。
    \(x = 4^2 - 1^2 = 16 - 1 = 15\)
    \(y = 2(4)(1) = 8\)
    \(z = 4^2 + 1^2 = 16 + 1 = 17\)
    得到原始勾股数组 \((15, 8, 17)\)。

    ⚝ 取 \(m=4, n=3\)。\(m>n\),\(\gcd(4, 3)=1\),奇偶性不同。
    \(x = 4^2 - 3^2 = 16 - 9 = 7\)
    \(y = 2(4)(3) = 24\)
    \(z = 4^2 + 3^2 = 16 + 9 = 25\)
    得到原始勾股数组 \((7, 24, 25)\)。

    使用 \(k=2\) 和原始勾股数组 \((3, 4, 5)\),得到勾股数组 \((6, 8, 10)\)。
    使用 \(k=3\) 和原始勾股数组 \((5, 12, 13)\),得到勾股数组 \((15, 36, 39)\)。

    9.3 佩尔方程 (Pell's Equation) 的介绍

    佩尔方程是另一类重要的非线性丢番图方程,其形式为 \(x^2 - Dy^2 = 1\),其中 \(D\) 是一个给定的正整数,且 \(D\) 不是完全平方数。我们寻求该方程的整数解 \((x, y)\)。

    定义与基本性质 (Definition and Basic Properties)

    佩尔方程 (Pell's Equation) 是指形如 \(x^2 - Dy^2 = 1\) 的丢番图方程,其中 \(D\) 是一个正整数且不是完全平方数。我们通常关注非负整数解 \((x, y)\)。

    为什么 \(D\) 不能是完全平方数?
    如果 \(D = k^2\) 对于某个整数 \(k\),则方程变为 \(x^2 - k^2 y^2 = 1\),即 \(x^2 - (ky)^2 = 1\)。
    这可以分解为 \((x - ky)(x + ky) = 1\)。
    由于 \(x, y, k\) 都是整数,\(x - ky\) 和 \(x + ky\) 必须是整数。它们的乘积为 1,所以只有两种可能:
    ⚝ \(x - ky = 1\) 且 \(x + ky = 1\)。两式相加得 \(2x = 2\),所以 \(x = 1\)。代回得 \(1 - ky = 1\),所以 \(ky = 0\)。如果 \(k \neq 0\),则 \(y = 0\)。解为 \((1, 0)\)。
    ⚝ \(x - ky = -1\) 且 \(x + ky = -1\)。两式相加得 \(2x = -2\),所以 \(x = -1\)。代回得 \(-1 - ky = -1\),所以 \(ky = 0\)。如果 \(k \neq 0\),则 \(y = 0\)。解为 \((-1, 0)\)。
    如果 \(D\) 是完全平方数,佩尔方程只有平凡解 \(( \pm 1, 0)\)。当 \(D\) 不是完全平方数时,方程通常有非平凡解。

    平凡解 (Trivial Solution): 对于任何正非平方整数 \(D\),方程 \(x^2 - Dy^2 = 1\) 总是有一对整数解 \(( \pm 1, 0)\)。我们称 \((1, 0)\) 为非负平凡解。

    非平凡解 (Non-trivial Solution): 指除了 \(( \pm 1, 0)\) 之外的整数解。

    一个重要的结论是:当 \(D\) 是正的非完全平方整数时,佩尔方程 \(x^2 - Dy^2 = 1\) 总是存在无穷多组整数解。

    最小正整数解 (Fundamental Solution)

    在所有满足 \(x^2 - Dy^2 = 1\) 且 \(x > 0, y > 0\) 的整数解 \((x, y)\) 中,存在一个解 \((x_1, y_1)\) 使得 \(x_1\) 最小(等价地,\(y_1\) 最小)。这个解 \((x_1, y_1)\) 称为佩尔方程的最小正整数解基本解 (Fundamental Solution)。

    例如,对于方程 \(x^2 - 2y^2 = 1\),我们可以尝试一些 \(y\) 值:
    \(y=1\): \(x^2 - 2(1)^2 = 1 \implies x^2 = 3\) (无整数解)
    \(y=2\): \(x^2 - 2(2)^2 = 1 \implies x^2 = 9 \implies x = \pm 3\). 得到正整数解 \((3, 2)\)。
    检查:\(3^2 - 2(2)^2 = 9 - 8 = 1\)。
    \((3, 2)\) 是 \(x^2 - 2y^2 = 1\) 的一个正整数解。它是最小的正整数解吗?对于 \(y=1\) 没有正整数 \(x\),所以 \((3, 2)\) 确实是最小正整数解。

    对于方程 \(x^2 - 3y^2 = 1\):
    \(y=1\): \(x^2 - 3(1)^2 = 1 \implies x^2 = 4 \implies x = \pm 2\). 得到正整数解 \((2, 1)\)。
    检查:\(2^2 - 3(1)^2 = 4 - 3 = 1\)。
    \((2, 1)\) 是 \(x^2 - 3y^2 = 1\) 的最小正整数解。

    由基本解生成所有解 (Generating All Solutions from the Fundamental Solution)

    佩尔方程 \(x^2 - Dy^2 = 1\) 的所有正整数解 \((x_n, y_n)\) 可以由其最小正整数解 \((x_1, y_1)\) 生成。具体来说,所有正整数解 \((x_n, y_n)\) 满足:
    \[ x_n + y_n \sqrt{D} = (x_1 + y_1 \sqrt{D})^n \]
    对于 \(n = 1, 2, 3, \dots\)。

    解释:
    考虑代数数域 \(\mathbb{Q}(\sqrt{D}) = \{a + b\sqrt{D} \mid a, b \in \mathbb{Q}\}\)。在这个数域中,我们关注形如 \(x + y\sqrt{D}\) 的整数,其中 \(x, y \in \mathbb{Z}\)。
    定义范数 \(N(a + b\sqrt{D}) = (a + b\sqrt{D})(a - b\sqrt{D}) = a^2 - Db^2\)。
    佩尔方程 \(x^2 - Dy^2 = 1\) 相当于寻找范数为 1 的形如 \(x + y\sqrt{D}\) 的整数。
    如果 \(x_1 + y_1 \sqrt{D}\) 是一个范数为 1 的数(对应于最小正整数解),那么它的任意正整数次幂 \((x_1 + y_1 \sqrt{D})^n\) 的范数也是 1,因为 \(N(\alpha^n) = (N(\alpha))^n\)。
    设 \((x_1 + y_1 \sqrt{D})^n = x_n + y_n \sqrt{D}\),其中 \(x_n, y_n\) 是通过展开计算得到的整数。则 \(N(x_n + y_n \sqrt{D}) = x_n^2 - Dy_n^2 = (N(x_1 + y_1 \sqrt{D}))^n = 1^n = 1\)。
    因此,\((x_n, y_n)\) 是佩尔方程的解。可以证明,通过这种方式可以得到所有正整数解。

    例子:
    对于 \(x^2 - 2y^2 = 1\),最小正整数解是 \((x_1, y_1) = (3, 2)\)。
    \(n=1\): \(x_1 + y_1 \sqrt{2} = 3 + 2\sqrt{2}\)。解为 \((3, 2)\)。
    \(n=2\): \((3 + 2\sqrt{2})^2 = 3^2 + 2(3)(2\sqrt{2}) + (2\sqrt{2})^2 = 9 + 12\sqrt{2} + 8 = 17 + 12\sqrt{2}\)。解为 \((x_2, y_2) = (17, 12)\)。验证:\(17^2 - 2(12)^2 = 289 - 2(144) = 289 - 288 = 1\)。
    \(n=3\): \((3 + 2\sqrt{2})^3 = (3 + 2\sqrt{2})(17 + 12\sqrt{2}) = 3(17) + 3(12\sqrt{2}) + 2\sqrt{2}(17) + 2\sqrt{2}(12\sqrt{2}) = 51 + 36\sqrt{2} + 34\sqrt{2} + 48 = 99 + 70\sqrt{2}\)。解为 \((x_3, y_3) = (99, 70)\)。验证:\(99^2 - 2(70)^2 = 9801 - 2(4900) = 9801 - 9800 = 1\)。
    佩尔方程 \(x^2 - 2y^2 = 1\) 有无穷多组正整数解:\((3, 2), (17, 12), (99, 70), \dots\)。

    所有整数解包括正负情况:\(( \pm x_n, \pm y_n)\) 以及平凡解 \(( \pm 1, 0)\)。

    如何找到最小正整数解? (How to Find the Fundamental Solution?)

    找到佩尔方程的最小正整数解通常不是一件容易的事情。一种经典的方法是利用连分数 (Continued Fractions)(参见本书第 10 章)。佩尔方程 \(x^2 - Dy^2 = 1\) 的最小正整数解 \((x_1, y_1)\) 与 \(\sqrt{D}\) 的连分数展开有关。具体来说,如果 \(\sqrt{D}\) 的连分数展开是周期的,其周期长度为 \(k\),则最小正整数解 \((x_1, y_1)\) 可以从 \(\sqrt{D}\) 的连分数展开的第 \(k-1\) 个渐近分数 (convergent) \(\frac{p_{k-1}}{q_{k-1}}\) 得到,即 \(x_1 = p_{k-1}\) 且 \(y_1 = q_{k-1}\)。如果周期长度 \(k\) 是偶数,则最小正整数解由第 \(k-1\) 个渐近分数给出。如果周期长度 \(k\) 是奇数,则最小正整数解由第 \(2k-1\) 个渐近分数给出。

    例如,\(\sqrt{2}\) 的连分数展开是 \([1; 2, 2, 2, \dots]\),周期为 1。第 \(2(1)-1 = 1\) 个渐近分数是 \(1 + \frac{1}{2} = \frac{3}{2}\)。所以 \(x_1 = 3, y_1 = 2\)。
    \(\sqrt{3}\) 的连分数展开是 \([1; 1, 2, 1, 2, \dots]\),周期为 2。第 \(2-1 = 1\) 个渐近分数是 \(1 + \frac{1}{1} = 2\)。所以 \(x_1 = 2, y_1 = 1\)。

    佩尔方程在密码学、计算数论等领域有重要应用。

    9.4 一些非线性丢番图方程的例子 (Examples of Some Nonlinear Diophantine Equations)

    除了线性和佩尔方程,还有无数其他形式的非线性丢番图方程。这些方程的求解方法多种多样,通常没有统一的通用方法,而是需要针对具体方程运用不同的技巧,可能涉及同余理论、代数数论、解析数论、代数几何等高级工具。有些方程的求解非常困难,甚至是未解决的数学难题。

    以下是一些其他非线性丢番图方程的例子,旨在展示这个领域的广度和挑战:

    费马大定理 (Fermat's Last Theorem)

    方程形式:\(x^n + y^n = z^n\),其中 \(n\) 是大于 2 的整数。
    费马大定理断言,当整数 \(n > 2\) 时,方程 \(x^n + y^n = z^n\) 没有非零整数解 \((x, y, z)\)。
    这个定理由皮埃尔·德·费马 (Pierre de Fermat) 在 17 世纪提出,他在书页边空白处写下了这个猜想,并声称发现了一个“绝妙的证明”,但空白太小写不下。这个猜想困扰了数学家 300 多年,直到 1994 年才由安德鲁·怀尔斯 (Andrew Wiles) 爵士在理查德·泰勒 (Richard Taylor) 的协助下最终证明。证明过程极其复杂,使用了模形式 (modular forms)、椭圆曲线 (elliptic curves) 和伽罗瓦表示 (Galois representations) 等现代数学工具,远超费马时代的数学知识。

    椭圆曲线方程 (Elliptic Curve Equations)

    方程形式:\(y^2 = x^3 + ax + b\),其中 \(a, b\) 是整数。我们寻求整数解 \((x, y)\)。
    这类方程的整数解问题是数论研究的热点之一。莫德尔定理 (Mordell's Theorem) 指出,对于有理数域上的椭圆曲线,其有理点构成一个有限生成阿贝尔群。对于整数解,西格尔定理 (Siegel's Theorem on Integral Points) 指出,椭圆曲线只有有限多个整数点。然而,西格尔定理是非构造性的,它不提供找到所有整数解的方法。寻找椭圆曲线的整数解通常需要更深入的理论和计算方法。

    莫德尔方程 (Mordell Equation)

    方程形式:\(y^2 = x^3 + k\),其中 \(k\) 是一个给定的整数。这是椭圆曲线方程的一个特例。
    例如,方程 \(y^2 = x^3 + 17\)。寻找它的整数解是一个著名的难题。

    卡塔兰猜想 (Catalan's Conjecture) (现已证明为定理)

    方程形式:\(x^a - y^b = 1\),其中 \(x, a, y, b\) 都是大于 1 的整数。
    卡塔兰猜想断言,这个方程唯一的整数解是 \(x=3, a=2, y=2, b=3\),即 \(3^2 - 2^3 = 9 - 8 = 1\)。
    这个猜想由欧仁·查尔斯·卡塔兰 (Eugène Charles Catalan) 在 1844 年提出,直到 2002 年才由普雷达·米哈伊列斯库 (Preda Mihăilescu) 最终证明,因此现在称为米哈伊列斯库定理 (Mihăilescu's Theorem)。

    其他形式

    还有许多其他形式的非线性丢番图方程,例如:
    ⚝ \(x^2 - Dy^2 = N\) (广义佩尔方程 - Generalized Pell's Equation)
    ⚝ \(ax^2 + by^2 + cz^2 = 0\) (二次型方程 - Quadratic Forms)
    ⚝ \(x^4 + y^4 = z^2\) (与费马大定理 \(n=4\) 情况相关)
    ⚝ 指数丢番图方程,如 \(2^x - 3^y = 1\)

    求解这些方程需要运用数论的各种分支知识,包括代数数论(如理想类群、单位群)、解析数论(如L函数)、算术几何(如簇上的点)等。丢番图方程的研究是现代数论的核心领域之一,充满了挑战和机遇。

    本章我们初步探索了丢番图方程的世界,从相对简单的线性和佩尔方程,到一些著名的非线性方程。希望这能激发你对这个迷人领域的兴趣。

    10. chapter 连分数 (Continued Fractions) (进阶主题 - Advanced Topic)

    欢迎来到数论的进阶领域!连分数是一种非常优雅且强大的数学工具,它为我们提供了一种表示实数(尤其是无理数)的独特方式。与十进制或二进制表示不同,连分数能够揭示实数的一些深层结构,特别是在丢番图逼近(Diophantine Approximation)和求解丢番图方程(Diophantine Equations)方面展现出惊人的效用。本章将带你深入了解连分数的世界,从最基本的有限连分数开始,逐步过渡到无限连分数,探讨它们与最佳有理逼近的关系,并最终展示它们在求解佩尔方程(Pell's Equation)中的关键作用。

    虽然连分数本身的概念并不复杂,但其理论的深度和应用广泛性使其成为数论中一个重要的进阶课题。对于初学者,理解前几章的基础知识(特别是整除、欧几里得算法和有理数)将有助于更好地掌握本章内容。对于希望深入研究数论或相关领域的读者,连分数是不可或缺的工具。

    10.1 有限连分数 (Finite Continued Fractions)

    我们从最简单的形式开始:有限连分数。有限连分数提供了一种表示有理数(Rational Numbers)的方法。

    10.1.1 定义与表示 (Definition and Notation)

    一个有限连分数是一个形如以下的表达式:
    \[ a_0 + \frac{1}{a_1 + \frac{1}{a_2 + \frac{1}{\ddots + \frac{1}{a_n}}}} \]
    其中 \(a_0\) 是一个整数(Integer),\(a_1, a_2, \dots, a_n\) 是正整数(Positive Integers),且 \(a_n > 1\) 如果 \(n > 0\)。为了简洁,我们通常使用符号 \([a_0; a_1, a_2, \dots, a_n]\) 来表示这个连分数。

    例如:
    \[ [2; 1, 3, 4] = 2 + \frac{1}{1 + \frac{1}{3 + \frac{1}{4}}} \]
    我们可以计算出它的值:
    \[ 2 + \frac{1}{1 + \frac{1}{\frac{13}{4}}} = 2 + \frac{1}{1 + \frac{4}{13}} = 2 + \frac{1}{\frac{17}{13}} = 2 + \frac{13}{17} = \frac{34+13}{17} = \frac{47}{17} \]
    所以,有理数 \(\frac{47}{17}\) 可以表示为有限连分数 \([2; 1, 3, 4]\)。

    10.1.2 有理数的连分数展开 (Continued Fraction Expansion of Rational Numbers)

    任何有理数都可以表示为一个有限连分数。这个过程类似于欧几里得算法(Euclidean Algorithm)。给定一个有理数 \(\frac{p}{q}\) (假设 \(q > 0\)),我们可以进行如下操作:

    ① 令 \(x_0 = \frac{p}{q}\)。
    ② 设 \(a_0 = \lfloor x_0 \rfloor\) (向下取整)。
    ③ 如果 \(x_0\) 是整数,则 \(x_0 = a_0\),过程结束,连分数是 \([a_0]\)。
    ④ 如果 \(x_0\) 不是整数,则 \(x_0 = a_0 + \frac{1}{x_1}\),其中 \(x_1 = \frac{1}{x_0 - a_0} > 1\)。
    ⑤ 对 \(x_1\) 重复步骤 ②-④,得到 \(a_1 = \lfloor x_1 \rfloor\),如果 \(x_1\) 不是整数,则 \(x_1 = a_1 + \frac{1}{x_2}\),其中 \(x_2 = \frac{1}{x_1 - a_1} > 1\)。
    ⑥ 重复此过程,得到序列 \(a_0, a_1, a_2, \dots\)。由于每次 \(x_i\) 的分母都比前一次小(这与欧几里得算法中余数递减类似),这个过程最终会在某一步 \(x_n\) 成为整数时终止。此时 \(x_n = a_n\),且 \(a_n > 1\) 如果 \(n > 0\)。

    这个过程产生的序列 \([a_0; a_1, a_2, \dots, a_n]\) 就是 \(\frac{p}{q}\) 的连分数展开。这种展开是唯一的,除了末项 \(a_n\) 可以写成 \((a_n-1) + \frac{1}{1}\) 的形式,即 \([a_0; a_1, \dots, a_n]\) 和 \([a_0; a_1, \dots, a_n-1, 1]\) 表示同一个值(当 \(a_n > 1\) 时)。通常我们约定使用 \(a_n > 1\) 的形式。

    例子: 将 \(\frac{47}{17}\) 展开为连分数。
    \[ x_0 = \frac{47}{17} \]
    \(a_0 = \lfloor \frac{47}{17} \rfloor = 2\).
    \[ x_0 - a_0 = \frac{47}{17} - 2 = \frac{47 - 34}{17} = \frac{13}{17} \]
    \[ x_1 = \frac{1}{x_0 - a_0} = \frac{17}{13} \]
    \(a_1 = \lfloor \frac{17}{13} \rfloor = 1\).
    \[ x_1 - a_1 = \frac{17}{13} - 1 = \frac{4}{13} \]
    \[ x_2 = \frac{1}{x_1 - a_1} = \frac{13}{4} \]
    \(a_2 = \lfloor \frac{13}{4} \rfloor = 3\).
    \[ x_2 - a_2 = \frac{13}{4} - 3 = \frac{1}{4} \]
    \[ x_3 = \frac{1}{x_2 - a_2} = 4 \]
    \(a_3 = \lfloor 4 \rfloor = 4\). \(x_3\) 是整数,过程结束。
    所以 \(\frac{47}{17} = [2; 1, 3, 4]\)。

    10.1.3 渐近分数 (Convergents)

    对于连分数 \([a_0; a_1, a_2, \dots, a_n]\),我们定义它的渐近分数(或收敛子,Convergents)。第 \(k\) 个渐近分数 \(c_k\) 是由连分数的前 \(k+1\) 项 \([a_0; a_1, \dots, a_k]\) 截断得到的有理数。
    \[ c_k = [a_0; a_1, \dots, a_k] = a_0 + \frac{1}{a_1 + \frac{1}{\ddots + \frac{1}{a_k}}} \]
    其中 \(0 \le k \le n\)。

    为了方便计算渐近分数,我们定义分子 \(p_k\) 和分母 \(q_k\),使得 \(c_k = \frac{p_k}{q_k}\)。它们可以通过以下递推关系(Recurrence Relations)计算:
    \[ p_k = a_k p_{k-1} + p_{k-2} \quad \text{for } k \ge 2 \]
    \[ q_k = a_k q_{k-1} + q_{k-2} \quad \text{for } k \ge 2 \]
    初始值(Base Cases)定义为:
    \[ p_0 = a_0, \quad q_0 = 1 \]
    \[ p_1 = a_1 a_0 + 1, \quad q_1 = a_1 \]
    为了使递推公式对 \(k=2\) 生效,我们引入 \(p_{-2}=0, q_{-2}=1\) 和 \(p_{-1}=1, q_{-1}=0\)。
    检查 \(k=0\): \(p_0 = a_0 p_{-1} + p_{-2} = a_0 \cdot 1 + 0 = a_0\), \(q_0 = a_0 q_{-1} + q_{-2} = a_0 \cdot 0 + 1 = 1\). \(c_0 = \frac{a_0}{1} = [a_0]\).
    检查 \(k=1\): \(p_1 = a_1 p_0 + p_{-1} = a_1 a_0 + 1\), \(q_1 = a_1 q_0 + q_{-1} = a_1 \cdot 1 + 0 = a_1\). \(c_1 = \frac{a_1 a_0 + 1}{a_1} = a_0 + \frac{1}{a_1} = [a_0; a_1]\).
    递推公式是正确的。

    例子: 计算 \(\frac{47}{17} = [2; 1, 3, 4]\) 的渐近分数。
    \(a_0=2, a_1=1, a_2=3, a_3=4\).
    \(p_{-2}=0, q_{-2}=1\)
    \(p_{-1}=1, q_{-1}=0\)

    \(k=0\): \(a_0=2\). \(p_0 = a_0 = 2\), \(q_0 = 1\). \(c_0 = \frac{2}{1} = 2\).
    \(k=1\): \(a_1=1\). \(p_1 = a_1 p_0 + p_{-1} = 1 \cdot 2 + 1 = 3\), \(q_1 = a_1 q_0 + q_{-1} = 1 \cdot 1 + 0 = 1\). \(c_1 = \frac{3}{1} = 3\).
    \(k=2\): \(a_2=3\). \(p_2 = a_2 p_1 + p_0 = 3 \cdot 3 + 2 = 11\), \(q_2 = a_2 q_1 + q_0 = 3 \cdot 1 + 1 = 4\). \(c_2 = \frac{11}{4}\).
    \(k=3\): \(a_3=4\). \(p_3 = a_3 p_2 + p_1 = 4 \cdot 11 + 3 = 47\), \(q_3 = a_3 q_2 + q_1 = 4 \cdot 4 + 1 = 17\). \(c_3 = \frac{47}{17}\).

    渐近分数是 \(2, 3, \frac{11}{4}, \frac{47}{17}\)。注意最后一个渐近分数就是原始的有理数。

    10.1.4 渐近分数的重要性质 (Important Properties of Convergents)

    渐近分数具有一些重要的性质:
    ① \(p_k q_{k-1} - p_{k-1} q_k = (-1)^{k-1}\) for \(k \ge 1\).
    这个性质可以通过递推证明。它表明相邻的渐近分数之差为 \(\frac{p_k}{q_k} - \frac{p_{k-1}}{q_{k-1}} = \frac{p_k q_{k-1} - p_{k-1} q_k}{q_k q_{k-1}} = \frac{(-1)^{k-1}}{q_k q_{k-1}}\)。
    这意味着相邻渐近分数之间是互质的(Coprime),即 \(\gcd(p_k, q_k) = 1\)。
    ② 渐近分数交替地逼近原始值,即 \(c_0 < c_2 < c_4 < \dots < x < \dots < c_5 < c_3 < c_1\)。
    偶数下标的渐近分数形成一个递增序列,奇数下标的渐近分数形成一个递减序列,并且所有偶数下标的渐近分数都小于所有奇数下标的渐近分数。
    ③ 渐近分数越来越接近原始值,即 \(|x - c_k| < |x - c_{k-1}|\)。

    这些性质对于理解连分数如何逼近实数至关重要。

    10.2 无限连分数 (Infinite Continued Fractions)

    有限连分数表示有理数。那么无理数(Irrational Numbers)呢?它们可以表示为无限连分数。

    10.2.1 定义与存在性 (Definition and Existence)

    一个无限连分数是一个形如以下的表达式:
    \[ a_0 + \frac{1}{a_1 + \frac{1}{a_2 + \frac{1}{\ddots}}} \]
    其中 \(a_0\) 是一个整数,\(a_1, a_2, \dots\) 是正整数。我们用符号 \([a_0; a_1, a_2, \dots]\) 表示。

    对于任何无理数 \(x\),我们可以使用与有理数类似的算法来找到其无限连分数展开:
    ① 令 \(x_0 = x\)。
    ② 设 \(a_0 = \lfloor x_0 \rfloor\)。
    ③ 令 \(x_1 = \frac{1}{x_0 - a_0}\)。由于 \(x\) 是无理数,\(x_0 - a_0\) 是非零无理数,所以 \(x_1\) 也是无理数。
    ④ 设 \(a_1 = \lfloor x_1 \rfloor\)。由于 \(x_0 - a_0 \in (0, 1)\),所以 \(x_1 > 1\),因此 \(a_1 \ge 1\)。
    ⑤ 重复此过程:\(a_k = \lfloor x_k \rfloor\),\(x_{k+1} = \frac{1}{x_k - a_k}\)。
    这个过程会无限地进行下去,因为如果它在有限步终止,那么 \(x\) 将是一个有理数,与假设矛盾。

    这个过程产生的无限序列 \([a_0; a_1, a_2, \dots]\) 就是无理数 \(x\) 的连分数展开。这个展开是唯一的。

    无限连分数的值被定义为其渐近分数序列的极限:
    \[ [a_0; a_1, a_2, \dots] = \lim_{n \to \infty} [a_0; a_1, \dots, a_n] \]
    可以证明,对于任何无限连分数,其渐近分数序列 \(\{c_n\}\) 是收敛的。

    例子: 展开 \(\sqrt{2}\) 为连分数。
    \[ x_0 = \sqrt{2} \approx 1.414 \]
    \(a_0 = \lfloor \sqrt{2} \rfloor = 1\).
    \[ x_1 = \frac{1}{\sqrt{2} - 1} = \frac{\sqrt{2} + 1}{(\sqrt{2} - 1)(\sqrt{2} + 1)} = \frac{\sqrt{2} + 1}{2 - 1} = \sqrt{2} + 1 \approx 2.414 \]
    \(a_1 = \lfloor \sqrt{2} + 1 \rfloor = 2\).
    \[ x_2 = \frac{1}{(\sqrt{2} + 1) - 2} = \frac{1}{\sqrt{2} - 1} = \sqrt{2} + 1 \approx 2.414 \]
    \(a_2 = \lfloor \sqrt{2} + 1 \rfloor = 2\).
    我们发现 \(x_2 = x_1\),所以序列会重复。
    \(a_3 = \lfloor x_3 \rfloor = \lfloor \sqrt{2} + 1 \rfloor = 2\), 以此类推。
    所以 \(\sqrt{2} = [1; 2, 2, 2, \dots]\),记作 \([1; \overline{2}]\)。

    10.2.2 周期连分数 (Periodic Continued Fractions)

    观察 \(\sqrt{2}\) 的连分数展开,我们发现它的系数序列最终是周期性的。具有最终周期性(Eventually Periodic)的无限连分数恰好对应于二次无理数(Quadratic Irrationals)。二次无理数是形如 \(a + b\sqrt{d}\) 的无理数,其中 \(a, b\) 是有理数,\(d\) 是非平方正整数。更精确地说,它们是二次方程 \(Ax^2 + Bx + C = 0\) 的无理数根,其中 \(A, B, C\) 是整数。

    定理 (Lagrange's Theorem): 一个无理数的连分数展开是最终周期性的,当且仅当它是一个二次无理数。

    例子: 黄金比例 \(\phi = \frac{1+\sqrt{5}}{2}\) 是二次无理数。
    \[ x_0 = \frac{1+\sqrt{5}}{2} \approx 1.618 \]
    \(a_0 = \lfloor \frac{1+\sqrt{5}}{2} \rfloor = 1\).
    \[ x_1 = \frac{1}{\frac{1+\sqrt{5}}{2} - 1} = \frac{1}{\frac{\sqrt{5}-1}{2}} = \frac{2}{\sqrt{5}-1} = \frac{2(\sqrt{5}+1)}{(\sqrt{5}-1)(\sqrt{5}+1)} = \frac{2(\sqrt{5}+1)}{5-1} = \frac{\sqrt{5}+1}{2} \]
    我们发现 \(x_1 = x_0\),所以序列会重复。
    \(a_1 = \lfloor x_1 \rfloor = \lfloor \frac{\sqrt{5}+1}{2} \rfloor = 1\).
    \(x_2 = \frac{1}{x_1 - a_1} = \frac{1}{\frac{\sqrt{5}+1}{2} - 1} = \frac{\sqrt{5}+1}{2}\).
    所以 \(\phi = [1; 1, 1, 1, \dots]\),记作 \([1; \overline{1}]\)。

    周期连分数在求解佩尔方程中扮演着核心角色。

    10.3 连分数与最佳逼近 (Continued Fractions and Best Approximations)

    连分数的一个重要应用是提供实数的“最佳”有理逼近。

    10.3.1 最佳逼近的定义 (Definition of Best Approximation)

    对于一个实数 \(x\),一个有理数 \(\frac{p}{q}\) (\(q > 0\)) 被称为 \(x\) 的一个最佳逼近,如果对于任何分母小于或等于 \(q\) 的有理数 \(\frac{p'}{q'}\) (\(q' \le q\)),且 \(\frac{p'}{q'} \ne \frac{p}{q}\),都有 \(|qx - p| < |q'x - p'|\)。
    另一种更常用的定义是:如果对于任何分母小于 \(q\) 的有理数 \(\frac{p'}{q'}\) (\(q' < q\)),都有 \(|x - \frac{p}{q}| < |x - \frac{p'}{q'}|\)。这被称为第一类最佳逼近
    如果对于任何分母小于或等于 \(q\) 的有理数 \(\frac{p'}{q'}\) (\(q' \le q\)),且 \(\frac{p'}{q'} \ne \frac{p}{q}\),都有 \(|x - \frac{p}{q}| < |x - \frac{p'}{q'}|\),这被称为第二类最佳逼近

    10.3.2 渐近分数是最佳逼近 (Convergents are Best Approximations)

    连分数理论中一个重要的定理是:一个实数 \(x\) 的渐近分数 \(\frac{p_k}{q_k}\) 是 \(x\) 的最佳逼近。更精确地说,它们是第二类最佳逼近(除了 \(c_0\) 可能不是)。

    定理: 设 \(x\) 是一个实数,\(\frac{p_k}{q_k}\) 是其连分数展开的第 \(k\) 个渐近分数。如果 \(\frac{p}{q}\) 是一个有理数,满足 \(1 \le q \le q_k\),且 \(\frac{p}{q} \ne \frac{p_k}{q_k}\),则 \(|qx - p| \ge |q_k x - p_k|\)。
    如果 \(1 \le q < q_k\),则 \(|qx - p| > |q_k x - p_k|\)。

    这个定理的意义在于,在所有分母不超过 \(q_k\) 的有理数中,渐近分数 \(\frac{p_k}{q_k}\) 是最接近 \(x\) 的(以 \(|qx - p|\) 或 \(|x - p/q|\) 的意义下)。这解释了为什么连分数在构造有理逼近时如此有效。

    10.3.3 逼近的质量 (Quality of Approximation)

    渐近分数不仅是最佳逼近,它们逼近实数的速度也非常快。
    我们知道 \(|x - \frac{p_k}{q_k}| = |\frac{p_k q_{k+1} + p_{k-1} - p_k (a_{k+1} q_k + q_{k-1})}{q_k (a_{k+1} q_k + q_{k-1})}| = |\frac{p_k q_{k-1} - p_{k-1} q_k}{q_k q_{k+1}}| = \frac{|(-1)^{k-1}|}{q_k q_{k+1}} = \frac{1}{q_k q_{k+1}}\).
    由于 \(q_{k+1} = a_{k+1} q_k + q_{k-1}\) 且 \(a_{k+1} \ge 1\),我们有 \(q_{k+1} \ge q_k + q_{k-1}\). 特别是 \(q_{k+1} > q_k\).
    所以 \(|x - \frac{p_k}{q_k}| = \frac{1}{q_k q_{k+1}} < \frac{1}{q_k^2}\).

    定理: 对于任何实数 \(x\) 和其第 \(k\) 个渐近分数 \(\frac{p_k}{q_k}\) (\(k \ge 1\)),有 \(|x - \frac{p_k}{q_k}| < \frac{1}{q_k^2}\)。
    此外,对于任何有理数 \(\frac{p}{q}\) (\(q > 0\)),如果 \(|x - \frac{p}{q}| < \frac{1}{2q^2}\),则 \(\frac{p}{q}\) 必须是 \(x\) 的一个渐近分数。

    这个结果表明,渐近分数以至少 \(1/q_k^2\) 的速度逼近 \(x\),这是相当快的。而且,任何逼近精度达到 \(1/(2q^2)\) 的有理数都必然是渐近分数,这再次强调了渐近分数作为最佳逼近的特殊地位。

    10.4 连分数与佩尔方程的解 (Continued Fractions and Solutions to Pell's Equation)

    连分数理论在求解佩尔方程 \(x^2 - Dy^2 = 1\) 中发挥着核心作用,其中 \(D\) 是一个非平方正整数。我们只考虑整数解 \((x, y)\)。

    10.4.1 佩尔方程与 \(\sqrt{D}\) 的连分数 (Pell's Equation and the Continued Fraction of \(\sqrt{D}\))

    考虑佩尔方程 \(x^2 - Dy^2 = 1\). 如果 \(y \ne 0\),我们可以将其改写为 \(\frac{x^2}{y^2} - D = \frac{1}{y^2}\),即 \((\frac{x}{y})^2 - D = \frac{1}{y^2}\).
    这表明 \(\frac{x}{y}\) 是一个有理数,且 \(\frac{x}{y}\) 的平方非常接近 \(D\). 这意味着 \(\frac{x}{y}\) 应该非常接近 \(\sqrt{D}\).
    \[ |\frac{x}{y} - \sqrt{D}| |\frac{x}{y} + \sqrt{D}| = |\frac{x^2}{y^2} - D| = \frac{1}{y^2} \]
    如果 \(\frac{x}{y}\) 是 \(\sqrt{D}\) 的一个好的逼近,那么 \(\frac{x}{y} + \sqrt{D} \approx 2\sqrt{D}\).
    所以 \(|\frac{x}{y} - \sqrt{D}| \approx \frac{1}{2\sqrt{D} y^2}\).
    这表明佩尔方程的解 \(\frac{x}{y}\) 提供了 \(\sqrt{D}\) 的非常好的有理逼近,其精度大约是 \(1/(2\sqrt{D} y^2)\)。根据上一节关于最佳逼近的定理,如果 \(y\) 足够大,这样的有理数 \(\frac{x}{y}\) 必须是 \(\sqrt{D}\) 的一个渐近分数。

    事实证明,佩尔方程 \(x^2 - Dy^2 = 1\) 的所有正整数解 \((x, y)\) 都来自于 \(\sqrt{D}\) 的连分数展开的渐近分数。

    10.4.2 基本解 (Fundamental Solution)

    \(\sqrt{D}\) 是一个二次无理数,所以它的连分数展开是周期性的:
    \[ \sqrt{D} = [a_0; a_1, a_2, \dots, a_{m-1}, \overline{a_m, a_{m+1}, \dots, a_{m+l-1}}] \]
    其中 \(l\) 是周期的长度。对于 \(\sqrt{D}\) (\(D\) 非平方正整数),其连分数展开具有特殊形式:
    \[ \sqrt{D} = [a_0; \overline{a_1, a_2, \dots, a_l}] \]
    其中 \(a_0 = \lfloor \sqrt{D} \rfloor\),且 \(a_l = 2a_0\),并且序列 \(a_1, a_2, \dots, a_{l-1}\) 是对称的,即 \(a_i = a_{l-i}\) for \(1 \le i \le l-1\).

    佩尔方程 \(x^2 - Dy^2 = 1\) 的最小正整数解 \((x_1, y_1)\) 称为基本解(Fundamental Solution)。它与 \(\sqrt{D}\) 的连分数展开的周期 \(l\) 密切相关。

    定理: 设 \(\sqrt{D} = [a_0; \overline{a_1, a_2, \dots, a_l}]\) 是 \(\sqrt{D}\) 的连分数展开,周期为 \(l\)。设 \(\frac{p_{l-1}}{q_{l-1}}\) 是其第 \(l-1\) 个渐近分数。则 \((x_1, y_1) = (p_{l-1}, q_{l-1})\) 是佩尔方程 \(x^2 - Dy^2 = (-1)^l\) 的最小正整数解。
    如果 \(l\) 是偶数,则 \((p_{l-1}, q_{l-1})\) 是 \(x^2 - Dy^2 = 1\) 的基本解。
    如果 \(l\) 是奇数,则 \((p_{l-1}, q_{l-1})\) 是 \(x^2 - Dy^2 = -1\) 的基本解,而 \(x^2 - Dy^2 = 1\) 的基本解是 \((p_{2l-1}, q_{2l-1})\),即 \(\sqrt{D}\) 的第 \(2l-1\) 个渐近分数。

    由于我们只关心 \(x^2 - Dy^2 = 1\) 的解,如果 \(l\) 是奇数,我们需要计算到第 \(2l-1\) 个渐近分数。幸运的是,\(p_{2l-1}\) 和 \(q_{2l-1}\) 可以通过 \((p_{l-1}, q_{l-1})\) 构造出来:\((p_{l-1} + q_{l-1}\sqrt{D})^2 = (p_{l-1}^2 + Dq_{l-1}^2) + 2p_{l-1}q_{l-1}\sqrt{D}\). 设 \(p_{l-1}^2 - Dq_{l-1}^2 = -1\). 那么 \((p_{l-1} + q_{l-1}\sqrt{D})^2 = (-1 + 2Dq_{l-1}^2) + 2p_{l-1}q_{l-1}\sqrt{D}\). 实际上,更简单的方式是利用 \((p_{l-1} + q_{l-1}\sqrt{D})^2 = p_{2l-1} + q_{2l-1}\sqrt{D}\).

    10.4.3 所有解的生成 (Generating All Solutions)

    一旦找到佩尔方程 \(x^2 - Dy^2 = 1\) 的基本解 \((x_1, y_1)\),所有正整数解 \((x_n, y_n)\) 都可以通过以下公式生成:
    \[ x_n + y_n \sqrt{D} = (x_1 + y_1 \sqrt{D})^n \quad \text{for } n = 1, 2, 3, \dots \]
    展开 \((x_1 + y_1 \sqrt{D})^n\) 并分离有理部分和无理部分,就可以得到 \(x_n\) 和 \(y_n\) 的值。

    例子: 求解佩尔方程 \(x^2 - 2y^2 = 1\).
    我们已经知道 \(\sqrt{2} = [1; \overline{2}]\). 周期 \(l=1\).
    第 \(l-1 = 0\) 个渐近分数是 \(c_0 = \frac{p_0}{q_0} = \frac{1}{1}\).
    \(p_0=1, q_0=1\). 检查 \(p_0^2 - 2q_0^2 = 1^2 - 2(1^2) = 1 - 2 = -1\).
    由于周期 \(l=1\) 是奇数,\((p_0, q_0) = (1, 1)\) 是 \(x^2 - 2y^2 = -1\) 的基本解。
    佩尔方程 \(x^2 - 2y^2 = 1\) 的基本解是 \((p_{2l-1}, q_{2l-1}) = (p_{1}, q_{1})\).
    \(\sqrt{2} = [1; 2, 2, \dots]\).
    \(a_0=1, a_1=2\).
    \(p_0=1, q_0=1\).
    \(p_1 = a_1 p_0 + p_{-1} = 2 \cdot 1 + 1 = 3\).
    \(q_1 = a_1 q_0 + q_{-1} = 2 \cdot 1 + 0 = 2\).
    第 1 个渐近分数是 \(\frac{p_1}{q_1} = \frac{3}{2}\).
    检查 \((x_1, y_1) = (3, 2)\): \(3^2 - 2(2^2) = 9 - 2(4) = 9 - 8 = 1\).
    所以 \((3, 2)\) 是 \(x^2 - 2y^2 = 1\) 的基本解。

    所有正整数解 \((x_n, y_n)\) 由 \((3 + 2\sqrt{2})^n = x_n + y_n \sqrt{2}\) 给出。
    \(n=1\): \((x_1, y_1) = (3, 2)\).
    \(n=2\): \((3 + 2\sqrt{2})^2 = 3^2 + 2(3)(2\sqrt{2}) + (2\sqrt{2})^2 = 9 + 12\sqrt{2} + 8 = 17 + 12\sqrt{2}\). \((x_2, y_2) = (17, 12)\). 检查 \(17^2 - 2(12^2) = 289 - 2(144) = 289 - 288 = 1\).
    \(n=3\): \((3 + 2\sqrt{2})^3 = (3 + 2\sqrt{2})(17 + 12\sqrt{2}) = 3 \cdot 17 + 3 \cdot 12\sqrt{2} + 2\sqrt{2} \cdot 17 + 2\sqrt{2} \cdot 12\sqrt{2} = 51 + 36\sqrt{2} + 34\sqrt{2} + 48 = 99 + 70\sqrt{2}\). \((x_3, y_3) = (99, 70)\). 检查 \(99^2 - 2(70^2) = 9801 - 2(4900) = 9801 - 9800 = 1\).

    连分数提供了一种系统地找到佩尔方程基本解的方法,进而可以生成所有解。这是连分数在数论中一个非常重要的应用。

    本章我们深入探讨了连分数,从有限连分数表示有理数,到无限连分数表示无理数,特别是周期连分数与二次无理数的关系。我们还看到了连分数如何提供实数的最佳有理逼近,并最终展示了它们在求解佩尔方程中的强大威力。连分数是一个美丽且实用的工具,在数论、丢番图逼近、密码学等领域都有广泛应用。

    11. chapter 代数数论初步 (Introduction to Algebraic Number Theory) (进阶主题 - Advanced Topic)

    欢迎来到本书的进阶部分!在前面的章节中,我们深入探讨了基于整数环 \(\mathbb{Z}\) 的经典数论。然而,数学的边界远不止于此。代数数论 (Algebraic Number Theory) 是数论的一个重要分支,它将抽象代数 (Abstract Algebra) 的工具引入数论的研究,特别是研究代数数域 (Algebraic Number Fields) 及其整数环 (Rings of Integers)。这一领域不仅为解决经典的数论问题提供了强大的新方法,也开辟了全新的研究方向。

    本章将作为代数数论的初步介绍,旨在为读者打开这扇新的大门。我们将从代数整数 (Algebraic Integers) 的概念入手,然后初步认识代数数域,最后通过一个经典的例子来阐述引入理想 (Ideals) 的动机。请注意,代数数论是一个庞大而深刻的领域,本章仅触及其最基础的概念,希望能激发您进一步学习的兴趣。

    11.1 代数整数 (Algebraic Integers) 的概念

    在经典的数论中,我们研究的对象主要是整数 \(\mathbb{Z}\)。在代数数论中,我们将研究范围扩展到更广泛的数集,特别是代数数 (Algebraic Numbers)。

    首先,什么是代数数?一个复数 (Complex Number) \(\alpha\) 如果是某个以有理数 (Rational Number) 为系数的非零多项式 (Polynomial) 的根 (Root),那么 \(\alpha\) 就被称为一个代数数。形式上,\(\alpha\) 是代数数当且仅当存在非零多项式 \(P(x) = a_n x^n + a_{n-1} x^{n-1} + \dots + a_1 x + a_0\),其中 \(a_i \in \mathbb{Q}\) 且不全为零,使得 \(P(\alpha) = 0\)。

    例如:
    ⚝ 任何有理数 \(q \in \mathbb{Q}\) 都是代数数,因为它是多项式 \(x - q = 0\) 的根。
    ⚝ \(\sqrt{2}\) 是代数数,因为它是多项式 \(x^2 - 2 = 0\) 的根。
    ⚝ \(i\) (虚数单位) 是代数数,因为它是多项式 \(x^2 + 1 = 0\) 的根。
    ⚝ \(\sqrt[3]{5} + \sqrt{2}\) 也是代数数,尽管找到它的多项式可能需要一些计算。

    与代数数相对应的是超越数 (Transcendental Numbers),它们不是任何以有理数为系数的非零多项式的根,例如 \(\pi\) 和 \(e\)。

    现在,我们来定义代数整数。代数整数是特殊的代数数。一个代数数 \(\alpha\) 如果是某个以整数 (Integer) 为系数的首一多项式 (Monic Polynomial) 的根,那么 \(\alpha\) 就被称为一个代数整数。首一多项式是指最高次项系数为 1 的多项式。形式上,\(\alpha\) 是代数整数当且仅当存在多项式 \(P(x) = x^n + a_{n-1} x^{n-1} + \dots + a_1 x + a_0\),其中 \(a_i \in \mathbb{Z}\),使得 \(P(\alpha) = 0\)。

    注意定义中的两个关键点:
    ① 多项式的系数必须是整数 (\(a_i \in \mathbb{Z}\))。
    ② 多项式必须是首一的 (最高次项系数为 1)。

    例如:
    ⚝ 任何整数 \(m \in \mathbb{Z}\) 都是代数整数,因为它是首一多项式 \(x - m = 0\) 的根。
    ⚝ \(\sqrt{2}\) 是代数整数,因为它是首一多项式 \(x^2 - 2 = 0\) 的根。
    ⚝ \(i\) 是代数整数,因为它是首一多项式 \(x^2 + 1 = 0\) 的根。
    ⚝ \(\frac{1}{2}\) 是代数数 (它是 \(2x - 1 = 0\) 的根),但它不是代数整数。虽然它是 \(x - \frac{1}{2} = 0\) 的根,但这个多项式的系数不是整数。如果它是某个首一、整数系数多项式的根 \(x^n + a_{n-1} x^{n-1} + \dots + a_0 = 0\),其中 \(a_i \in \mathbb{Z}\),那么代入 \(x = 1/2\) 得到 \((1/2)^n + a_{n-1}(1/2)^{n-1} + \dots + a_0 = 0\)。乘以 \(2^n\),得到 \(1 + a_{n-1} 2 + \dots + a_0 2^n = 0\)。等式左边除了第一项 1 以外,其余各项都是偶数,因此左边是奇数。奇数不可能等于 0。这说明 \(1/2\) 不可能是首一、整数系数多项式的根,因此它不是代数整数。

    一个重要的结论是:一个有理数 \(q \in \mathbb{Q}\) 是代数整数当且仅当 \(q\) 是一个整数 \(m \in \mathbb{Z}\)。这解释了为什么我们将这类数称为“代数整数”——它们是整数概念在代数数范围内的自然推广。

    所有代数整数的集合构成一个环 (Ring),记作 \(\mathbb{A}\)。这意味着如果 \(\alpha\) 和 \(\beta\) 是代数整数,那么 \(\alpha + \beta\) 和 \(\alpha \cdot \beta\) 也是代数整数。证明这一点需要一些非平凡的代数工具,超出了本章的范围,但理解这个性质对于后续内容很重要。

    11.2 代数数域 (Algebraic Number Fields) 的初步认识

    代数数域是代数数论研究的核心对象。一个代数数域 \(K\) 是有理数域 \(\mathbb{Q}\) 的一个有限维向量空间 (Finite-dimensional Vector Space) 扩张 (Extension)。换句话说,\(K\) 是一个包含 \(\mathbb{Q}\) 的域 (Field),并且 \(K\) 作为 \(\mathbb{Q}\) 上的向量空间具有有限的维数 (Dimension)。这个维数被称为域扩张的次数 (Degree of the Field Extension),记作 \([K : \mathbb{Q}]\)。

    最简单的代数数域是 \(\mathbb{Q}\) 本身,它的次数是 \([\mathbb{Q} : \mathbb{Q}] = 1\)。

    更一般的例子是通过将一个代数数 \(\alpha\) 添加到 \(\mathbb{Q}\) 中生成的域,记作 \(\mathbb{Q}(\alpha)\)。如果 \(\alpha\) 是一个代数数,那么 \(\mathbb{Q}(\alpha)\) 是包含 \(\mathbb{Q}\) 和 \(\alpha\) 的最小的域。如果 \(\alpha\) 的最小多项式 (Minimal Polynomial) (即以 \(\mathbb{Q}\) 为系数的、首一的、次数最小的、以 \(\alpha\) 为根的多项式) 的次数是 \(n\),那么 \(\mathbb{Q}(\alpha)\) 就是 \(\mathbb{Q}\) 的一个 \(n\) 次扩张,即 \([\mathbb{Q}(\alpha) : \mathbb{Q}] = n\)。此时,\(\mathbb{Q}(\alpha)\) 中的任意元素都可以唯一地表示为 \(c_0 + c_1 \alpha + \dots + c_{n-1} \alpha^{n-1}\) 的形式,其中 \(c_i \in \mathbb{Q}\)。

    例如:
    ⚝ 二次域 (Quadratic Field) \(\mathbb{Q}(\sqrt{d})\),其中 \(d\) 是一个无平方因子 (Square-free) 的整数。例如 \(\mathbb{Q}(\sqrt{2})\) 或 \(\mathbb{Q}(\sqrt{-5})\)。
    ▮▮▮▮⚝ \(\sqrt{2}\) 的最小多项式是 \(x^2 - 2\),次数为 2。所以 \(\mathbb{Q}(\sqrt{2})\) 是 \(\mathbb{Q}\) 的一个 2 次扩张。\(\mathbb{Q}(\sqrt{2})\) 中的元素形如 \(a + b\sqrt{2}\),其中 \(a, b \in \mathbb{Q}\)。
    ▮▮▮▮⚝ \(\sqrt{-5}\) 的最小多项式是 \(x^2 + 5\),次数为 2。所以 \(\mathbb{Q}(\sqrt{-5})\) 是 \(\mathbb{Q}\) 的一个 2 次扩张。\(\mathbb{Q}(\sqrt{-5})\) 中的元素形如 \(a + b\sqrt{-5}\),其中 \(a, b \in \mathbb{Q}\)。
    ⚝ 圆域 (Cyclotomic Field) \(\mathbb{Q}(\zeta_n)\),其中 \(\zeta_n = e^{2\pi i / n}\) 是本原 \(n\) 次单位根 (Primitive \(n\)-th Root of Unity)。\(\mathbb{Q}(\zeta_n)\) 的次数是 \(\phi(n)\),其中 \(\phi\) 是欧拉函数 (Euler's Totient Function)。

    在代数数域 \(K\) 中,我们特别关注其中的代数整数。代数数域 \(K\) 中的所有代数整数构成了 \(K\) 的一个子环 (Subring),被称为 \(K\) 的整数环 (Ring of Integers),记作 \(\mathcal{O}_K\)。

    例如:
    ⚝ 在 \(\mathbb{Q}\) 中,代数整数就是整数 \(\mathbb{Z}\)。所以 \(\mathcal{O}_\mathbb{Q} = \mathbb{Z}\)。
    ⚝ 在二次域 \(\mathbb{Q}(\sqrt{d})\) ( \(d\) 无平方因子) 中,其整数环 \(\mathcal{O}_{\mathbb{Q}(\sqrt{d})}\) 的结构取决于 \(d\) 模 4 的余数:
    ① 如果 \(d \equiv 2 \pmod{4}\) 或 \(d \equiv 3 \pmod{4}\),则 \(\mathcal{O}_{\mathbb{Q}(\sqrt{d})} = \{a + b\sqrt{d} \mid a, b \in \mathbb{Z}\}\)。
    ② 如果 \(d \equiv 1 \pmod{4}\),则 \(\mathcal{O}_{\mathbb{Q}(\sqrt{d})} = \{a + b\frac{1+\sqrt{d}}{2} \mid a, b \in \mathbb{Z}\}\)。
    例如,在 \(\mathbb{Q}(\sqrt{-5})\) 中,\(d = -5 \equiv 3 \pmod{4}\),所以其整数环是 \(\mathbb{Z}[\sqrt{-5}] = \{a + b\sqrt{-5} \mid a, b \in \mathbb{Z}\}\)。
    在 \(\mathbb{Q}(\sqrt{2})\) 中,\(d = 2 \equiv 2 \pmod{4}\),所以其整数环是 \(\mathbb{Z}[\sqrt{2}] = \{a + b\sqrt{2} \mid a, b \in \mathbb{Z}\}\)。
    在 \(\mathbb{Q}(\sqrt{5})\) 中,\(d = 5 \equiv 1 \pmod{4}\),所以其整数环是 \(\mathbb{Z}[\frac{1+\sqrt{5}}{2}] = \{a + b\frac{1+\sqrt{5}}{2} \mid a, b \in \mathbb{Z}\}\)。这里的 \(\frac{1+\sqrt{5}}{2}\) 是黄金分割比 (Golden Ratio),它是首一多项式 \(x^2 - x - 1 = 0\) 的根,因此是代数整数。

    代数数域的整数环 \(\mathcal{O}_K\) 是 \(\mathbb{Z}\) 在 \(K\) 中的推广。经典数论研究的是 \(\mathbb{Z}\) 的性质,而代数数论则研究更一般的整数环 \(\mathcal{O}_K\) 的性质。我们自然会问:在这些整数环中,经典的数论定理是否依然成立?特别是,算术基本定理 (Fundamental Theorem of Arithmetic)——唯一分解定理 (Unique Factorization Theorem)——是否在所有 \(\mathcal{O}_K\) 中都成立?

    11.3 理想 (Ideals) 的概念 (Motivation)

    算术基本定理指出,任何大于 1 的整数都可以唯一地分解成素数 (Prime Number) 的乘积(不考虑顺序)。这个性质在 \(\mathbb{Z}\) 中是如此基本和重要。然而,在某些代数数域的整数环中,唯一分解性质并不成立。这是代数数论发展初期遇到的一个重大挑战,也是引入理想概念的主要动机。

    考虑二次域 \(\mathbb{Q}(\sqrt{-5})\) 的整数环 \(\mathcal{O}_{\mathbb{Q}(\sqrt{-5})} = \mathbb{Z}[\sqrt{-5}] = \{a + b\sqrt{-5} \mid a, b \in \mathbb{Z}\}\)。在这个环中,我们来看数字 6 的分解:
    \[ 6 = 2 \cdot 3 \]
    \[ 6 = (1 + \sqrt{-5})(1 - \sqrt{-5}) \]
    我们来检查一下这些因子是否是“不可约”的 (Irreducible) 和“素”的 (Prime)。在一个环中,一个非零非单位元 \(r\) 是不可约的,如果它不能写成两个非单位元 (Non-unit) 的乘积。一个非零非单位元 \(p\) 是素的,如果 \(p \mid ab\) 蕴含 \(p \mid a\) 或 \(p \mid b\)。在主理想整环 (Principal Ideal Domain, PID) 中,不可约元和素元是等价的,并且唯一分解定理成立。但 \(\mathbb{Z}[\sqrt{-5}]\) 不是 PID。

    为了检查 \(2, 3, 1+\sqrt{-5}, 1-\sqrt{-5}\) 是否不可约,我们可以引入范数 (Norm) 的概念。对于 \(\alpha = a + b\sqrt{-5} \in \mathbb{Z}[\sqrt{-5}]\),其范数定义为 \(N(\alpha) = \alpha \bar{\alpha} = (a + b\sqrt{-5})(a - b\sqrt{-5}) = a^2 + 5b^2\)。范数有乘积性质:\(N(\alpha \beta) = N(\alpha) N(\beta)\)。一个元素 \(\alpha\) 是 \(\mathbb{Z}[\sqrt{-5}]\) 中的单位元当且仅当 \(N(\alpha) = 1\)。在 \(\mathbb{Z}[\sqrt{-5}]\) 中,\(a^2 + 5b^2 = 1\) 只有整数解 \(a = \pm 1, b = 0\)。所以单位元只有 \(1\) 和 \(-1\)。

    现在计算这些因子的范数:
    ⚝ \(N(2) = 2^2 + 5 \cdot 0^2 = 4\)
    ⚝ \(N(3) = 3^2 + 5 \cdot 0^2 = 9\)
    ⚝ \(N(1 + \sqrt{-5}) = 1^2 + 5 \cdot 1^2 = 6\)
    ⚝ \(N(1 - \sqrt{-5}) = 1^2 + 5 \cdot (-1)^2 = 6\)

    假设 \(2 = \alpha \beta\),其中 \(\alpha, \beta\) 是 \(\mathbb{Z}[\sqrt{-5}]\) 中的元素。那么 \(N(2) = N(\alpha) N(\beta)\),即 \(4 = N(\alpha) N(\beta)\)。由于 \(N(\alpha) = a^2 + 5b^2\) 是非负整数,可能的范数值是 1 或 2 或 4。如果 \(N(\alpha) = 1\),则 \(\alpha\) 是单位元。如果 \(N(\alpha) = 2\),则 \(a^2 + 5b^2 = 2\)。这在整数 \(a, b\) 中没有解 (因为如果 \(b \neq 0\),\(5b^2 \ge 5\),如果 \(b = 0\),\(a^2 = 2\) 没有整数解)。因此,任何范数为 2 的元素都不存在于 \(\mathbb{Z}[\sqrt{-5}]\) 中。这意味着如果 \(N(\alpha) N(\beta) = 4\),且 \(\alpha, \beta\) 都不是单位元 (范数不为 1),那么它们的范数只能是 2 和 2。但范数为 2 的元素不存在,所以 \(2\) 不能分解成两个非单位元的乘积,即 \(2\) 是不可约的。
    同理,对于 \(3\),\(N(3) = 9\)。如果 \(3 = \alpha \beta\),则 \(N(\alpha) N(\beta) = 9\)。可能的非单位元范数是 3 和 3。\(a^2 + 5b^2 = 3\) 在整数 \(a, b\) 中没有解。所以 \(3\) 也是不可约的。
    对于 \(1+\sqrt{-5}\),\(N(1+\sqrt{-5}) = 6\)。如果 \(1+\sqrt{-5} = \alpha \beta\),则 \(N(\alpha) N(\beta) = 6\)。可能的非单位元范数是 2 和 3。但范数为 2 或 3 的元素都不存在。所以 \(1+\sqrt{-5}\) 也是不可约的。
    同理,\(1-\sqrt{-5}\) 也是不可约的。

    所以,我们发现 \(6\) 在 \(\mathbb{Z}[\sqrt{-5}]\) 中有两种不同的不可约因子分解:\(2 \cdot 3\) 和 \((1+\sqrt{-5})(1-\sqrt{-5})\)。这表明 \(\mathbb{Z}[\sqrt{-5}]\) 不是一个唯一分解环 (Unique Factorization Domain, UFD)。

    唯一分解的失败给数论研究带来了巨大的困难。为了“恢复”唯一分解,数学家理查德·戴德金 (Richard Dedekind) 引入了“理想”的概念。理想可以被视为广义的数。在 \(\mathbb{Z}\) 中,理想与整数一一对应(每个理想都是由一个整数生成的主理想)。但在更一般的环中,并非所有理想都是主理想 (Principal Ideal)。

    戴德金证明了,在代数数域的整数环 \(\mathcal{O}_K\) 中,虽然元素不一定能唯一分解成不可约元素的乘积,但是非零理想可以唯一地分解成素理想 (Prime Ideal) 的乘积。这个定理被称为理想的唯一分解定理

    例如,在 \(\mathbb{Z}[\sqrt{-5}]\) 中,考虑由元素生成的理想:
    ⚝ \((6)\) 是由 6 生成的主理想。
    ⚝ \((2)\) 是由 2 生成的主理想。
    ⚝ \((3)\) 是由 3 生成的主理想。
    ⚝ \((1+\sqrt{-5})\) 是由 \(1+\sqrt{-5}\) 生成的主理想。
    ⚝ \((1-\sqrt{-5})\) 是由 \(1-\sqrt{-5}\) 生成的主理想。

    虽然 \((6) = (2)(3) = (1+\sqrt{-5})(1-\sqrt{-5})\) 在元素层面对应了两种分解,但在理想层面,情况有所不同。理想 \((2)\), \((3)\), \((1+\sqrt{-5})\), \((1-\sqrt{-5})\) 并不是素理想。例如,考虑理想 \(P_2 = (2, 1+\sqrt{-5})\),它是由 2 和 \(1+\sqrt{-5}\) 生成的理想 (即形如 \(2\alpha + (1+\sqrt{-5})\beta\) 的所有元素,其中 \(\alpha, \beta \in \mathbb{Z}[\sqrt{-5}]\))。可以证明 \(P_2\) 是一个素理想,并且 \(P_2^2 = (2)\)。
    考虑理想 \(P_3 = (3, 1+\sqrt{-5})\) 和 \(P_3' = (3, 1-\sqrt{-5})\)。它们也是素理想,并且 \((3) = P_3 P_3'\)。
    考虑理想 \(Q = (1+\sqrt{-5})\)。可以证明 \(Q = P_2 P_3\)。
    考虑理想 \(Q' = (1-\sqrt{-5})\)。可以证明 \(Q' = P_2 P_3'\)。

    那么理想 \((6)\) 的分解是什么呢?
    \((6) = (2)(3) = P_2^2 \cdot (P_3 P_3')\)
    \((6) = (1+\sqrt{-5})(1-\sqrt{-5}) = (P_2 P_3)(P_2 P_3') = P_2^2 P_3 P_3'\)

    可以看到,在理想层面,两种分解都导向了相同的素理想乘积 \(P_2^2 P_3 P_3'\)。理想的引入成功地恢复了唯一分解的性质,尽管分解的对象从元素变成了理想。

    理想的概念是代数数论的基石之一。通过研究理想的性质,特别是素理想的分解行为,我们可以深入了解代数数域的结构和其中的数的性质。这为解决许多经典的数论问题(如费马大定理 (Fermat's Last Theorem) 的某些情况)提供了强大的工具。

    本章仅仅是代数数论的冰山一角。要真正掌握这一领域,需要学习域扩张理论、伽罗瓦理论 (Galois Theory)、模论 (Module Theory)、理想理论的深入内容、戴德金环 (Dedekind Rings)、类群 (Class Group)、单位群 (Unit Group) 等等。但希望通过本章的介绍,您能对代数数论的研究对象、核心问题以及理想概念的动机有一个初步的认识。

    12. chapter 解析数论初步 (Introduction to Analytic Number Theory)

    解析数论 (Analytic Number Theory) 是数论的一个重要分支,它利用数学分析 (Mathematical Analysis) 的工具来研究整数的性质,特别是素数 (Prime Numbers) 的分布。与代数数论 (Algebraic Number Theory) 不同,解析数论侧重于使用函数、级数 (Series)、积分 (Integrals) 等分析方法来解决数论问题。本章将对解析数论的一些基本概念和重要结果进行初步介绍,旨在为读者打开通往这一精彩领域的大门。

    12.1 素数定理 (Prime Number Theorem) 的陈述 (Statement)

    素数是数论中最核心的研究对象之一。我们知道素数是无穷多的(在第3章中已经证明),但它们是如何分布在自然数 (Natural Numbers) 中的呢?随着数字的增大,素数出现的频率是越来越高还是越来越低?素数之间的间隔有什么规律?这些都是素数分布 (Prime Distribution) 研究的核心问题。

    为了描述素数的分布,我们引入素数计数函数 (Prime-counting Function),记为 \(\pi(x)\)。对于任意实数 \(x > 0\),\(\pi(x)\) 定义为小于或等于 \(x\) 的素数的个数。
    例如:
    \(\pi(1) = 0\)
    \(\pi(2) = 1\) (素数只有 2)
    \(\pi(3) = 2\) (素数有 2, 3)
    \(\pi(10) = 4\) (素数有 2, 3, 5, 7)
    \(\pi(100) = 25\)

    随着 \(x\) 的增大,\(\pi(x)\) 的增长趋势是什么?高斯 (Gauss) 和勒让德 (Legendre) 在18世纪末19世纪初通过观察素数表,独立地猜测 \(\pi(x)\) 大约与 \(x / \ln(x)\) 成正比,其中 \(\ln(x)\) 是 \(x\) 的自然对数 (Natural Logarithm)。

    素数定理 (Prime Number Theorem, PNT) 精确地描述了 \(\pi(x)\) 的渐近行为 (Asymptotic Behavior)。它由阿达马 (Hadamard) 和普桑 (de la Vallée Poussin) 在1896年独立证明。

    定理 12.1 (素数定理)
    \[ \pi(x) \sim \frac{x}{\ln(x)} \quad \text{当 } x \to \infty \text{ 时} \]
    这里的符号 \(f(x) \sim g(x)\) 表示当 \(x \to \infty\) 时,\(f(x)/g(x) \to 1\)。

    素数定理的另一种等价形式是:
    \[ \pi(x) \sim \text{Li}(x) \quad \text{当 } x \to \infty \text{ 时} \]
    其中 \(\text{Li}(x)\) 是对数积分函数 (Logarithmic Integral Function),定义为
    \[ \text{Li}(x) = \int_2^x \frac{dt}{\ln(t)} \]
    实际上,\(\text{Li}(x)\) 是对 \(x/\ln(x)\) 的一个更好的近似。通过分部积分 (Integration by Parts),可以证明 \(\text{Li}(x) \sim x/\ln(x)\)。

    素数定理是解析数论的基石之一,它揭示了素数在自然数序列中的宏观分布规律。它的证明需要用到复变函数 (Complex Analysis) 的强大工具,特别是黎曼ζ函数 (Riemann Zeta Function) 的性质。

    12.2 黎曼ζ函数 (Riemann Zeta Function) 的介绍

    黎曼ζ函数 (Riemann Zeta Function) 是解析数论中最著名的函数之一,它由德国数学家黎曼 (Bernhard Riemann) 在1859年的一篇划时代论文中深入研究。这个函数最初由欧拉 (Euler) 在18世纪引入,用于研究素数。

    对于复数 (Complex Number) \(s = \sigma + it\),其中 \(\sigma\) 和 \(t\) 是实数 (Real Numbers),黎曼ζ函数定义为一个无穷级数 (Infinite Series):
    \[ \zeta(s) = \sum_{n=1}^\infty \frac{1}{n^s} = \frac{1}{1^s} + \frac{1}{2^s} + \frac{1}{3^s} + \dots \]
    这个级数在复平面 (Complex Plane) 上当实部 \(\sigma = \text{Re}(s) > 1\) 时收敛 (Converges)。

    欧拉发现了ζ函数与素数之间的一个惊人联系,即著名的欧拉乘积公式 (Euler Product Formula):
    对于 \(\text{Re}(s) > 1\),有
    \[ \zeta(s) = \prod_p \frac{1}{1 - p^{-s}} \]
    其中乘积遍历所有素数 \(p\)。这个公式的重要性在于,它将一个关于所有自然数的级数与一个只涉及素数的无穷乘积联系起来,这表明ζ函数编码了关于素数分布的信息。

    欧拉乘积公式的推导基于算术基本定理 (Fundamental Theorem of Arithmetic)。考虑几何级数 (Geometric Series) 展开:
    \(\frac{1}{1 - p^{-s}} = 1 + p^{-s} + p^{-2s} + p^{-3s} + \dots\)
    将所有素数的这样的展开式相乘:
    \[ \prod_p \left(1 + p^{-s} + p^{-2s} + \dots \right) = (1 + 2^{-s} + 2^{-2s} + \dots)(1 + 3^{-s} + 3^{-2s} + \dots)(1 + 5^{-s} + 5^{-2s} + \dots) \dots \]
    根据算术基本定理,每一个大于1的整数 \(n\) 都可以唯一地表示为素数的乘积 \(n = p_1^{a_1} p_2^{a_2} \dots p_k^{a_k}\)。因此,\(n^{-s} = (p_1^{a_1} p_2^{a_2} \dots p_k^{a_k})^{-s} = (p_1^{-s})^{a_1} (p_2^{-s})^{a_2} \dots (p_k^{-s})^{a_k}\)。在上面的无穷乘积展开中,每一项 \(n^{-s}\) 恰好出现一次,所以乘积等于 \(\sum_{n=1}^\infty n^{-s}\)。

    黎曼的关键贡献在于将ζ函数从其最初的收敛区域 \(\text{Re}(s) > 1\) 解析延拓 (Analytic Continuation) 到整个复平面(除了 \(s=1\) 处有一个单极点 (Simple Pole))。这个解析延拓后的函数仍然记为 \(\zeta(s)\)。\(s=1\) 处的极点对应于调和级数 (Harmonic Series) \(\sum_{n=1}^\infty \frac{1}{n}\) 的发散 (Divergence)。

    黎曼ζ函数在 \(\text{Re}(s) \le 0\) 的区域有一些“平凡零点” (Trivial Zeros),它们位于 \(s = -2, -4, -6, \dots\) 这些负偶数点上。这些零点可以通过ζ函数的函数方程 (Functional Equation) 得到:
    \[ \zeta(s) = 2^s \pi^{s-1} \sin\left(\frac{\pi s}{2}\right) \Gamma(1-s) \zeta(1-s) \]
    其中 \(\Gamma(s)\) 是伽马函数 (Gamma Function)。

    黎曼ζ函数最引人入胜的部分在于其“非平凡零点” (Non-trivial Zeros)。这些零点位于复平面上的一个带状区域 \(0 \le \text{Re}(s) \le 1\),称为临界带 (Critical Strip)。黎曼在他的论文中提出了著名的黎曼猜想 (Riemann Hypothesis, RH):

    猜想 12.2 (黎曼猜想)
    黎曼ζ函数的所有非平凡零点都位于直线 \(\text{Re}(s) = 1/2\) 上。

    黎曼猜想是现代数学中最重要、最深刻的未解决问题之一。它与素数的分布有着极其紧密的联系。如果黎曼猜想为真,那么素数定理中的误差项 (Error Term) 将会有一个非常好的界限,这意味着素数的分布比我们目前所知的更加规律。黎曼猜想的解决将对数论乃至整个数学产生深远的影响。

    12.3 Dirichlet 级数 (Dirichlet Series)

    黎曼ζ函数是更一般的一类级数——Dirichlet 级数 (Dirichlet Series) 的一个特例。Dirichlet 级数是以德国数学家狄利克雷 (Johann Peter Gustav Lejeune Dirichlet) 命名,他在解析数论的早期发展中做出了重要贡献。

    一个一般的 Dirichlet 级数具有以下形式:
    \[ F(s) = \sum_{n=1}^\infty \frac{a_n}{n^s} \]
    其中 \((a_n)\) 是一个复数序列,\(s = \sigma + it\) 是一个复变量。

    Dirichlet 级数的收敛性 (Convergence) 是一个重要的研究课题。对于一个给定的 Dirichlet 级数 \(\sum_{n=1}^\infty \frac{a_n}{n^s}\),存在一个实数 \(\sigma_c\),称为收敛横坐标 (Abscissa of Convergence),使得:
    ① 当 \(\text{Re}(s) > \sigma_c\) 时,级数收敛。
    ② 当 \(\text{Re}(s) < \sigma_c\) 时,级数发散 (Diverges)。
    在直线 \(\text{Re}(s) = \sigma_c\) 上,级数可能收敛也可能发散。

    对于黎曼ζ函数 \(\zeta(s) = \sum_{n=1}^\infty \frac{1}{n^s}\),其中 \(a_n = 1\) 对于所有 \(n \ge 1\),其收敛横坐标是 \(\sigma_c = 1\)。

    Dirichlet 级数与算术函数 (Arithmetic Functions) 之间有着密切的联系。每一个算术函数 \(f(n)\) 都可以关联一个 Dirichlet 级数 \(\sum_{n=1}^\infty \frac{f(n)}{n^s}\)。反之,如果一个 Dirichlet 级数收敛,它的系数 \(a_n\) 就定义了一个算术函数。

    Dirichlet 级数的乘法对应于算术函数的狄利克雷卷积 (Dirichlet Convolution)。设 \(F(s) = \sum_{n=1}^\infty \frac{f(n)}{n^s}\) 和 \(G(s) = \sum_{n=1}^\infty \frac{g(n)}{n^s}\) 是两个 Dirichlet 级数,它们在某个公共区域收敛。它们的乘积是另一个 Dirichlet 级数:
    \[ F(s) G(s) = \left(\sum_{m=1}^\infty \frac{f(m)}{m^s}\right) \left(\sum_{k=1}^\infty \frac{g(k)}{k^s}\right) = \sum_{m=1}^\infty \sum_{k=1}^\infty \frac{f(m)g(k)}{(mk)^s} \]
    将和式按 \(n = mk\) 分组,得到
    \[ F(s) G(s) = \sum_{n=1}^\infty \left(\sum_{mk=n} f(m)g(k)\right) \frac{1}{n^s} \]
    内层的和 \(\sum_{mk=n} f(m)g(k)\) 定义了算术函数 \(f\) 和 \(g\) 的狄利克雷卷积 \((f * g)(n)\)。
    \[ (f * g)(n) = \sum_{d|n} f(d) g(n/d) \]
    其中求和遍历 \(n\) 的所有正因子 \(d\)。
    因此,Dirichlet 级数的乘法对应于系数函数的狄利克雷卷积:
    \[ \left(\sum_{n=1}^\infty \frac{f(n)}{n^s}\right) \left(\sum_{n=1}^\infty \frac{g(n)}{n^s}\right) = \sum_{n=1}^\infty \frac{(f * g)(n)}{n^s} \]

    这个性质非常有用。例如,考虑恒等函数 \(I(n)\),定义为 \(I(1)=1\) 且 \(I(n)=0\) 对于 \(n>1\)。其对应的 Dirichlet 级数是 \(\sum_{n=1}^\infty \frac{I(n)}{n^s} = \frac{I(1)}{1^s} + \sum_{n=2}^\infty \frac{0}{n^s} = 1\)。
    考虑常数函数 \(u(n)=1\) 对于所有 \(n \ge 1\)。其对应的 Dirichlet 级数是 \(\sum_{n=1}^\infty \frac{1}{n^s} = \zeta(s)\) (对于 \(\text{Re}(s) > 1\))。
    考虑莫比乌斯函数 (Möbius Function) \(\mu(n)\)。其对应的 Dirichlet 级数是 \(\sum_{n=1}^\infty \frac{\mu(n)}{n^s}\)。
    我们知道 \((u * \mu)(n) = \sum_{d|n} u(d) \mu(n/d) = \sum_{d|n} \mu(n/d)\)。根据莫比乌斯反演公式 (Möbius Inversion Formula) 的性质,这个和等于 \(I(n)\)。
    所以,根据 Dirichlet 级数的乘法性质:
    \[ \left(\sum_{n=1}^\infty \frac{u(n)}{n^s}\right) \left(\sum_{n=1}^\infty \frac{\mu(n)}{n^s}\right) = \sum_{n=1}^\infty \frac{(u * \mu)(n)}{n^s} = \sum_{n=1}^\infty \frac{I(n)}{n^s} \]
    \[ \zeta(s) \left(\sum_{n=1}^\infty \frac{\mu(n)}{n^s}\right) = 1 \]
    因此,对于 \(\text{Re}(s) > 1\),我们有
    \[ \sum_{n=1}^\infty \frac{\mu(n)}{n^s} = \frac{1}{\zeta(s)} \]
    这提供了一种利用ζ函数研究莫比乌斯函数的方法。

    Dirichlet 级数是连接算术函数和复分析的桥梁,它们在解析数论中扮演着核心角色,用于研究各种算术函数的性质和分布,包括素数定理的证明。