004 《遗传学:全面解析 (Genetics: A Comprehensive Analysis)》


作者Lou Xiao, gemini创建时间2025-04-21 05:08:17更新时间2025-04-21 05:08:17

🌟🌟🌟本文由Gemini 2.0 Flash Thinking Experimental 01-21生成,用来辅助学习。🌟🌟🌟

书籍大纲

▮▮ 1. 遗传学导论 (Introduction to Genetics)
▮▮▮▮ 1.1 什么是遗传学?(What is Genetics?)
▮▮▮▮▮▮ 1.1.1 遗传学的定义与范畴 (Definition and Scope of Genetics)
▮▮▮▮▮▮ 1.1.2 遗传学在生物学和医学中的地位 (The Role of Genetics in Biology and Medicine)
▮▮▮▮ 1.2 遗传学的历史发展简述 (Brief History of Genetics)
▮▮▮▮▮▮ 1.2.1 孟德尔与经典遗传学 (Mendel and Classical Genetics)
▮▮▮▮▮▮ 1.2.2 染色体学说与分子遗传学的兴起 (Chromosome Theory and the Rise of Molecular Genetics)
▮▮▮▮▮▮ 1.2.3 基因组学与后基因组时代 (Genomics and the Post-Genomic Era)
▮▮ 2. 孟德尔遗传学:基因的传递规律 (Mendelian Genetics: Principles of Gene Transmission)
▮▮▮▮ 2.1 孟德尔的分离定律 (Mendel's Law of Segregation)
▮▮▮▮▮▮ 2.1.1 等位基因、显隐性与基因型、表型 (Alleles, Dominance, Genotype and Phenotype)
▮▮▮▮▮▮ 2.1.2 分离定律的实验验证与遗传图谱 (Experimental Verification and Genetic Diagrams of Segregation Law)
▮▮▮▮ 2.2 孟德尔的自由组合定律 (Mendel's Law of Independent Assortment)
▮▮▮▮▮▮ 2.2.1 非同源染色体与基因的自由组合 (Non-homologous Chromosomes and Independent Assortment of Genes)
▮▮▮▮▮▮ 2.2.2 自由组合定律的实验验证与应用 (Experimental Verification and Application of Independent Assortment Law)
▮▮▮▮ 2.3 概率在遗传学中的应用 (Probability in Genetics)
▮▮▮▮▮▮ 2.3.1 概率的基本概念与计算规则 (Basic Concepts and Calculation Rules of Probability)
▮▮▮▮▮▮ 2.3.2 运用概率预测遗传结果 (Using Probability to Predict Genetic Outcomes)
▮▮ 3. 染色体与细胞分裂 (Chromosomes and Cell Division)
▮▮▮▮ 3.1 染色体的结构与功能 (Structure and Function of Chromosomes)
▮▮▮▮▮▮ 3.1.1 染色体的组成成分:DNA与蛋白质 (Components of Chromosomes: DNA and Proteins)
▮▮▮▮▮▮ 3.1.2 染色体的基本结构:着丝粒、端粒、臂 (Basic Structure of Chromosomes: Centromere, Telomere, Arms)
▮▮▮▮▮▮ 3.1.3 染色体的类型:常染色体与性染色体 (Types of Chromosomes: Autosomes and Sex Chromosomes)
▮▮▮▮ 3.2 细胞分裂:有丝分裂 (Mitosis)
▮▮▮▮▮▮ 3.2.1 有丝分裂的时期:前期、中期、后期、末期 (Phases of Mitosis: Prophase, Metaphase, Anaphase, Telophase)
▮▮▮▮▮▮ 3.2.2 有丝分裂的生物学意义 (Biological Significance of Mitosis)
▮▮▮▮ 3.3 细胞分裂:减数分裂 (Meiosis)
▮▮▮▮▮▮ 3.3.1 减数分裂I与减数分裂II (Meiosis I and Meiosis II)
▮▮▮▮▮▮ 3.3.2 减数分裂的遗传学意义:产生配子与遗传多样性 (Genetic Significance of Meiosis: Gamete Production and Genetic Diversity)
▮▮ 4. DNA的结构与复制 (DNA Structure and Replication)
▮▮▮▮ 4.1 DNA的分子结构:双螺旋模型 (Molecular Structure of DNA: Double Helix Model)
▮▮▮▮▮▮ 4.1.1 核苷酸的组成:碱基、脱氧核糖、磷酸 (Components of Nucleotides: Bases, Deoxyribose, Phosphate)
▮▮▮▮▮▮ 4.1.2 DNA双螺旋结构:碱基配对与磷酸二酯键 (DNA Double Helix Structure: Base Pairing and Phosphodiester Bonds)
▮▮▮▮ 4.2 DNA复制的机制 (Mechanism of DNA Replication)
▮▮▮▮▮▮ 4.2.1 半保留复制 (Semi-conservative Replication)
▮▮▮▮▮▮ 4.2.2 DNA复制的起始、延伸与终止 (Initiation, Elongation, and Termination of DNA Replication)
▮▮▮▮ 4.3 DNA复制的酶学 (Enzymology of DNA Replication)
▮▮▮▮▮▮ 4.3.1 DNA聚合酶 (DNA Polymerases)
▮▮▮▮▮▮ 4.3.2 其他复制酶类:解旋酶、引物酶、连接酶等 (Other Replication Enzymes: Helicases, Primases, Ligases, etc.)
▮▮ 5. 基因表达:转录与翻译 (Gene Expression: Transcription and Translation)
▮▮▮▮ 5.1 基因表达的中心法则 (Central Dogma of Gene Expression)
▮▮▮▮▮▮ 5.1.1 DNA -> RNA -> 蛋白质 (DNA -> RNA -> Protein)
▮▮▮▮▮▮ 5.1.2 逆转录及其他例外情况 (Reverse Transcription and Other Exceptions)
▮▮▮▮ 5.2 转录:从DNA到RNA (Transcription: From DNA to RNA)
▮▮▮▮▮▮ 5.2.1 RNA聚合酶与转录起始 (RNA Polymerase and Transcription Initiation)
▮▮▮▮▮▮ 5.2.2 转录的延伸与终止 (Transcription Elongation and Termination)
▮▮▮▮ 5.3 翻译:从RNA到蛋白质 (Translation: From RNA to Protein)
▮▮▮▮▮▮ 5.3.1 核糖体、tRNA与mRNA (Ribosomes, tRNA and mRNA)
▮▮▮▮▮▮ 5.3.2 翻译的起始、延伸与终止 (Translation Initiation, Elongation and Termination)
▮▮▮▮ 5.4 RNA的种类与功能 (Types and Functions of RNA)
▮▮▮▮▮▮ 5.4.1 mRNA、tRNA、rRNA (mRNA, tRNA, rRNA)
▮▮▮▮▮▮ 5.4.2 非编码RNA:miRNA、siRNA等 (Non-coding RNA: miRNA, siRNA, etc.)
▮▮ 6. 基因调控 (Gene Regulation)
▮▮▮▮ 6.1 原核生物的基因调控 (Gene Regulation in Prokaryotes)
▮▮▮▮▮▮ 6.1.1 操纵子模型 (Operon Model)
▮▮▮▮▮▮ 6.1.2 正调控与负调控 (Positive and Negative Regulation)
▮▮▮▮ 6.2 真核生物的基因调控 (Gene Regulation in Eukaryotes)
▮▮▮▮▮▮ 6.2.1 染色质结构与基因调控 (Chromatin Structure and Gene Regulation)
▮▮▮▮▮▮ 6.2.2 转录因子与转录调控 (Transcription Factors and Transcriptional Regulation)
▮▮▮▮▮▮ 6.2.3 转录后调控:RNA加工、RNA稳定性、翻译调控 (Post-transcriptional Regulation: RNA Processing, RNA Stability, Translational Control)
▮▮▮▮ 6.3 表观遗传调控 (Epigenetic Regulation)
▮▮▮▮▮▮ 6.3.1 表观遗传学的基本概念 (Basic Concepts of Epigenetics)
▮▮▮▮▮▮ 6.3.2 DNA甲基化与基因调控 (DNA Methylation and Gene Regulation)
▮▮▮▮▮▮ 6.3.3 组蛋白修饰与基因调控 (Histone Modification and Gene Regulation)
▮▮ 7. 突变与DNA修复 (Mutation and DNA Repair)
▮▮▮▮ 7.1 突变的类型与发生机制 (Types and Mechanisms of Mutation)
▮▮▮▮▮▮ 7.1.1 点突变:碱基替换、插入、缺失 (Point Mutations: Base Substitution, Insertion, Deletion)
▮▮▮▮▮▮ 7.1.2 染色体畸变:缺失、重复、倒位、易位 (Chromosome Aberrations: Deletion, Duplication, Inversion, Translocation)
▮▮▮▮▮▮ 7.1.3 突变的发生机制:自发突变与诱发突变 (Mechanisms of Mutation: Spontaneous and Induced Mutations)
▮▮▮▮ 7.2 突变的生物学效应 (Biological Effects of Mutation)
▮▮▮▮▮▮ 7.2.1 有害突变、有利突变与中性突变 (Deleterious, Beneficial and Neutral Mutations)
▮▮▮▮▮▮ 7.2.2 突变与进化 (Mutation and Evolution)
▮▮▮▮ 7.3 DNA修复机制 (DNA Repair Mechanisms)
▮▮▮▮▮▮ 7.3.1 直接修复 (Direct Repair)
▮▮▮▮▮▮ 7.3.2 切除修复:碱基切除修复、核苷酸切除修复 (Excision Repair: Base Excision Repair, Nucleotide Excision Repair)
▮▮▮▮▮▮ 7.3.3 重组修复与错配修复 (Recombination Repair and Mismatch Repair)
▮▮ 8. 重组DNA技术与生物技术 (Recombinant DNA Technology and Biotechnology)
▮▮▮▮ 8.1 重组DNA技术的基本原理 (Basic Principles of Recombinant DNA Technology)
▮▮▮▮▮▮ 8.1.1 限制性内切酶与DNA切割 (Restriction Enzymes and DNA Cutting)
▮▮▮▮▮▮ 8.1.2 DNA连接酶与DNA连接 (DNA Ligase and DNA Ligation)
▮▮▮▮▮▮ 8.1.3 载体与DNA导入宿主细胞 (Vectors and DNA Introduction into Host Cells)
▮▮▮▮▮▮ 8.1.4 基因克隆与筛选 (Gene Cloning and Screening)
▮▮▮▮ 8.2 聚合酶链式反应 (PCR) (Polymerase Chain Reaction (PCR))
▮▮▮▮▮▮ 8.2.1 PCR的原理与步骤 (Principles and Steps of PCR)
▮▮▮▮▮▮ 8.2.2 PCR的应用 (Applications of PCR)
▮▮▮▮ 8.3 生物技术在医学、农业和工业中的应用 (Applications of Biotechnology in Medicine, Agriculture and Industry)
▮▮▮▮▮▮ 8.3.1 生物技术在医学中的应用:基因治疗与药物开发 (Biotechnology in Medicine: Gene Therapy and Drug Development)
▮▮▮▮▮▮ 8.3.2 生物技术在农业中的应用:转基因作物与动物育种 (Biotechnology in Agriculture: Transgenic Crops and Animal Breeding)
▮▮▮▮▮▮ 8.3.3 生物技术在工业中的应用:酶工程与生物制药 (Biotechnology in Industry: Enzyme Engineering and Biopharmaceuticals)
▮▮ 9. 基因组学与蛋白质组学 (Genomics and Proteomics)
▮▮▮▮ 9.1 基因组学的概念与研究方法 (Concepts and Research Methods of Genomics)
▮▮▮▮▮▮ 9.1.1 基因组测序技术 (Genome Sequencing Technologies)
▮▮▮▮▮▮ 9.1.2 基因组注释与数据库 (Genome Annotation and Databases)
▮▮▮▮▮▮ 9.1.3 比较基因组学 (Comparative Genomics)
▮▮▮▮ 9.2 基因组学的应用 (Applications of Genomics)
▮▮▮▮▮▮ 9.2.1 基因组学在医学中的应用:个性化医疗 (Genomics in Medicine: Personalized Medicine)
▮▮▮▮▮▮ 9.2.2 基因组学在农业中的应用:基因组育种 (Genomics in Agriculture: Genomic Breeding)
▮▮▮▮▮▮ 9.2.3 基因组学在生物多样性保护中的应用 (Genomics in Biodiversity Conservation)
▮▮▮▮ 9.3 蛋白质组学 (Proteomics)
▮▮▮▮▮▮ 9.3.1 蛋白质组学的基本概念与研究方法 (Basic Concepts and Research Methods of Proteomics)
▮▮▮▮▮▮ 9.3.2 蛋白质组学的应用 (Applications of Proteomics)
▮▮▮▮▮▮ 9.3.3 蛋白质组学与基因组学的关系 (Relationship between Proteomics and Genomics)
▮▮ 10. 群体遗传学与进化 (Population Genetics and Evolution)
▮▮▮▮ 10.1 群体遗传学的基本概念 (Basic Concepts of Population Genetics)
▮▮▮▮▮▮ 10.1.1 群体、基因库、基因频率与基因型频率 (Population, Gene Pool, Gene Frequency and Genotype Frequency)
▮▮▮▮ 10.2 哈迪-温伯格定律 (Hardy-Weinberg Law)
▮▮▮▮▮▮ 10.2.1 哈迪-温伯格定律的内容与假设条件 (Content and Assumptions of Hardy-Weinberg Law)
▮▮▮▮▮▮ 10.2.2 哈迪-温伯格定律的应用 (Applications of Hardy-Weinberg Law)
▮▮▮▮ 10.3 影响群体遗传结构进化的因素 (Factors Affecting Population Genetic Structure Evolution)
▮▮▮▮▮▮ 10.3.1 突变、基因流与遗传漂变 (Mutation, Gene Flow and Genetic Drift)
▮▮▮▮▮▮ 10.3.2 自然选择与非随机交配 (Natural Selection and Non-random Mating)
▮▮ 11. 数量遗传学与复杂性状 (Quantitative Genetics and Complex Traits)
▮▮▮▮ 11.1 数量性状的遗传分析 (Genetic Analysis of Quantitative Traits)
▮▮▮▮▮▮ 11.1.1 数量性状的特点与连续变异 (Characteristics of Quantitative Traits and Continuous Variation)
▮▮▮▮▮▮ 11.1.2 数量性状的遗传与环境效应 (Genetic and Environmental Effects on Quantitative Traits)
▮▮▮▮ 11.2 遗传力 (Heritability)
▮▮▮▮▮▮ 11.2.1 遗传力的概念与类型:广义遗传力与狭义遗传力 (Concepts and Types of Heritability: Broad-sense and Narrow-sense Heritability)
▮▮▮▮▮▮ 11.2.2 遗传力的估计与应用 (Estimation and Application of Heritability)
▮▮▮▮ 11.3 数量性状基因座 (QTL) 定位 (Quantitative Trait Loci (QTL) Mapping)
▮▮▮▮▮▮ 11.3.1 QTL定位的原理与方法 (Principles and Methods of QTL Mapping)
▮▮▮▮▮▮ 11.3.2 QTL定位的应用 (Applications of QTL Mapping)
▮▮ 12. 人类遗传学与遗传疾病 (Human Genetics and Genetic Disorders)
▮▮▮▮ 12.1 人类基因组概述 (Overview of Human Genome)
▮▮▮▮▮▮ 12.1.1 人类基因组的结构与组成 (Structure and Composition of Human Genome)
▮▮▮▮▮▮ 12.1.2 人类基因组的特点:基因密度、重复序列、非编码RNA (Characteristics of Human Genome: Gene Density, Repetitive Sequences, Non-coding RNA)
▮▮▮▮ 12.2 人类遗传疾病的类型与遗传方式 (Types and Inheritance Patterns of Human Genetic Disorders)
▮▮▮▮▮▮ 12.2.1 单基因遗传病:常染色体显性遗传、常染色体隐性遗传、X连锁遗传 (Single-gene Disorders: Autosomal Dominant, Autosomal Recessive, X-linked Inheritance)
▮▮▮▮▮▮ 12.2.2 多基因遗传病与染色体病 (Multifactorial Disorders and Chromosomal Disorders)
▮▮▮▮▮▮ 12.2.3 线粒体遗传病 (Mitochondrial Disorders)
▮▮▮▮ 12.3 人类遗传疾病的诊断与遗传咨询 (Diagnosis and Genetic Counseling of Human Genetic Disorders)
▮▮▮▮▮▮ 12.3.1 人类遗传疾病的诊断方法:分子诊断、染色体诊断、生化诊断 (Diagnostic Methods for Human Genetic Disorders: Molecular Diagnosis, Chromosomal Diagnosis, Biochemical Diagnosis)
▮▮▮▮▮▮ 12.3.2 遗传咨询的意义与内容 (Significance and Content of Genetic Counseling)
▮▮ 13. 癌症遗传学 (Cancer Genetics)
▮▮▮▮ 13.1 癌症的遗传基础 (Genetic Basis of Cancer)
▮▮▮▮▮▮ 13.1.1 癌基因 (Oncogenes)
▮▮▮▮▮▮ 13.1.2 抑癌基因 (Tumor Suppressor Genes)
▮▮▮▮ 13.2 肿瘤发生的多步骤模型 (Multi-step Model of Tumorigenesis)
▮▮▮▮▮▮ 13.2.1 肿瘤发生的启动、促进与进展 (Initiation, Promotion and Progression of Tumorigenesis)
▮▮▮▮ 13.3 癌症的遗传易感性 (Genetic Susceptibility to Cancer)
▮▮▮▮▮▮ 13.3.1 遗传性癌症综合征与癌症易感基因 (Hereditary Cancer Syndromes and Cancer Susceptibility Genes)
▮▮▮▮▮▮ 13.3.2 癌症的遗传咨询与预防 (Genetic Counseling and Prevention of Cancer)
▮▮ 14. 表观遗传学 (Epigenetics)
▮▮▮▮ 14.1 表观遗传学的基本概念与机制 (Basic Concepts and Mechanisms of Epigenetics)
▮▮▮▮▮▮ 14.1.1 表观遗传修饰的类型:DNA甲基化、组蛋白修饰、非编码RNA (Types of Epigenetic Modifications: DNA Methylation, Histone Modification, Non-coding RNA)
▮▮▮▮▮▮ 14.1.2 表观遗传修饰的建立、维持与调控 (Establishment, Maintenance and Regulation of Epigenetic Modifications)
▮▮▮▮ 14.2 表观遗传学在生物学过程中的作用 (Role of Epigenetics in Biological Processes)
▮▮▮▮▮▮ 14.2.1 表观遗传学与基因表达调控 (Epigenetics and Gene Expression Regulation)
▮▮▮▮▮▮ 14.2.2 表观遗传学与细胞分化和发育 (Epigenetics and Cell Differentiation and Development)
▮▮▮▮▮▮ 14.2.3 表观遗传学与疾病 (Epigenetics and Diseases)
▮▮▮▮ 14.3 表观遗传学研究方法与应用 (Research Methods and Applications of Epigenetics)
▮▮▮▮▮▮ 14.3.1 表观遗传学研究方法:DNA甲基化测序、ChIP-Seq (Research Methods in Epigenetics: DNA Methylation Sequencing, ChIP-Seq)
▮▮▮▮▮▮ 14.3.2 表观遗传学在疾病诊断与治疗中的应用 (Applications of Epigenetics in Disease Diagnosis and Therapy)
▮▮ 15. 高级遗传学专题 (Advanced Topics in Genetics)
▮▮▮▮ 15.1 基因编辑技术 (Gene Editing Technologies)
▮▮▮▮▮▮ 15.1.1 CRISPR-Cas9基因编辑技术 (CRISPR-Cas9 Gene Editing Technology)
▮▮▮▮▮▮ 15.1.2 基因编辑技术的应用与伦理问题 (Applications and Ethical Issues of Gene Editing Technologies)
▮▮▮▮ 15.2 合成生物学 (Synthetic Biology)
▮▮▮▮▮▮ 15.2.1 合成生物学的概念与研究方法 (Concepts and Research Methods of Synthetic Biology)
▮▮▮▮▮▮ 15.2.2 合成生物学的应用前景 (Application Prospects of Synthetic Biology)
▮▮▮▮ 15.3 系统遗传学 (System Genetics)
▮▮▮▮▮▮ 15.3.1 系统遗传学的概念与研究方法 (Concepts and Research Methods of System Genetics)
▮▮▮▮▮▮ 15.3.2 系统遗传学的应用 (Applications of System Genetics)
▮▮ 附录A: 遗传学常用术语中英对照 (Glossary of Genetics Terms in Chinese and English)
▮▮ 附录B: 遗传学重要人物与时间线 (Timeline of Important Figures and Events in Genetics)
▮▮ 附录C: 遗传学在线资源与工具 (Online Resources and Tools for Genetics)
▮▮ 附录D: 参考文献 (References)


1. 遗传学导论 (Introduction to Genetics)

本章概述遗传学的定义、历史发展、研究范畴及其在生物学和医学中的重要性,为后续章节的学习奠定基础。

1.1 什么是遗传学?(What is Genetics?)

定义遗传学,阐述其研究内容,包括遗传和变异的规律、遗传物质的本质、基因的结构与功能等。

1.1.1 遗传学的定义与范畴 (Definition and Scope of Genetics)

遗传学 (Genetics) 是生物学 (Biology) 的一个核心分支,专注于研究遗传 (heredity)变异 (variation) 的科学。简单来说,遗传学旨在解答生命体如何将生物信息从上一代传递给下一代,以及在这个传递过程中,生物性状如何发生改变和多样化。

遗传 (heredity):指的是生物世代相传的现象,即后代在总体上会表现出与亲代相似的性状。例如,父母是黄皮肤、黑头发,子女也往往是黄皮肤、黑头发;高个子的父母,子女身高也倾向于较高。这种性状的代代相传,是生命延续的基础。

变异 (variation):指的是后代与亲代之间,以及同代个体之间在性状上存在的差异。例如,即使是同一对父母的子女,身高、相貌、性格等方面也可能存在差异;同种植物,花朵的颜色、果实的大小也可能有所不同。变异是生物多样性的来源,也是生物进化的动力。

遗传学的研究对象非常广泛,从基因 (gene)染色体 (chromosome) 等微观分子层面,到细胞 (cell)个体 (individual)群体 (population) 乃至物种 (species) 等宏观生命系统,都是遗传学关注的范畴。根据研究侧重点和方法,遗传学又可以进一步划分为多个分支,例如:

▮▮▮▮ⓐ 经典遗传学 (Classical Genetics):又称孟德尔遗传学 (Mendelian Genetics),主要研究性状的遗传规律,例如基因的分离、自由组合等,侧重于个体和世代之间的性状传递。其核心是孟德尔定律 (Mendel's Laws)。

▮▮▮▮ⓑ 分子遗传学 (Molecular Genetics):从分子水平研究遗传物质的结构、功能和传递规律,例如DNA的结构、复制、基因表达、基因调控等。分子遗传学深入揭示了遗传现象的物质基础和作用机制。

▮▮▮▮ⓒ 细胞遗传学 (Cytogenetics):研究染色体的结构、功能和变异,以及染色体在遗传和变异中的作用。细胞遗传学是连接经典遗传学和分子遗传学的桥梁。

▮▮▮▮ⓓ 群体遗传学 (Population Genetics):研究群体中基因和基因型频率的分布和变化规律,以及影响这些频率的因素,例如突变 (mutation)、选择 (selection)、漂变 (drift) 等。群体遗传学是研究生物进化的重要理论基础。

▮▮▮▮ⓔ 数量遗传学 (Quantitative Genetics):研究数量性状 (quantitative trait) 的遗传规律,例如身高、体重、产量等连续变异的性状。数量遗传学主要运用统计学方法分析复杂性状的遗传基础。

▮▮▮▮ⓕ 基因组学 (Genomics):在基因组 (genome) 水平上研究基因的结构、功能、进化和相互作用,是后基因组时代 (post-genomic era) 遗传学研究的前沿领域。基因组学大数据分析是其重要特征。

▮▮▮▮ⓖ 表观遗传学 (Epigenetics):研究不涉及DNA序列改变,但可以引起基因表达和细胞表型 (phenotype) 发生可遗传性改变的机制。例如DNA甲基化 (DNA methylation)、组蛋白修饰 (histone modification) 等。表观遗传学是近年来遗传学研究的热点领域。

总而言之,遗传学是一门博大精深的学科,它不仅关注生命现象的本质规律,也与人类社会发展息息相关。

1.1.2 遗传学在生物学和医学中的地位 (The Role of Genetics in Biology and Medicine)

遗传学是现代生物学 (Biology) 的基石,也是医学 (Medicine) 发展的重要支柱。它在生物进化、物种多样性、疾病发生发展、生物技术 (biotechnology) 等领域都发挥着核心作用。

生物进化 (Biological Evolution):遗传变异是生物进化的原始材料,自然选择 (natural selection) 作用于遗传变异,使得适应环境的变异得以保留和积累,最终导致物种的进化。达尔文 (Charles Darwin) 的进化论 (Theory of Evolution) 虽然在提出时对遗传机制并不清楚,但现代进化论 (Modern Evolutionary Synthesis) 已经将遗传学原理与进化论思想完美结合,形成了强大的理论框架。遗传学为理解生命进化历史和生物多样性 (biodiversity) 的形成提供了关键的理论和实验依据。

物种多样性 (Species Diversity):地球上存在着数百万种生物,它们形态各异、功能多样,这都源于遗传多样性 (genetic diversity)。遗传变异不仅发生在物种之间,也存在于物种内部的不同群体和个体之间。遗传多样性是生物适应环境变化、维持生态系统 (ecosystem) 功能的基础。遗传学研究有助于我们理解物种多样性的遗传基础,从而更好地保护生物多样性。

疾病发生发展 (Disease Development):许多疾病,包括遗传病 (genetic disorders)、癌症 (cancer)、自身免疫性疾病 (autoimmune diseases) 等,都与基因 (gene) 或基因组 (genome) 的异常有关。遗传病是由于基因突变 (gene mutation) 直接导致的疾病;癌症是基因突变累积导致细胞生长失控的疾病;自身免疫性疾病也与遗传易感性 (genetic susceptibility) 有关。遗传学研究为疾病的诊断、治疗和预防提供了重要的理论基础和技术手段。例如,基因诊断 (gene diagnosis) 可以用于遗传病的早期筛查和诊断;基因治疗 (gene therapy) 尝试通过修复或替换缺陷基因来治疗疾病;药物基因组学 (pharmacogenomics) 则研究个体基因差异对药物反应的影响,从而实现个体化医疗 (personalized medicine)。

生物技术 (Biotechnology):遗传学是生物技术发展的核心驱动力。重组DNA技术 (recombinant DNA technology)基因工程 (genetic engineering)基因编辑技术 (gene editing technology) 等现代生物技术都建立在对遗传物质和基因操作的深刻理解之上。生物技术在医学、农业、工业、环保等领域都具有广泛的应用前景。例如,转基因作物 (transgenic crops) 可以提高农作物产量和抗逆性;基因工程菌 (genetically engineered bacteria) 可以用于生产药物、生物燃料和生物材料;基因编辑技术为疾病治疗和新药研发带来了革命性的变革。

农业育种 (Agricultural Breeding):遗传学原理在农业育种中发挥着至关重要的作用。从传统的杂交育种 (hybrid breeding) 到现代的分子标记辅助选择育种 (marker-assisted selection breeding) 和基因组育种 (genomic breeding),遗传学知识和技术不断推动着农作物和家畜品种的改良。通过遗传育种,我们可以培育出高产、优质、抗病、抗逆的新品种,为保障粮食安全和提高农业生产效率做出重要贡献。

法医学 (Forensic Science):DNA指纹技术 (DNA fingerprinting) 等遗传学技术在法医学中被广泛应用。通过分析犯罪现场遗留的生物样本(如血液、毛发、精液等)的DNA,可以进行个体识别、亲子鉴定、案件侦破等。遗传学技术为打击犯罪、维护社会公平正义提供了强有力的科技支撑。

综上所述,遗传学不仅是生物学研究的核心领域,也是推动医学进步、发展生物技术、服务社会发展的重要学科。随着科学技术的不断进步,遗传学必将在未来发挥更加重要的作用。

1.2 遗传学的历史发展简述 (Brief History of Genetics)

回顾遗传学发展的关键里程碑事件,从孟德尔定律的发现到现代基因组学的兴起。

1.2.1 孟德尔与经典遗传学 (Mendel and Classical Genetics)

遗传学作为一门现代科学,其奠基人通常被认为是格雷戈尔·孟德尔 (Gregor Mendel)。孟德尔是一位奥地利 (Austria) 修道院的修士,他在19世纪中期(1856-1863年)通过长期的豌豆 (pea) 杂交实验,发现了遗传的基本规律,即孟德尔遗传定律 (Mendelian Laws),包括分离定律 (Law of Segregation)自由组合定律 (Law of Independent Assortment)

孟德尔的豌豆实验 (Mendel's Pea Experiments):孟德尔选择豌豆作为实验材料,因为它具有易于区分的性状,例如豌豆种子的颜色(黄色或绿色)、形状(圆形或皱缩)、植株的高度(高茎或矮茎)等。孟德尔对豌豆进行了系统的杂交实验,并对实验结果进行了精确的数学分析。他通过研究单性状杂交和多性状杂交,揭示了性状遗传的规律性。

分离定律 (Law of Segregation):孟德尔通过单性状杂交实验发现,杂交产生的后代(F1代)虽然只表现出显性性状 (dominant trait),但在F2代中,隐性性状 (recessive trait) 会重新出现,且显性性状和隐性性状的比例接近3:1。孟德尔解释说,生物的性状是由遗传因子 (hereditary factor) 控制的,每个性状由一对遗传因子决定,这对因子在配子 (gamete) 形成时会彼此分离,分别进入不同的配子中,后代从父母双方各获得一个遗传因子。现代遗传学将孟德尔的“遗传因子”称为基因 (gene),基因的不同形式称为等位基因 (allele),分离定律揭示了等位基因在遗传过程中的分离规律。

自由组合定律 (Law of Independent Assortment):孟德尔通过多性状杂交实验发现,不同性状的遗传因子在传递给后代时,彼此之间互不干扰,独立分配。例如,控制种子颜色和种子形状的基因在遗传时是相互独立的。自由组合定律揭示了位于不同染色体 (chromosome) 上的基因在遗传过程中的自由组合规律。

孟德尔的遗传定律是经典遗传学的核心内容,它首次揭示了遗传的基本规律,为遗传学的发展奠定了科学基础。然而,孟德尔的发现当时并没有引起科学界的重视,直到20世纪初(1900年),荷兰 (Netherlands) 植物学家雨果·德弗里斯 (Hugo de Vries)、德国 (Germany) 植物学家卡尔·科伦斯 (Carl Correns) 和奥地利植物学家埃里希·冯·切尔马克 (Erich von Tschermak) 三人各自独立地重复了孟德尔的豌豆实验,并重新发现了孟德尔的论文,孟德尔的遗传定律才被科学界广泛认可,遗传学也由此诞生。

1.2.2 染色体学说与分子遗传学的兴起 (Chromosome Theory and the Rise of Molecular Genetics)

20世纪初,随着细胞生物学 (cell biology) 的发展,科学家们发现染色体 (chromosome) 在细胞分裂 (cell division) 过程中行为与孟德尔提出的遗传因子的行为非常相似。1902年,德国生物学家西奥多·博韦里 (Theodor Boveri) 和美国 (USA) 遗传学家沃尔特·萨顿 (Walter Sutton) 分别独立地提出染色体学说 (Chromosome Theory of Inheritance),认为基因位于染色体上,染色体是遗传物质的载体,孟德尔遗传定律的细胞学基础是染色体的行为。

染色体学说的建立 (Establishment of Chromosome Theory):染色体学说将遗传学研究从性状层面深入到细胞层面,为理解遗传的物质基础提供了重要的线索。染色体学说的提出,标志着经典遗传学进入了一个新的发展阶段。

摩尔根与果蝇实验 (Morgan and Fruit Fly Experiments):美国遗传学家托马斯·亨特·摩尔根 (Thomas Hunt Morgan) 及其同事利用果蝇 (fruit fly) 进行了大量的遗传实验,进一步验证和发展了染色体学说。摩尔根的果蝇实验发现了连锁互换定律 (Law of Linkage and Crossing Over),揭示了位于同一染色体上的基因之间存在连锁关系,但连锁基因之间也会发生交换,导致基因重组 (gene recombination)。摩尔根的研究团队还绘制了世界上第一张染色体图谱 (chromosome map),确定了基因在染色体上的相对位置。摩尔根因染色体学说的建立和连锁互换定律的发现,获得了1933年诺贝尔生理学或医学奖 (Nobel Prize in Physiology or Medicine)。

DNA是遗传物质的发现 (Discovery of DNA as Genetic Material):染色体学说虽然确定了染色体是遗传物质的载体,但染色体的主要成分是DNA (脱氧核糖核酸, deoxyribonucleic acid) 和蛋白质 (protein),究竟哪一种物质才是真正的遗传物质?这个问题在20世纪上半叶困扰着科学家们。1928年,英国 (UK) 细菌学家弗雷德里克·格里菲斯 (Frederick Griffith) 的肺炎球菌转化实验 (transformation experiment) 首次暗示DNA可能是遗传物质。1944年,美国生物学家奥斯瓦尔德·埃弗里 (Oswald Avery)科林·麦克劳德 (Colin MacLeod)麦克林·麦卡蒂 (Maclyn McCarty) 的体外转化实验 (in vitro transformation experiment) 进一步证明DNA是细菌的遗传物质。1952年,美国遗传学家阿尔弗雷德·赫希 (Alfred Hershey)玛莎·蔡斯 (Martha Chase) 的噬菌体侵染实验 (bacteriophage infection experiment) 最终确凿地证明DNA是遗传物质,而不是蛋白质。DNA是遗传物质的发现,是分子生物学 (molecular biology) 诞生的重要里程碑,也标志着遗传学进入了分子遗传学 (Molecular Genetics) 时代。

DNA双螺旋结构的发现 (Discovery of DNA Double Helix Structure):1953年,美国生物学家詹姆斯·沃森 (James Watson) 和英国物理学家弗朗西斯·克里克 (Francis Crick) 在英国剑桥大学 (University of Cambridge) 基于X射线衍射 (X-ray diffraction) 数据和化学分析,提出了DNA双螺旋结构模型 (double helix model)。DNA双螺旋结构的发现,揭示了DNA复制 (DNA replication) 和遗传信息传递的分子机制,彻底打开了分子遗传学研究的大门。沃森和克里克因DNA双螺旋结构的发现,与英国生物物理学家莫里斯·威尔金斯 (Maurice Wilkins) 共同获得了1962年诺贝尔生理学或医学奖。

分子遗传学的兴起,使得遗传学研究深入到分子层面,极大地推动了遗传学的发展,也为生物技术的发展奠定了基础。

1.2.3 基因组学与后基因组时代 (Genomics and the Post-Genomic Era)

20世纪末,随着DNA测序技术 (DNA sequencing technology) 的快速发展,遗传学进入了基因组学 (Genomics) 时代。1990年,人类基因组计划 (Human Genome Project, HGP) 正式启动,旨在测定人类基因组的全部DNA序列,解读人类基因组的遗传信息。人类基因组计划是生命科学史上规模最大、意义最深远的科学工程之一。

人类基因组计划 (Human Genome Project, HGP):人类基因组计划历时13年,于2003年正式完成,成功绘制了人类基因组的精细图谱,揭示了人类基因组的结构、功能和进化信息。人类基因组计划的完成,标志着基因组学时代的到来,也为医学、生物技术等领域带来了革命性的变革。

后基因组时代 (Post-Genomic Era):人类基因组计划完成后,遗传学研究进入了后基因组时代 (Post-Genomic Era)。后基因组时代的研究重点从基因组序列测定转向基因组信息的解读和应用,例如基因功能研究、基因组变异分析、复杂疾病的遗传基础研究、个体化医疗等。生物信息学 (bioinformatics)系统生物学 (systems biology) 等交叉学科迅速发展,为基因组学研究提供了强大的工具和方法。

新一代测序技术 (Next-Generation Sequencing, NGS):随着测序技术的不断进步,新一代测序技术 (Next-Generation Sequencing, NGS) 迅速发展并广泛应用。NGS技术具有高通量、高速度、低成本的特点,使得大规模基因组测序成为可能。NGS技术极大地推动了基因组学研究的进展,也为精准医疗 (precision medicine)、基因组育种等领域提供了强大的技术支撑。

基因编辑技术 (Gene Editing Technology):近年来,基因编辑技术 (gene editing technology),特别是CRISPR-Cas9基因编辑技术 (CRISPR-Cas9 gene editing technology) 的兴起,为基因组改造和基因治疗带来了革命性的突破。CRISPR-Cas9技术可以精确、高效地编辑基因组的特定位点,具有广阔的应用前景,但也引发了伦理和社会争议。

合成生物学 (Synthetic Biology)合成生物学 (synthetic biology) 是一门新兴的交叉学科,它借鉴工程学 (engineering) 的思想和方法,从头设计和构建新的生物系统,或对已有的生物系统进行改造,以实现特定的功能。合成生物学在生物制造、生物能源、生物医药等领域具有巨大的潜力。

系统遗传学 (System Genetics)系统遗传学 (system genetics) 试图从系统水平上研究基因的功能和相互作用,解析复杂性状的遗传基础。系统遗传学结合了遗传学、基因组学、生物信息学、系统生物学等多个学科的方法,是后基因组时代遗传学研究的重要方向。

从孟德尔的豌豆实验到现代基因组学和合成生物学,遗传学走过了一条漫长而辉煌的发展道路。遗传学研究的不断深入,不仅极大地拓展了我们对生命本质的认识,也为解决人类健康、粮食安全、环境保护等重大挑战提供了强大的科技支撑。未来,遗传学必将继续在生命科学和人类社会发展中发挥越来越重要的作用。

2. 孟德尔遗传学:基因的传递规律 (Mendelian Genetics: Principles of Gene Transmission)

深入探讨孟德尔遗传定律,包括分离定律、自由组合定律,以及如何运用这些定律分析遗传现象。

2.1 孟德尔的分离定律 (Mendel's Law of Segregation)

详细解释分离定律的内容,包括等位基因、显隐性关系、杂合子和纯合子的概念,并通过案例分析进行说明。

2.1.1 等位基因、显隐性与基因型、表型 (Alleles, Dominance, Genotype and Phenotype)

要理解孟德尔的分离定律 (Mendel's Law of Segregation),首先需要掌握几个核心概念:等位基因 (alleles)显隐性关系 (dominance)基因型 (genotype)表型 (phenotype)。这些概念是理解遗传学的基础,也是分析遗传现象的关键。

等位基因 (Alleles)
⚝ 对于任何一个特定的基因 (gene),在一个染色体 (chromosome) 的特定位置 (基因座 (locus)) 上,可以存在不同的版本,这些不同的版本就称为等位基因 (alleles)。
⚝ 可以把基因想象成决定性状的“指令”,而等位基因则是这些指令的不同“版本”。例如,豌豆的种子颜色基因可以有两个等位基因:一个决定黄色种子,另一个决定绿色种子。
⚝ 在一个二倍体生物 (diploid organism) 中,每个基因座通常存在两个等位基因,分别来自父母双方。这两个等位基因可以是相同的,也可以是不同的。

显隐性关系 (Dominance)
⚝ 当一个个体在某个基因座上拥有两个不同的等位基因时,这两个等位基因之间的相互作用就决定了显隐性关系 (dominance)
显性等位基因 (dominant allele):在杂合状态下,其表型能够表达出来的等位基因。通常用大写字母表示,例如 Y 代表黄色种子的等位基因。
隐性等位基因 (recessive allele):在杂合状态下,其表型不能表达出来,只有在纯合状态下才能表达的等位基因。通常用小写字母表示,例如 y 代表绿色种子的等位基因。
纯合子 (homozygote):当一个个体在某个基因座上的两个等位基因相同时,称为纯合子。例如,YY (黄色种子纯合子) 或 yy (绿色种子纯合子)。
杂合子 (heterozygote):当一个个体在某个基因座上的两个等位基因不同时,称为杂合子。例如,Yy (黄色种子杂合子)。
⚝ 需要注意的是,显隐性关系并非绝对,也存在不完全显性 (incomplete dominance)共显性 (codominance) 等情况,这些将在后续章节中讨论。

基因型 (Genotype)
基因型 (genotype) 是指一个个体在特定基因座上的等位基因组合。
⚝ 基因型描述的是个体的遗传构成,是内在的遗传信息。
⚝ 例如,对于豌豆种子颜色基因,可能的基因型有 YYYyyy

表型 (Phenotype)
表型 (phenotype) 是指一个个体可观察到的性状或特征,包括形态、生理、生化和行为等各个方面。
⚝ 表型是基因型与环境相互作用的结果。相同的基因型在不同的环境下可能表现出不同的表型,而相同的表型也可能由不同的基因型产生。
⚝ 例如,对于豌豆种子颜色,YYYy 基因型都表现为黄色种子表型,而 yy 基因型则表现为绿色种子表型。

基因型与表型的关系

基因型是表型的基础,表型是基因型表达的结果。在孟德尔遗传学中,显隐性关系决定了基因型如何转化为表型。

基因型 (Genotype)等位基因组合 (Allele Combination)表型 (Phenotype) (豌豆种子颜色)
YY两个显性等位基因黄色 (Yellow)
Yy一个显性等位基因,一个隐性等位基因黄色 (Yellow) (由于显性基因 Y 的存在)
yy两个隐性等位基因绿色 (Green)

总结

理解等位基因、显隐性关系、基因型和表型是理解分离定律的关键。分离定律正是描述了等位基因在配子 (gamete) 形成过程中如何分离,以及如何在后代中重新组合,从而决定后代的基因型和表型。在接下来的小节中,我们将通过孟德尔的实验和遗传图谱来深入理解分离定律。

2.1.2 分离定律的实验验证与遗传图谱 (Experimental Verification and Genetic Diagrams of Segregation Law)

孟德尔 (Gregor Mendel) 通过其经典的豌豆杂交实验,发现了分离定律 (Law of Segregation)。这个定律是经典遗传学的基石之一,揭示了基因在配子 (gamete) 形成过程中如何分离,并传递给后代。

孟德尔的单性状杂交实验 (Monohybrid Cross)
⚝ 孟德尔选择豌豆的种子颜色 (seed color) 作为研究性状,该性状有两种明显的表型:黄色 (yellow)绿色 (green)。他首先培育了纯合亲本 (true-breeding parents),即黄色种子纯合子 (YY) 和绿色种子纯合子 (yy)。
P (Parental Generation, 亲代):将纯合黄色种子豌豆 (YY) 和纯合绿色种子豌豆 (yy) 进行杂交。
F<0xE2><0x82><0x81> (First Filial Generation, 子一代):所有子一代 (F<0xE2><0x82><0x81>) 豌豆的种子颜色均为黄色。这表明黄色是显性性状,绿色是隐性性状。子一代的基因型均为 杂合子 (heterozygote) Yy
F<0xE2><0x82><0x82> (Second Filial Generation, 子二代):让 F<0xE2><0x82><0x81> 代杂合子豌豆自交。
实验结果:在子二代 (F<0xE2><0x82><0x82>) 中,孟德尔观察到黄色种子和绿色种子重新出现,且数量比例接近 3:1 (黄色 : 绿色)。例如,他统计了 8023 粒 F<0xE2><0x82><0x82> 代种子,其中 6022 粒黄色,2001 粒绿色,比例约为 3.01:1。

分离定律的解释 (Explanation of Segregation Law)
⚝ 孟德尔根据实验结果,提出了分离定律 (Law of Segregation),其核心内容是:在配子形成过程中,成对的等位基因彼此分离,分别进入不同的配子中,每个配子只携带一个等位基因
⚝ 对于 F<0xE2><0x82><0x81> 代杂合子 Yy,在形成配子时,Yy 等位基因会分离,产生两种类型的配子:携带 Y 等位基因的配子和携带 y 等位基因的配子,且这两种配子的比例接近 1:1。
⚝ 当 F<0xE2><0x82><0x81> 代杂合子自交时,雌雄配子随机结合,产生 F<0xE2><0x82><0x82> 代后代。

遗传图谱 (Genetic Diagram) - 旁内特方格 (Punnett Square)
⚝ 为了更直观地展示分离定律和预测后代基因型和表型比例,我们可以使用 遗传图谱 (genetic diagram),其中最常用的工具是 旁内特方格 (Punnett square)
⚝ 旁内特方格是一个表格,将亲本产生的配子列在表格的边缘,表格内部的每个格子代表雌雄配子随机结合产生的后代基因型。

F<0xE2><0x82><0x81> 代杂合子自交的旁内特方格

♂ 配子 (Male Gametes)Yy
♀ 配子 (Female Gametes)
YYY (黄色)Yy (黄色)
yYy (黄色)yy (绿色)

基因型比例 (Genotype Ratio):从旁内特方格中可以看出,F<0xE2><0x82><0x82> 代的基因型比例为:YY AlBeRt63EiNsTeIn yy = 1 AlBeRt63EiNsTeIn 1。
表型比例 (Phenotype Ratio):由于 Yy 是显性的,YYYy 基因型都表现为黄色种子,只有 yy 基因型表现为绿色种子。因此,F<0xE2><0x82><0x82> 代的表型比例为:黄色 AlBeRt63EiNsTeIn 1 = 3 : 1,这与孟德尔的实验结果高度吻合。

分离定律的实验验证 (Experimental Verification)
⚝ 孟德尔的单性状杂交实验及其结果,有力地验证了分离定律的正确性。
3:1 的表型分离比 (phenotype segregation ratio) 是分离定律的经典特征,也是判断性状是否符合孟德尔分离定律的重要依据。
⚝ 通过大量的实验数据和严谨的逻辑推理,孟德尔成功地揭示了基因传递的基本规律,为遗传学的发展奠定了坚实的基础。

总结

孟德尔的分离定律指出,等位基因在配子形成过程中分离,并通过雌雄配子的随机结合传递给后代。通过单性状杂交实验和旁内特方格分析,我们可以清晰地理解分离定律的内涵,并预测后代的基因型和表型比例。分离定律是理解遗传现象的基石,也是进一步学习复杂遗传规律的基础。

2.2 孟德尔的自由组合定律 (Mendel's Law of Independent Assortment)

详细解释自由组合定律的内容,包括非同源染色体上基因的自由组合,并通过案例分析进行说明。

2.2.1 非同源染色体与基因的自由组合 (Non-homologous Chromosomes and Independent Assortment of Genes)

在理解了孟德尔的分离定律 (Law of Segregation) 后,我们进一步探讨自由组合定律 (Law of Independent Assortment)。自由组合定律描述了两个或多个基因在遗传过程中的传递规律,尤其关注位于不同染色体 (chromosome) 上的基因是如何独立遗传的。

双性状杂交实验 (Dihybrid Cross)
⚝ 为了研究两个性状的遗传规律,孟德尔进行了双性状杂交实验 (dihybrid cross)。他选择了豌豆的两个性状:种子颜色 (seed color) (黄色 Y 显性,绿色 y 隐性) 和 种子形状 (seed shape) (圆形 R 显性,皱缩 r 隐性)。
P (Parental Generation, 亲代):孟德尔首先培育了两种纯合亲本:纯合黄色圆形种子 (YYRR)纯合绿色皱缩种子 (yyrr)
F<0xE2><0x82><0x81> (First Filial Generation, 子一代):将这两种纯合亲本进行杂交,所有子一代 (F<0xE2><0x82><0x81>) 豌豆的种子均为 黄色圆形。这表明黄色对绿色是显性,圆形对皱缩是显性。F<0xE2><0x82><0x81> 代的基因型均为 双杂合子 (dihybrid) YyRr
F<0xE2><0x82><0x82> (Second Filial Generation, 子二代):让 F<0xE2><0x82><0x81> 代双杂合子豌豆自交。
实验结果:在子二代 (F<0xE2><0x82><0x82>) 中,孟德尔观察到四种表型组合:黄色圆形黄色皱缩绿色圆形绿色皱缩。他统计了大量的 F<0xE2><0x82><0x82> 代种子,发现这四种表型的比例接近 9:3:3:1 (黄色圆形 AlBeRt63EiNsTeIn 绿色圆形 : 绿色皱缩)。例如,他统计了 556 粒 F<0xE2><0x82><0x82> 代种子,各种表型数量如下:

表型组合 (Phenotype Combination)数量 (Number)
黄色圆形 (Yellow Round)315
黄色皱缩 (Yellow Wrinkled)101
绿色圆形 (Green Round)108
绿色皱缩 (Green Wrinkled)32
总计 (Total)556

表型比例约为 315:101:108:32 ≈ 9:3:3:1。

自由组合定律的解释 (Explanation of Independent Assortment Law)
⚝ 孟德尔根据双性状杂交实验结果,提出了 自由组合定律 (Law of Independent Assortment),其核心内容是:位于不同对同源染色体上的基因 (非等位基因) ,在配子形成过程中,它们的等位基因彼此分离的同时,不同对的等位基因可以自由组合
染色体基础 (Chromosomal Basis):自由组合定律的染色体基础是 减数分裂 (meiosis) 过程中 非同源染色体 (non-homologous chromosomes)自由组合 (independent assortment)。在减数第一次分裂 (meiosis I) 的后期,非同源染色体对的分离是随机的,导致不同染色体上的基因可以自由组合进入配子。
⚝ 对于 F<0xE2><0x82><0x81> 代双杂合子 YyRr,由于种子颜色基因和种子形状基因位于不同的同源染色体上 (假设),在减数分裂形成配子时,Yy 等位基因分离,Rr 等位基因也分离。同时,Y 可以与 Rr 自由组合,y 也可以与 Rr 自由组合,因此产生四种类型的配子,且比例接近 1:1:1:1:YRYryRyr

遗传图谱 (Genetic Diagram) - 旁内特方格 (Punnett Square)
⚝ 为了展示自由组合定律和预测 F<0xE2><0x82><0x82> 代的基因型和表型比例,我们可以使用旁内特方格。对于双杂合子自交,需要一个 16 格的旁内特方格 (4x4)。

F<0xE2><0x82><0x81> 代双杂合子自交的旁内特方格

♂ 配子 (Male Gametes)YRYryRyr
♀ 配子 (Female Gametes)
YRYYRR (黄色圆形)YYRr (黄色圆形)YyRR (黄色圆形)YyRr (黄色圆形)
YrYYRr (黄色圆形)YYrr (黄色皱缩)YyRr (黄色圆形)Yyrr (黄色皱缩)
yRYyRR (黄色圆形)YyRr (黄色圆形)yyRR (绿色圆形)yyRr (绿色圆形)
yrYyRr (黄色圆形)Yyrr (黄色皱缩)yyRr (绿色圆形)yyrr (绿色皱缩)

表型比例 (Phenotype Ratio):统计旁内特方格中各种表型组合的数量:
▮▮▮▮⚝ 黄色圆形 (Yellow Round)YYRR (1) + YYRr (2) + YyRR (2) + YyRr (4) = 9
▮▮▮▮⚝ 黄色皱缩 (Yellow Wrinkled)YYrr (1) + Yyrr (2) = 3
▮▮▮▮⚝ 绿色圆形 (Green Round)yyRR (1) + yyRr (2) = 3
▮▮▮▮⚝ 绿色皱缩 (Green Wrinkled)yyrr (1) = 1

因此,F<0xE2><0x82><0x82> 代的表型比例为:黄色圆形 AlBeRt63EiNsTeIn 绿色圆形 AlBeRt63EiNsTeIn 3 AlBeRt63EiNsTeIn 1,这与孟德尔的实验结果高度吻合。

自由组合定律的实验验证与应用 (Experimental Verification and Application)
⚝ 孟德尔的双性状杂交实验及其 9:3:3:1 的表型分离比 (phenotype segregation ratio),有力地验证了自由组合定律的正确性。
9:3:3:1 的表型分离比 是自由组合定律的经典特征,也是判断两个性状是否符合自由组合定律的重要依据。
应用 (Application):自由组合定律是遗传分析的重要工具。通过分析多性状杂交实验的后代表型分离比,可以判断不同基因是否位于同一染色体上 (连锁基因,将在后续章节讨论) 或不同染色体上 (非连锁基因)。
⚝ 自由组合定律也为理解生物多样性提供了遗传学基础。基因的自由组合产生了丰富的基因型和表型多样性,为自然选择和进化提供了原材料。

总结

孟德尔的自由组合定律指出,位于非同源染色体上的基因在配子形成过程中可以自由组合,并通过雌雄配子的随机结合传递给后代。通过双性状杂交实验和旁内特方格分析,我们可以清晰地理解自由组合定律的内涵,并预测后代的基因型和表型比例。自由组合定律与分离定律共同构成了孟德尔遗传学的核心内容,为我们理解复杂生物的遗传现象提供了重要的理论框架。

2.3 概率在遗传学中的应用 (Probability in Genetics)

介绍概率的基本概念和计算方法,以及如何在遗传学中运用概率预测后代的基因型和表型比例。

2.3.1 概率的基本概念与计算规则 (Basic Concepts and Calculation Rules of Probability)

概率 (probability) 是描述事件发生可能性大小的数值,通常用 \( P \) 表示,取值范围在 0 到 1 之间。概率为 0 表示事件不可能发生,概率为 1 表示事件必然发生。在遗传学中,概率是预测后代基因型和表型比例的重要工具。

基本概念 (Basic Concepts)
随机事件 (random event):在一定条件下,可能发生也可能不发生的事件,且每次实验的结果具有不确定性。例如,抛掷硬币,正面朝上或反面朝上都是随机事件。
样本空间 (sample space):所有可能发生的实验结果的集合。例如,抛掷一枚硬币的样本空间是 {正面,反面}。
事件 (event):样本空间的一个子集,即一组实验结果的集合。例如,抛掷一枚硬币,事件 “正面朝上” 是样本空间的一个子集 {正面}。
概率的定义 (Definition of Probability):对于一个随机事件 \( A \),其发生的概率 \( P(A) \) 定义为:

\[ P(A) = \frac{\text{事件 \( A \) 发生的有利结果数}}{\text{总的可能结果数}} \]

前提是所有可能的结果是等可能发生的。例如,抛掷一枚均匀硬币,正面朝上的概率为 \( P(\text{正面}) = \frac{1}{2} \),反面朝上的概率为 \( P(\text{反面}) = \frac{1}{2} \)。

概率的计算规则 (Calculation Rules of Probability)
在遗传学中,我们常用到以下两个基本的概率计算规则:加法法则 (addition rule)乘法法则 (multiplication rule)

▮▮▮▮ⓐ 加法法则 (Addition Rule)
互斥事件 (mutually exclusive events):如果两个事件不可能同时发生,则称这两个事件为互斥事件。例如,抛掷一枚硬币,不可能同时出现正面朝上和反面朝上。
加法法则:如果事件 \( A \) 和事件 \( B \) 是互斥事件,则事件 \( A \) 或事件 \( B \) 发生的概率等于它们各自发生的概率之和:

\[ P(A \text{ 或 } B) = P(A) + P(B) \]

示例:在豌豆杂交实验中,假设 F<0xE2><0x82><0x81> 代杂合子 Yy 产生配子时,产生携带 Y 等位基因配子的概率为 \( P(Y) = \frac{1}{2} \),产生携带 y 等位基因配子的概率为 \( P(y) = \frac{1}{2} \)。那么,一个配子携带 Yy 等位基因的概率为:

\[ P(Y \text{ 或 } y) = P(Y) + P(y) = \frac{1}{2} + \frac{1}{2} = 1 \]

这表示一个配子必然携带 Yy 等位基因 (符合分离定律)。

▮▮▮▮ⓑ 乘法法则 (Multiplication Rule)
独立事件 (independent events):如果一个事件的发生不影响另一个事件发生的概率,则称这两个事件为独立事件。例如,连续抛掷两次硬币,第一次抛掷的结果不影响第二次抛掷的结果。
乘法法则:如果事件 \( A \) 和事件 \( B \) 是独立事件,则事件 \( A \) 和事件 \( B \) 同时发生的概率等于它们各自发生的概率之积:

\[ P(A \text{ 且 } B) = P(A) \times P(B) \]

示例:在豌豆杂交实验中,假设雌配子携带 Y 等位基因的概率为 \( P(\text{♀}Y) = \frac{1}{2} \),雄配子携带 Y 等位基因的概率为 \( P(\text{♂}Y) = \frac{1}{2} \)。那么,后代基因型为 YY 的概率 (即雌配子携带 Y 雄配子携带 Y) 为:

\[ P(YY) = P(\text{♀}Y) \times P(\text{♂}Y) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4} \]

同理,可以计算出其他基因型的概率:
▮▮▮▮⚝ \( P(Yy) = P(\text{♀}Y) \times P(\text{♂}y) + P(\text{♀}y) \times P(\text{♂}Y) = \frac{1}{2} \times \frac{1}{2} + \frac{1}{2} \times \frac{1}{2} = \frac{1}{2} \)
▮▮▮▮⚝ \( P(yy) = P(\text{♀}y) \times P(\text{♂}y) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4} \)

基因型比例为 \( P(YY) : P(Yy) : P(yy) = \frac{1}{4} : \frac{1}{2} : \frac{1}{4} = 1 : 2 : 1 \),与旁内特方格分析结果一致。

概率在遗传学中的应用 (Applications in Genetics)
⚝ 概率的加法法则和乘法法则,是遗传学中预测后代基因型和表型比例的基本工具。
⚝ 通过运用概率,我们可以避免绘制复杂的旁内特方格 (尤其是在多性状杂交中),更快速、更有效地解决遗传学问题。
⚝ 在遗传咨询中,概率计算也用于评估遗传病在后代中发生的风险。

总结

概率是理解和预测遗传现象的重要数学工具。掌握概率的基本概念和计算规则,特别是加法法则和乘法法则,可以帮助我们更深入地理解孟德尔遗传定律,并解决各种遗传学问题。在接下来的小节中,我们将通过具体的例子,演示如何运用概率预测遗传结果。

2.3.2 运用概率预测遗传结果 (Using Probability to Predict Genetic Outcomes)

掌握了概率的基本概念和计算规则后,我们来看几个例子,演示如何在遗传学中运用概率预测后代的基因型和表型比例。

例 1:单性状杂交 (Monohybrid Cross)

假设豌豆种子颜色由基因 Y 控制,黄色 (Y) 对绿色 (y) 为显性。如果将两个杂合子豌豆 (Yy) 杂交,预测后代中出现绿色种子豌豆的概率。

分析

亲本基因型 (Parental Genotypes)Yy × Yy
亲本产生配子的概率 (Gamete Probabilities)
▮▮▮▮⚝ 对于 Yy 亲本,产生携带 Y 等位基因配子的概率 \( P(Y) = \frac{1}{2} \),产生携带 y 等位基因配子的概率 \( P(y) = \frac{1}{2} \)。
后代基因型为 yy 的概率 (Probability of Genotype yy)
▮▮▮▮⚝ 后代基因型为 yy,需要雌雄配子都携带 y 等位基因。由于雌雄配子结合是独立事件,根据乘法法则:

\[ P(yy) = P(\text{♀}y) \times P(\text{♂}y) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4} \]

结论:后代中出现绿色种子豌豆 (基因型 yy) 的概率为 \( \frac{1}{4} \) 或 25%。这与分离定律预测的表型比例 3:1 (黄色:绿色) 相符,绿色种子占总数的 \( \frac{1}{4} \)。

例 2:双性状杂交 (Dihybrid Cross)

假设豌豆种子颜色由基因 Y 控制 (黄色 Y 显性,绿色 y 隐性),种子形状由基因 R 控制 (圆形 R 显性,皱缩 r 隐性)。如果将两个双杂合子豌豆 (YyRr) 杂交,预测后代中出现绿色皱缩种子豌豆的概率。

分析

亲本基因型 (Parental Genotypes)YyRr × YyRr
亲本产生配子的概率 (Gamete Probabilities)
▮▮▮▮⚝ 对于 YyRr 亲本,根据自由组合定律,产生四种配子的概率均为 \( \frac{1}{4} \):YRYryRyr
后代基因型为 yyrr 的概率 (Probability of Genotype yyrr)
▮▮▮▮⚝ 后代基因型为 yyrr,需要雌雄配子都携带 yr 等位基因组合。由于雌雄配子结合是独立事件,根据乘法法则:

\[ P(yyrr) = P(\text{♀}yr) \times P(\text{♂}yr) = \frac{1}{4} \times \frac{1}{4} = \frac{1}{16} \]

结论:后代中出现绿色皱缩种子豌豆 (基因型 yyrr) 的概率为 \( \frac{1}{16} \) 或 6.25%。这与自由组合定律预测的表型比例 9:3:3:1 (黄色圆形 AlBeRt63EiNsTeIn 绿色圆形 : 绿色皱缩) 相符,绿色皱缩种子占总数的 \( \frac{1}{16} \)。

例 3:复杂性状组合的概率计算

假设某种植物的花色由基因 C (红色 C 显性,白色 c 隐性) 和花瓣形状由基因 P (平瓣 P 显性,皱瓣 p 隐性) 控制,且这两个基因独立遗传。如果将基因型为 CcPp 的植株与基因型为 ccPp 的植株杂交,预测后代中出现白色皱瓣花植株的概率。

分析

亲本基因型 (Parental Genotypes)CcPp × ccPp
分别考虑每个性状的概率 (Probability for Each Trait Separately)
▮▮▮▮⚝ 花色 (Flower Color):杂交组合为 Cc × cc。后代基因型为 cc (白色花) 的概率为 \( P(cc) = \frac{1}{2} \)。
▮▮▮▮⚝ 花瓣形状 (Petal Shape):杂交组合为 Pp × Pp。后代基因型为 pp (皱瓣花) 的概率为 \( P(pp) = \frac{1}{4} \)。
同时出现白色和皱瓣花的概率 (Probability of White and Wrinkled Petals Simultaneously)
▮▮▮▮⚝ 由于花色和花瓣形状基因独立遗传,根据乘法法则,后代同时出现白色花 皱瓣花的概率为:

\[ P(\text{白色皱瓣花}) = P(cc \text{ 且 } pp) = P(cc) \times P(pp) = \frac{1}{2} \times \frac{1}{4} = \frac{1}{8} \]

结论:后代中出现白色皱瓣花植株的概率为 \( \frac{1}{8} \) 或 12.5%。

总结

通过以上例子可以看出,运用概率的加法法则和乘法法则,可以有效地预测各种遗传杂交实验的后代基因型和表型比例。对于复杂的遗传问题,可以将问题分解为若干个独立的事件,分别计算每个事件的概率,再根据概率的计算规则进行组合,从而简化分析过程,快速得到答案。概率方法是遗传学研究和应用中不可或缺的重要工具。

3. 染色体与细胞分裂 (Chromosomes and Cell Division)

摘要

本章概述染色体 (chromosome) 的结构、类型和功能,并详细介绍细胞分裂 (cell division) 的两种主要形式:有丝分裂 (mitosis) 和减数分裂 (meiosis)。理解染色体和细胞分裂是遗传学的基础,它们直接关系到遗传信息的传递和生物体的生长发育。本章旨在帮助读者掌握染色体的基本知识,理解有丝分裂和减数分裂的过程及其遗传学意义,为后续深入学习遗传学的其他内容奠定坚实的基础。

3.1 染色体的结构与功能 (Structure and Function of Chromosomes)

摘要

本节深入探讨染色体的组成成分、基本结构和功能,并介绍染色体的不同类型。染色体是遗传物质 DNA 的载体,其精细的结构和复杂的功能确保了遗传信息的准确复制和传递。理解染色体的结构与功能是理解基因如何组织、表达和遗传的关键。

3.1.1 染色体的组成成分:DNA与蛋白质 (Components of Chromosomes: DNA and Proteins)

染色体并非简单的线性 DNA 分子,而是一种高度复杂的复合物,主要由 脱氧核糖核酸 (DNA)蛋白质 (protein) 组成,统称为 染色质 (chromatin)

DNA (脱氧核糖核酸):染色体的主要成分是 DNA,它携带了生物体的全部遗传信息。DNA 以双螺旋结构存在,由 核苷酸 (nucleotide) 组成,每个核苷酸包含 脱氧核糖 (deoxyribose)磷酸基团 (phosphate group)含氮碱基 (nitrogenous base)。DNA 中的碱基共有四种:腺嘌呤 (adenine, A)鸟嘌呤 (guanine, G)胞嘧啶 (cytosine, C)胸腺嘧啶 (thymine, T)。碱基的排列顺序构成了遗传密码,决定了生物体的性状。

蛋白质 (protein):染色体中的蛋白质主要包括 组蛋白 (histone)非组蛋白 (non-histone protein)

▮▮▮▮ⓐ 组蛋白 (histone):组蛋白是一类富含 赖氨酸 (lysine)精氨酸 (arginine) 的碱性蛋白质,在染色质的结构中起着核心作用。主要有五种主要的组蛋白类型:H1、H2A、H2B、H3 和 H4。
▮▮▮▮▮▮▮▮❷ 核小体 (nucleosome):DNA 分子缠绕组蛋白八聚体(由两个 H2A-H2B 二聚体和两个 H3-H4 二聚体组成)形成核小体,这是染色质的基本结构单位。核小体像“念珠”一样串联在 DNA 分子上,形成 “念珠状” 结构。
▮▮▮▮▮▮▮▮❸ 染色质纤维 (chromatin fiber):核小体进一步折叠和螺旋化,形成更高级的染色质结构,如 30nm 染色质纤维。组蛋白 H1 参与 30nm 染色质纤维的形成,有助于核小体之间的进一步聚集和稳定。

▮▮▮▮ⓑ 非组蛋白 (non-histone protein):非组蛋白种类繁多,功能复杂,包括参与 DNA 复制、转录、修复和染色体结构维持等多种蛋白质。例如,DNA 聚合酶 (DNA polymerase)RNA 聚合酶 (RNA polymerase)转录因子 (transcription factor) 等都属于非组蛋白。

染色体中 DNA 和蛋白质的相互作用,使得长而脆弱的 DNA 分子能够有效地压缩和组织,形成稳定的染色体结构,便于在细胞分裂过程中进行精确的复制和分离,同时也调控着基因的表达。

3.1.2 染色体的基本结构:着丝粒、端粒、臂 (Basic Structure of Chromosomes: Centromere, Telomere, Arms)

典型的真核细胞染色体在有丝分裂中期 (metaphase) 具有明显的结构特征,主要包括 着丝粒 (centromere)端粒 (telomere)染色体臂 (chromosome arm)

着丝粒 (centromere):着丝粒是染色体上一个特殊的 缢缩区域 (constricted region),在有丝分裂和减数分裂时,纺锤丝 (spindle fiber) 连接到着丝粒上,牵引染色体移动。着丝粒在染色体分离和分配中起着至关重要的作用。
▮▮▮▮ⓑ 动粒 (kinetochore):着丝粒区域包含 动粒 (kinetochore),这是一个蛋白质复合体,是纺锤丝附着的具体位点。动粒的正确组装和功能对于染色体的正确分离至关重要。
▮▮▮▮ⓒ 着丝粒 DNA (centromeric DNA):着丝粒区域的 DNA 通常由高度重复的 DNA 序列组成,称为 卫星 DNA (satellite DNA)。这些重复序列在着丝粒的结构和功能中发挥作用。

端粒 (telomere):端粒是位于染色体末端的特殊结构,具有保护染色体末端免受损伤和融合的作用,维持染色体的稳定性。
▮▮▮▮ⓑ 端粒 DNA (telomeric DNA):端粒 DNA 通常由简单的重复序列组成,例如在人类中是 TTAGGG 的重复序列。这些重复序列可以形成特殊的环状结构,保护染色体末端。
▮▮▮▮ⓒ 端粒酶 (telomerase):端粒酶是一种特殊的 逆转录酶 (reverse transcriptase),能够合成端粒 DNA,维持端粒的长度。在细胞分裂过程中,端粒会逐渐缩短,端粒酶可以部分弥补这种缩短,但随着细胞分裂次数的增加,端粒仍然会逐渐缩短,这与细胞衰老和寿命有关。

染色体臂 (chromosome arm):着丝粒将染色体分为两个臂,短臂 (short arm) 标记为 p 臂 (p arm)长臂 (long arm) 标记为 q 臂 (q arm)。染色体臂上分布着大量的基因和其他 DNA 序列。根据着丝粒在染色体上的位置,染色体可以分为以下几种类型:
▮▮▮▮ⓑ 中部着丝粒染色体 (metacentric chromosome):着丝粒位于染色体中部,p 臂和 q 臂长度接近相等。
▮▮▮▮ⓒ 亚中部着丝粒染色体 (submetacentric chromosome):着丝粒偏离染色体中部,p 臂明显短于 q 臂。
▮▮▮▮ⓓ 近端着丝粒染色体 (acrocentric chromosome):着丝粒非常靠近染色体末端,p 臂非常短小,有时呈球状,称为 随体 (satellite),通过 次缢痕 (secondary constriction) 与染色体臂相连。人类的 13、14、15、21 和 22 号染色体是近端着丝粒染色体。
▮▮▮▮ⓔ 端部着丝粒染色体 (telocentric chromosome):着丝粒位于染色体顶端,只有 q 臂,没有 p 臂。人类没有端部着丝粒染色体,但在某些物种中存在。

染色体的这些基本结构共同维持了染色体的完整性和功能,确保了遗传信息的稳定传递。

3.1.3 染色体的类型:常染色体与性染色体 (Types of Chromosomes: Autosomes and Sex Chromosomes)

根据染色体在性别决定中的作用,可以将染色体分为 常染色体 (autosome)性染色体 (sex chromosome)

常染色体 (autosome):常染色体是与性别决定无关的染色体,在雌雄个体中数目和形态都相同。人类细胞共有 23 对染色体,其中 22 对是常染色体,编号为 1-22 号染色体。常染色体上的基因控制着生物体的大部分性状,例如身高、肤色、血型等。

性染色体 (sex chromosome):性染色体是决定生物体性别的染色体,在雌雄个体中数目或形态可能不同。人类的性染色体为 X 染色体 (X chromosome)Y 染色体 (Y chromosome)
▮▮▮▮ⓑ 性别决定机制 (sex determination mechanism):人类的性别决定方式为 XY 性别决定系统 (XY sex-determination system)。女性的性染色体组成为 XX,男性为 XY
▮▮▮▮▮▮▮▮❸ X 染色体 (X chromosome):X 染色体较大,含有大量的基因,除了与性别决定有关的基因外,还包含许多与生命活动相关的基因。
▮▮▮▮▮▮▮▮❹ Y 染色体 (Y chromosome):Y 染色体较小,基因数量远少于 X 染色体。Y 染色体上最重要的基因是 SRY 基因 (sex-determining region Y gene),也称为 睾丸决定因子 (testis-determining factor)。SRY 基因的存在是男性性别决定的关键。在胚胎发育早期,SRY 基因的表达启动了睾丸的发育途径,抑制了卵巢的发育途径,从而决定了个体的性别为男性。如果个体没有 Y 染色体或 SRY 基因功能异常,即使具有两条 X 染色体,也可能发育为女性或性发育异常。

▮▮▮▮ⓑ 其他性别决定系统 (other sex-determination systems):除了 XY 性别决定系统外,自然界还存在其他多种性别决定系统,例如:
▮▮▮▮▮▮▮▮❷ XX-X0 性别决定系统 (XX-X0 sex-determination system):例如在蝗虫和线虫中,雌性为 XX,雄性为 X0(只有一条 X 染色体,没有 Y 染色体)。
▮▮▮▮▮▮▮▮❸ ZW-ZZ 性别决定系统 (ZW-ZZ sex-determination system):例如在鸟类、鱼类和昆虫中,雌性为 ZW,雄性为 ZZ。与 XY 系统相反,雌性是异配性别 (heterogametic sex),雄性是同配性别 (homogametic sex)。
▮▮▮▮▮▮▮▮❹ 单倍体-二倍体性别决定系统 (haplodiploid sex-determination system):例如在蜜蜂和蚂蚁中,雌性是二倍体 (diploid),由受精卵发育而来;雄性是单倍体 (haploid),由未受精卵发育而来。

理解常染色体和性染色体的区别,以及不同生物的性别决定机制,有助于我们深入理解遗传的复杂性和多样性。

3.2 细胞分裂:有丝分裂 (Mitosis)

摘要

本节详细介绍有丝分裂的过程和生物学意义。有丝分裂是一种细胞分裂方式,将一个母细胞分裂成两个遗传信息完全相同的子细胞。有丝分裂是生物体生长发育、组织修复和无性繁殖的基础。

3.2.1 有丝分裂的时期:前期、中期、后期、末期 (Phases of Mitosis: Prophase, Metaphase, Anaphase, Telophase)

有丝分裂是一个连续的过程,为了便于描述和研究,通常将其划分为 前期 (prophase)前中期 (prometaphase)中期 (metaphase)后期 (anaphase)末期 (telophase) 五个时期。在末期之后,通常伴随着 胞质分裂 (cytokinesis),将细胞质也一分为二,最终形成两个独立的子细胞。

前期 (prophase):前期的主要事件是染色体的 凝缩 (condensation)纺锤体的形成 (spindle formation)
▮▮▮▮ⓑ 染色体凝缩 (chromosome condensation):间期 (interphase) 细胞核中分散的染色质开始凝缩,逐渐形成可见的染色体。每条染色体由两条 姐妹染色单体 (sister chromatid) 组成,它们在着丝粒处连接在一起。
▮▮▮▮ⓒ 纺锤体形成 (spindle formation)中心体 (centrosome) 开始分离并向细胞两极移动。在动物细胞中,每个中心体包含一对 中心粒 (centriole)。中心体周围的 微管组织中心 (microtubule organizing center, MTOC) 开始组装 纺锤丝 (spindle fiber),形成纺锤体。植物细胞没有中心体,但也有 MTOC,也能形成纺锤体。

前中期 (prometaphase):前中期的主要事件是 核膜的解体 (nuclear envelope breakdown)染色体与纺锤丝的连接 (chromosome attachment to spindle)
▮▮▮▮ⓑ 核膜解体 (nuclear envelope breakdown):核膜开始解体,染色体释放到细胞质中。
▮▮▮▮ⓒ 染色体与纺锤丝连接 (chromosome attachment to spindle):纺锤丝延伸到细胞核区域,动粒微管 (kinetochore microtubule) 连接到每条染色体着丝粒上的动粒。每条姐妹染色单体的动粒都与来自相反两极的纺锤丝相连。

中期 (metaphase):中期的主要事件是 染色体在赤道面排列 (chromosome alignment at the metaphase plate)
▮▮▮▮ⓑ 赤道面排列 (metaphase plate alignment):染色体在纺锤丝的牵引下,移动到细胞的中央平面,即 赤道面 (metaphase plate)。所有染色体的着丝粒都排列在赤道面上,形成 中期板 (metaphase plate)。此时,染色体的凝缩程度最高,形态最清晰,是观察染色体形态和核型分析的最佳时期。

后期 (anaphase):后期的主要事件是 姐妹染色单体的分离 (sister chromatid separation)染色体向两极移动 (chromosome movement to poles)
▮▮▮▮ⓑ 姐妹染色单体分离 (sister chromatid separation):连接姐妹染色单体的 姐妹染色单体黏连蛋白 (cohesin) 被酶解,姐妹染色单体分离,成为独立的 子染色体 (daughter chromosome)
▮▮▮▮ⓒ 染色体向两极移动 (chromosome movement to poles):动粒微管缩短,牵引子染色体向细胞两极移动。同时,极性微管 (polar microtubule) 延长,将两极进一步推开,细胞呈椭圆形。

末期 (telophase):末期的主要事件是 染色体解凝缩 (chromosome decondensation)核膜重建 (nuclear envelope reassembly)胞质分裂开始 (cytokinesis initiation)
▮▮▮▮ⓑ 染色体解凝缩 (chromosome decondensation):到达两极的子染色体开始解凝缩,逐渐恢复为分散的染色质状态。
▮▮▮▮ⓒ 核膜重建 (nuclear envelope reassembly):在每个染色体群体的周围,重新形成核膜,形成两个新的细胞核。核仁 (nucleolus) 也重新出现。
▮▮▮▮ⓓ 胞质分裂开始 (cytokinesis initiation):胞质分裂通常在末期或末期之后开始。在动物细胞中,赤道面位置的细胞膜内陷,形成 分裂沟 (cleavage furrow),逐渐加深,最终将细胞质一分为二。在植物细胞中,在赤道面位置形成 细胞板 (cell plate),细胞板从细胞中央向四周扩展,最终与细胞壁融合,将细胞一分为二。

有丝分裂的结果是将一个母细胞分裂成两个遗传信息完全相同的子细胞,每个子细胞都含有与母细胞相同的染色体数目和基因组成。

3.2.2 有丝分裂的生物学意义 (Biological Significance of Mitosis)

有丝分裂在生物体的生命活动中具有重要的生物学意义,主要体现在以下几个方面:

生物体的生长发育 (growth and development):多细胞生物体由一个受精卵发育而来,细胞通过有丝分裂不断增殖,增加细胞数量,从而实现生物体的生长和发育。例如,从幼年到成年的生长过程,主要是通过细胞有丝分裂实现的。

组织修复和再生 (tissue repair and regeneration):生物体在受到损伤后,需要通过细胞分裂来修复受损的组织和器官。有丝分裂产生的新细胞可以替代死亡或受损的细胞,维持组织的完整性和功能。例如,皮肤伤口愈合、骨折修复等都依赖于有丝分裂。

无性繁殖 (asexual reproduction):对于一些单细胞生物和多细胞生物,有丝分裂是无性繁殖的主要方式。通过有丝分裂,生物体可以直接产生与自身遗传信息完全相同的后代。例如,细菌的二分裂、酵母菌的出芽生殖、植物的扦插和嫁接等都属于无性繁殖,其细胞分裂方式主要是有丝分裂。

维持染色体数目恒定 (maintaining chromosome number constancy):有丝分裂确保了细胞分裂过程中染色体数目和遗传信息的精确复制和均等分配。每个子细胞都继承了与母细胞完全相同的染色体组型,维持了生物体细胞遗传信息的稳定性。

总之,有丝分裂是生物体生命活动的基础,对于生物体的生长、发育、繁殖和维持生命活动都至关重要。

3.3 细胞分裂:减数分裂 (Meiosis)

摘要

本节详细介绍减数分裂的过程和遗传学意义。减数分裂是一种特殊的细胞分裂方式,将一个二倍体 (diploid, 2n) 母细胞分裂成四个单倍体 (haploid, n) 子细胞,子细胞的染色体数目是母细胞的一半。减数分裂是进行有性生殖的生物产生配子 (gamete) 的主要方式,也是产生遗传多样性的重要来源。

3.3.1 减数分裂I与减数分裂II (Meiosis I and Meiosis II)

减数分裂是一个连续的过程,为了便于描述,通常将其划分为 减数第一次分裂 (meiosis I)减数第二次分裂 (meiosis II) 两个阶段。每个阶段又可以细分为前期、中期、后期和末期。

减数第一次分裂 (Meiosis I):减数第一次分裂的主要特点是 同源染色体分离 (homologous chromosome separation),将染色体数目减半。减数第一次分裂包括:
▮▮▮▮ⓑ 前期I (prophase I):前期 I 是减数分裂中最复杂、时间最长的时期,可以进一步细分为 细线期 (leptotene)偶线期 (zygotene)粗线期 (pachytene)双线期 (diplotene)终变期 (diakinesis) 五个亚期。
▮▮▮▮▮▮▮▮❸ 细线期 (leptotene):染色体开始凝缩,呈细长的线状,附着在核膜上。
▮▮▮▮▮▮▮▮❹ 偶线期 (zygotene):同源染色体开始 联会 (synapsis),即两条同源染色体并排配对,形成 四分体 (tetrad)二价体 (bivalent)。联会复合体 (synaptonemal complex, SC) 在同源染色体之间形成,稳定联会结构。
▮▮▮▮▮▮▮▮❺ 粗线期 (pachytene):同源染色体联会完成,四分体更加紧密。交叉互换 (crossing over) 发生在粗线期,即同源染色体非姐妹染色单体之间发生 DNA 片段的交换,导致基因重组。
▮▮▮▮▮▮▮▮❻ 双线期 (diplotene):联会复合体解体,同源染色体开始分离,但在 交叉点 (chiasma) 处仍然连接在一起。交叉点是同源染色体发生交叉互换的位置,在显微镜下可见。
▮▮▮▮▮▮▮▮❼ 终变期 (diakinesis):染色体进一步凝缩,交叉点更加明显,核仁和核膜逐渐消失,纺锤体开始形成。

▮▮▮▮ⓑ 中期I (metaphase I):四分体在纺锤丝的牵引下,移动到细胞的赤道面。每对同源染色体的着丝粒都位于赤道面两侧,而不是像有丝分裂中期那样排列在赤道面上。

▮▮▮▮ⓒ 后期I (anaphase I)同源染色体分离 (homologous chromosome separation),每对同源染色体中的一条染色体(由两条姐妹染色单体组成)随机地移向细胞一极,另一条同源染色体移向另一极。姐妹染色单体仍然连接在一起。这种同源染色体的随机分离,称为 分离定律 (law of segregation) 的细胞学基础。

▮▮▮▮ⓓ 末期I (telophase I):染色体到达两极,染色体稍微解凝缩,核膜和核仁可能重新形成,胞质分裂开始,形成两个子细胞。每个子细胞的染色体数目减半,但每条染色体仍然由两条姐妹染色单体组成

减数第二次分裂 (Meiosis II):减数第二次分裂类似于有丝分裂,主要特点是 姐妹染色单体分离 (sister chromatid separation)。减数第二次分裂包括:
▮▮▮▮ⓑ 前期II (prophase II):染色体再次凝缩(如果末期 I 染色体解凝缩),核膜和核仁消失(如果末期 I 核膜和核仁重新形成),纺锤体开始形成。

▮▮▮▮ⓑ 中期II (metaphase II):染色体在纺锤丝的牵引下,移动到细胞的赤道面。每条染色体的着丝粒排列在赤道面上,与有丝分裂中期相似。

▮▮▮▮ⓒ 后期II (anaphase II)姐妹染色单体分离 (sister chromatid separation),姐妹染色单体分开,成为独立的子染色体,分别移向细胞两极。

▮▮▮▮ⓓ 末期II (telophase II):染色体到达两极,染色体解凝缩,核膜和核仁重新形成,胞质分裂完成,形成四个单倍体子细胞。每个子细胞的染色体数目是母细胞的一半,且每条染色体由一条染色单体组成

减数分裂的结果是将一个二倍体母细胞分裂成四个单倍体子细胞,每个子细胞都含有母细胞一半的染色体数目,且子细胞之间的遗传信息不完全相同,因为在减数分裂过程中发生了同源染色体分离和交叉互换。

3.3.2 减数分裂的遗传学意义:产生配子与遗传多样性 (Genetic Significance of Meiosis: Gamete Production and Genetic Diversity)

减数分裂在有性生殖生物的生命周期中具有重要的遗传学意义,主要体现在以下几个方面:

产生单倍体配子 (production of haploid gametes):减数分裂是产生配子的主要方式。通过减数分裂,二倍体生殖细胞 (germ cell) 分裂形成单倍体配子,例如精子和卵细胞。配子中染色体数目减半,为受精作用后形成二倍体合子 (zygote) 维持物种染色体数目的恒定性奠定了基础。

维持物种染色体数目的恒定 (maintaining chromosome number constancy):有性生殖过程中,单倍体精子和卵细胞结合形成二倍体合子,合子的染色体数目恢复到与亲代相同的水平。减数分裂和受精作用交替进行,维持了物种染色体数目的恒定性,保证了遗传信息的代代相传。

增加遗传多样性 (increasing genetic diversity):减数分裂通过以下两种机制增加了后代的遗传多样性:
▮▮▮▮ⓑ 同源染色体交叉互换 (crossing over between homologous chromosomes):在减数第一次分裂前期 I 的粗线期,同源染色体非姐妹染色单体之间发生交叉互换,导致染色体上基因的重组,产生新的基因组合。
▮▮▮▮ⓒ 同源染色体和姐妹染色单体的随机分离 (independent assortment of homologous chromosomes and sister chromatids):在减数第一次分裂后期 I,同源染色体随机分离,每对同源染色体中的哪一条进入子细胞是随机的。在减数第二次分裂后期 II,姐妹染色单体随机分离。染色体的随机分离导致配子中染色体组合的多样性,增加了后代的遗传变异。

遗传多样性是生物进化的基础,减数分裂产生的遗传变异为自然选择提供了原材料,使得生物种群能够适应不断变化的环境。

总之,减数分裂是有性生殖的关键环节,它不仅保证了配子的产生和物种染色体数目的恒定,更重要的是,通过交叉互换和染色体随机分离,创造了丰富的遗传多样性,为生物进化提供了无限的可能。

4. DNA的结构与复制 (DNA Structure and Replication)

深入解析DNA的分子结构,包括双螺旋结构、碱基配对原则,以及DNA复制的机制和酶学过程。

4.1 DNA的分子结构:双螺旋模型 (Molecular Structure of DNA: Double Helix Model)

详细介绍DNA的双螺旋结构模型,包括核苷酸的组成、碱基配对原则、磷酸二酯键的连接方式等。

4.1.1 核苷酸的组成:碱基、脱氧核糖、磷酸 (Components of Nucleotides: Bases, Deoxyribose, Phosphate)

介绍核苷酸的三个组成部分:碱基(嘌呤和嘧啶)、脱氧核糖和磷酸。

DNA,即脱氧核糖核酸 (Deoxyribonucleic acid),是生命的遗传物质,承载着生物体的遗传信息。其基本组成单位是脱氧核苷酸 (deoxyribonucleotide),简称核苷酸 (nucleotide)。每个核苷酸由三个部分构成:

碱基 (Base):DNA中含有四种不同的含氮碱基,它们均为杂环化合物,可以分为两大类:
嘌呤 (Purine):具有双环结构,包括 腺嘌呤 (Adenine, A)鸟嘌呤 (Guanine, G)
嘧啶 (Pyrimidine):具有单环结构,包括 胞嘧啶 (Cytosine, C)胸腺嘧啶 (Thymine, T)

这四种碱基是DNA遗传信息多样性的基础。在DNA分子中,碱基通过特定的配对方式相互作用,形成稳定的结构。

脱氧核糖 (Deoxyribose):是一种五碳糖,属于戊糖 (pentose)。与核糖 (ribose) 相比,脱氧核糖在2'碳原子上少一个氧原子,这也是“脱氧”的来源。脱氧核糖在核苷酸中连接碱基和磷酸基团,构成核苷酸的骨架部分。

磷酸 (Phosphate):是由磷原子和氧原子组成的酸根离子 \( (PO_4^{3-}) \)。在核苷酸中,磷酸基团连接在脱氧核糖的5'碳原子上。DNA分子中的磷酸基团不仅是核苷酸的组成部分,也参与连接相邻的核苷酸,形成DNA长链的骨架。

核苷酸的结构可以用简图表示如下:

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 磷酸基团 - 脱氧核糖 - 碱基

当碱基与脱氧核糖结合时,形成的结构称为 脱氧核苷 (deoxyribonucleoside),简称 核苷 (nucleoside)。核苷是核苷酸去除磷酸基团后的部分。核苷再与磷酸基团结合,就形成了完整的核苷酸。

理解核苷酸的组成是理解DNA结构的基础。这三个组分以特定的方式连接,构建出复杂而精巧的DNA分子,使其能够有效地存储和传递遗传信息。

4.1.2 DNA双螺旋结构:碱基配对与磷酸二酯键 (DNA Double Helix Structure: Base Pairing and Phosphodiester Bonds)

详细描述DNA双螺旋结构的形成,包括A-T、G-C碱基配对原则和磷酸二酯键的连接方式。

1953年,詹姆斯·沃森 (James Watson) 和弗朗西斯·克里克 (Francis Crick) 基于莫里斯·威尔金斯 (Maurice Wilkins) 和罗莎琳德·富兰克林 (Rosalind Franklin) 的X射线衍射数据,提出了著名的 DNA双螺旋模型 (double helix model),揭示了DNA分子的精巧结构,为分子遗传学奠定了基石。DNA双螺旋结构具有以下关键特征:

双螺旋结构 (Double Helix):DNA分子由两条多核苷酸链组成,这两条链围绕着共同的中心轴,呈反向平行的螺旋结构。形象地比喻为“梯子”,螺旋结构如同一个扭曲的梯子。

反向平行 (Antiparallel):DNA的两条链方向相反。一条链的走向是 5'→3',另一条链的走向是 3'→5'。这里的 5' 和 3' 指的是脱氧核糖上的碳原子编号。这种反向平行的排列方式对于DNA的复制和转录至关重要。

磷酸二酯键 (Phosphodiester Bond):在每一条DNA链内部,核苷酸之间通过 磷酸二酯键 (phosphodiester bond) 连接。磷酸二酯键形成于一个核苷酸的脱氧核糖 3'-OH 基团和下一个核苷酸的 5'-磷酸基团之间,通过脱水反应形成。磷酸二酯键构成了DNA链的骨架,赋予DNA分子稳定性和方向性。

碱基配对 (Base Pairing):两条DNA链通过碱基之间的 氢键 (hydrogen bond) 相互连接。碱基配对遵循严格的 互补配对原则 (complementary base pairing rule)
腺嘌呤 (A) 总是与 胸腺嘧啶 (T) 配对,形成两个氢键 (A=T)。
鸟嘌呤 (G) 总是与 胞嘧啶 (C) 配对,形成三个氢键 (G≡C)。

这种特定的碱基配对方式保证了DNA双螺旋结构的稳定性和遗传信息的准确传递。由于A与T配对,G与C配对,因此两条DNA链的碱基序列是互补的。如果已知一条链的序列,就可以推导出另一条链的序列。

螺旋参数 (Helix Parameters):DNA双螺旋具有一定的几何参数:
螺距 (pitch):螺旋每旋转一周的轴向距离,约为 3.4 纳米 (nm),即 34 埃 (Å)。
每圈碱基对数 (base pairs per turn):螺旋每旋转一周包含约 10.5 个碱基对。
碱基对间距 (base pair spacing):相邻碱基对之间的距离约为 0.34 纳米 (nm),即 3.4 埃 (Å)。
螺旋直径 (diameter):DNA双螺旋的直径约为 2 纳米 (nm),即 20 埃 (Å)。

大沟和小沟 (Major and Minor Grooves):由于碱基对在双螺旋中的位置并非完全对称,DNA双螺旋表面形成两条螺旋沟: 大沟 (major groove)小沟 (minor groove)。大沟和小沟为蛋白质等分子与DNA的相互作用提供了空间,例如,许多DNA结合蛋白通过识别大沟中的特定序列来调控基因表达。

DNA双螺旋结构是一个极其巧妙的设计,它既保证了遗传信息的稳定存储,又为信息的复制和表达提供了结构基础。碱基配对原则是DNA复制和转录的分子基础,而磷酸二酯键则确保了DNA分子的骨架稳定。理解DNA双螺旋结构是深入学习遗传学和分子生物学的关键。

4.2 DNA复制的机制 (Mechanism of DNA Replication)

详细描述DNA复制的半保留复制机制,以及复制的起始、延伸和终止过程。

DNA复制 (DNA replication) 是细胞生命周期中至关重要的过程,它确保了遗传信息能够准确地从亲代细胞传递到子代细胞。DNA复制是一个高度精确和复杂的过程,涉及多种酶和蛋白质的协同作用。

4.2.1 半保留复制 (Semi-conservative Replication)

解释DNA复制的半保留复制模式,以及实验证据。

DNA复制的方式主要有三种假设模型: 保守复制 (conservative replication)半保留复制 (semi-conservative replication)分散复制 (dispersive replication)

保守复制 (Conservative Replication):亲代DNA双链作为一个整体保留下来,复制产生的新DNA分子完全由新合成的核苷酸链组成。如同“保守”一词,原始模板完全不变,新分子完全是新的。

半保留复制 (Semi-conservative Replication):亲代DNA双链解开,每条链作为模板,合成一条新的互补链。因此,每个新产生的DNA分子都包含一条亲代链和一条新合成的子代链。如同“一半保留”,每个子代分子都有一半来自亲代。

分散复制 (Dispersive Replication):亲代DNA双链被打断成许多片段,新合成的DNA片段与亲代DNA片段相互混合,重新组合成新的DNA分子。结果是,每个新DNA分子都包含亲代和子代的DNA片段,呈“分散”状态。

1958年,马修·梅瑟尔森 (Matthew Meselson) 和富兰克林·斯塔尔 (Franklin Stahl) 通过 梅瑟尔森-斯塔尔实验 (Meselson-Stahl experiment),巧妙地证明了DNA复制是 半保留复制 (semi-conservative replication) 方式。

梅瑟尔森-斯塔尔实验 (Meselson-Stahl experiment) 的基本原理和步骤:

a. 细菌培养 (Bacterial Culture):首先,他们将大肠杆菌 ( E. coli ) 在含有重氮同位素 \( ^{15}N \) 的培养基中培养多代。由于细菌利用培养基中的氮合成DNA碱基,多代培养后,细菌DNA中的氮原子几乎全部被 \( ^{15}N \) 取代,形成 重DNA (heavy DNA)。重DNA分子比正常DNA分子密度大。

b. 转移培养基 (Transfer to Light Medium):然后,将含有 \( ^{15}N \)-DNA 的细菌转移到含有轻氮同位素 \( ^{14}N \) 的培养基中培养。在 \( ^{14}N \) 培养基中,新合成的DNA链将使用 \( ^{14}N \) 作为原料,形成 轻DNA (light DNA)

c. 密度梯度离心 (Density Gradient Centrifugation):在不同世代提取细菌DNA,通过 氯化铯 (CsCl) 密度梯度离心 (cesium chloride density gradient centrifugation) 技术分离不同密度的DNA分子。密度梯度离心可以根据DNA分子的密度将其分离到不同的位置。重DNA沉降到管底,轻DNA漂浮在管顶,而密度介于两者之间的DNA则位于中间位置。

d. 实验结果分析 (Analysis of Results)
第0代 (Generation 0):在 \( ^{14}N \) 培养基中培养 0 代后,离心结果显示,DNA全部位于重DNA位置,表明初始DNA均为 \( ^{15}N \)-DNA。
第1代 (Generation 1):培养 1 代后,离心结果显示,DNA全部位于中间密度位置,表明DNA分子密度介于重DNA和轻DNA之间。这个结果否定了保守复制模型,因为如果是保守复制,应该同时出现重DNA和轻DNA两个条带。
第2代 (Generation 2):培养 2 代后,离心结果显示,DNA出现两个条带,一个位于中间密度位置,另一个位于轻DNA位置,且轻DNA条带的量与中间密度条带的量相当。这个结果支持了半保留复制模型,也否定了分散复制模型,因为如果是分散复制,每一代的DNA密度都应该逐渐变轻,不会出现清晰的条带分离。

实验结论 (Experimental Conclusion):梅瑟尔森-斯塔尔实验的实验结果有力地证明了DNA复制是 半保留复制 (semi-conservative replication) 方式。每个新合成的DNA分子都由一条亲代链和一条新合成的子代链组成,这与半保留复制模型的预测完全吻合。这一实验结果是分子生物学发展史上的一个里程碑,为后续DNA复制机制的研究奠定了基础。

4.2.2 DNA复制的起始、延伸与终止 (Initiation, Elongation, and Termination of DNA Replication)

详细描述DNA复制的起始、延伸和终止过程,包括复制叉的形成和移动。

DNA复制是一个有序且精确的过程,可以分为三个主要阶段: 起始 (initiation)延伸 (elongation)终止 (termination)

起始 (Initiation):DNA复制起始于染色体上特定的 复制起始位点 (origin of replication, ORI)。在细菌等原核生物中,染色体通常只有一个复制起始位点。而在真核生物中,染色体上有多个复制起始位点,以加速复制过程。

a. 复制起始位点识别 (ORI Recognition):起始蛋白 (initiator protein),如大肠杆菌的 DnaA蛋白 (DnaA protein),识别并结合到复制起始位点 (ORI) 的特定DNA序列上。

b. DNA解链 (DNA Unwinding):结合后,起始蛋白促使DNA双链在ORI区域解开,形成 复制泡 (replication bubble)。解链过程需要 解旋酶 (helicase) 的参与,解旋酶能够破坏碱基对之间的氢键,进一步解开双螺旋结构。 单链DNA结合蛋白 (single-stranded DNA-binding protein, SSB) 结合到解开的单链DNA上,防止单链重新退火形成双链,保持单链DNA的状态,为后续的复制酶提供模板。

c. 引物合成 (Primer Synthesis):DNA聚合酶 (DNA polymerase) 只能在已有的 3'-OH 末端添加核苷酸,而不能从头开始合成DNA链。因此,DNA复制需要 引物酶 (primase) 合成一段短的RNA序列,作为 引物 (primer),提供 3'-OH 末端。在真核生物中,引物酶是 DNA聚合酶α (DNA polymerase α) 的亚基之一。

延伸 (Elongation):DNA复制的延伸阶段是合成新的DNA链的过程。这个过程主要由 DNA聚合酶 (DNA polymerase) 负责。

a. DNA聚合酶作用 (DNA Polymerase Action):DNA聚合酶沿着DNA模板链移动,根据碱基互补配对原则,将游离的脱氧核苷三磷酸 (dNTPs) 添加到引物的 3'-OH 末端,形成磷酸二酯键,延伸新的DNA链。DNA聚合酶只能沿着 5'→3' 方向合成DNA链。

b. 前导链与滞后链 (Leading Strand and Lagging Strand):由于DNA两条链是反向平行的,且DNA聚合酶只能 5'→3' 合成,因此DNA复制过程中,一条链是 连续合成 (continuous synthesis) 的,称为 前导链 (leading strand);另一条链是 不连续合成 (discontinuous synthesis) 的,称为 滞后链 (lagging strand)

前导链合成 (Leading Strand Synthesis):前导链的合成方向与复制叉 (replication fork) 的移动方向一致,只需要一个RNA引物,DNA聚合酶可以连续不断地沿着模板链 5'→3' 方向合成。

滞后链合成 (Lagging Strand Synthesis):滞后链的合成方向与复制叉的移动方向相反,DNA聚合酶只能从复制叉向后,不连续地合成一系列短的DNA片段,称为 冈崎片段 (Okazaki fragments)。每个冈崎片段都需要一个新的RNA引物。

c. 复制叉的移动 (Replication Fork Movement):随着DNA复制的进行,复制泡不断扩大,形成 复制叉 (replication fork)。复制叉是DNA复制的Y型结构,是DNA解链和新链合成的场所。复制叉沿着DNA分子双向移动 (bidirectional replication),使得复制效率更高。

终止 (Termination):DNA复制终止于复制叉相遇或到达染色体末端。

a. 复制叉相遇 (Replication Fork Meeting):在环状染色体 (如细菌染色体) 中,复制从一个起始位点双向进行,最终两个复制叉在染色体末端相遇,复制终止。

b. 复制终止位点 (Termination Site):在某些生物中,染色体上存在特定的 复制终止位点 (termination site),终止蛋白 (termination protein) 结合到终止位点,阻碍复制叉的移动,导致复制终止。例如,在大肠杆菌中, Tus蛋白 (Tus protein) 结合到 Ter位点 (Ter site),阻止复制叉的移动。

c. 引物去除与连接 (Primer Removal and Ligation):RNA引物在DNA复制完成后需要被去除,并用DNA序列替换。 DNA聚合酶I (DNA polymerase I) (在原核生物中) 或 核酸外切酶 (exonuclease) (在真核生物中) 具有 5'→3' 核酸外切酶活性,可以去除RNA引物。然后,DNA聚合酶利用相邻冈崎片段的 3'-OH 末端作为引物,填补去除RNA引物后留下的空隙。最后, DNA连接酶 (DNA ligase) 催化相邻DNA片段 3'-OH 末端和 5'-磷酸末端之间形成磷酸二酯键,连接冈崎片段,形成完整的DNA链。

DNA复制是一个高度协调和精确的过程,确保了遗传信息的准确传递。复制起始的精确调控、延伸过程的高效进行以及终止的准确完成,都依赖于多种酶和蛋白质的协同作用。任何环节的错误都可能导致基因突变,影响细胞的正常功能。

4.3 DNA复制的酶学 (Enzymology of DNA Replication)

介绍参与DNA复制的关键酶类,如DNA聚合酶、解旋酶、引物酶、连接酶等,以及它们的功能。

DNA复制是一个酶促反应过程,需要多种酶和蛋白质的协同作用才能完成。这些酶各司其职,共同保证了DNA复制的高效性和准确性。以下介绍DNA复制中几种关键的酶类及其功能:

4.3.1 DNA聚合酶 (DNA Polymerases)

介绍DNA聚合酶的种类和功能,包括DNA聚合酶的聚合活性和校对功能。

DNA聚合酶 (DNA polymerase, Pol) 是DNA复制的核心酶,负责催化DNA链的延伸。DNA聚合酶具有以下几个重要的酶学活性:

聚合酶活性 (Polymerase Activity):DNA聚合酶能够识别DNA模板链,并根据碱基互补配对原则,将游离的脱氧核苷三磷酸 (dNTPs) 添加到已存在引物的 3'-OH 末端,形成磷酸二酯键,延伸DNA链。聚合反应的方向是 5'→3'。

外切酶活性 (Exonuclease Activity):某些DNA聚合酶还具有外切酶活性,可以水解核酸链末端的核苷酸。外切酶活性通常有两种类型:
3'→5' 外切酶活性 (3'→5' Exonuclease Activity):也称为 校对 (proofreading) 活性。这种活性允许DNA聚合酶在聚合过程中,如果插入了错误的核苷酸,可以立即将其切除,然后重新插入正确的核苷酸。这种校对功能大大提高了DNA复制的准确性,降低了突变率。
5'→3' 外切酶活性 (5'→3' Exonuclease Activity):某些DNA聚合酶 (如大肠杆菌的DNA聚合酶I) 具有 5'→3' 外切酶活性,可以切除DNA链 5' 末端的核苷酸,例如在DNA复制终止阶段,去除RNA引物。

引物依赖性 (Primer Dependency):DNA聚合酶不能从头开始合成DNA链,必须依赖于已存在的引物提供 3'-OH 末端才能开始聚合反应。

不同生物中的DNA聚合酶种类和功能有所不同:

原核生物 (Prokaryotes):以大肠杆菌为例,主要有三种DNA聚合酶:

DNA聚合酶I (DNA Pol I)
▮▮▮▮⚝ 具有 5'→3' 聚合酶活性、 3'→5' 外切酶活性和 5'→3' 外切酶活性
▮▮▮▮⚝ 主要功能是 去除RNA引物,并用DNA填补空隙,以及参与DNA修复。
▮▮▮▮⚝ 聚合速度较慢,加工性 (processivity) 较低。

DNA聚合酶II (DNA Pol II)
▮▮▮▮⚝ 具有 5'→3' 聚合酶活性和 3'→5' 外切酶活性。
▮▮▮▮⚝ 主要参与 DNA修复,在正常DNA复制中的作用较小。

DNA聚合酶III (DNA Pol III)
▮▮▮▮⚝ 主要的复制酶,具有 高聚合速度高加工性
▮▮▮▮⚝ 具有 5'→3' 聚合酶活性和 3'→5' 外切酶活性 (校对功能)
▮▮▮▮⚝ DNA聚合酶III 是一个 多亚基复合体 (holoenzyme),包含多个亚基,协同完成DNA复制。核心酶复合体 (core enzyme) 负责聚合反应,β-滑环 (β-clamp) 提高加工性,γ-复合体 (γ-complex) 负责组装和卸载β-滑环。

真核生物 (Eukaryotes):真核生物细胞核内有多种DNA聚合酶,主要包括:

DNA聚合酶α (Pol α)
▮▮▮▮⚝ 具有 引物酶活性 (primase activity),可以合成RNA引物。
▮▮▮▮⚝ 聚合酶活性 缺乏 3'→5' 外切酶活性 (无校对功能)
▮▮▮▮⚝ 主要功能是 起始DNA复制,合成RNA引物和少量DNA,为后续的DNA聚合酶δ 和 ε 提供引物。

DNA聚合酶δ (Pol δ)
▮▮▮▮⚝ 主要的滞后链合成酶,具有 高加工性3'→5' 外切酶活性 (校对功能)
▮▮▮▮⚝ 参与 冈崎片段的合成DNA修复

DNA聚合酶ε (Pol ε)
▮▮▮▮⚝ 主要的前导链合成酶,具有 高加工性3'→5' 外切酶活性 (校对功能)
▮▮▮▮⚝ 参与 前导链的连续合成DNA修复

DNA聚合酶β (Pol β)
▮▮▮▮⚝ 参与DNA修复,特别是碱基切除修复 (base excision repair, BER)。
▮▮▮▮⚝ 缺乏 3'→5' 外切酶活性。

DNA聚合酶γ (Pol γ)
▮▮▮▮⚝ 线粒体DNA复制酶
▮▮▮▮⚝ 具有 3'→5' 外切酶活性。

DNA聚合酶的多样性和特异性反映了DNA复制过程的复杂性和精确性要求。不同类型的DNA聚合酶在DNA复制的不同阶段发挥着关键作用,共同保证了遗传信息的准确传递。

4.3.2 其他复制酶类:解旋酶、引物酶、连接酶等 (Other Replication Enzymes: Helicases, Primases, Ligases, etc.)

介绍其他参与DNA复制的重要酶类及其功能,如解旋酶、引物酶、连接酶、拓扑异构酶等。

除了DNA聚合酶,DNA复制还需要多种辅助酶和蛋白质的参与,共同完成DNA的解链、引物合成、片段连接等步骤。以下介绍几种重要的辅助酶类:

解旋酶 (Helicase)
▮▮▮▮⚝ 功能:解旋酶是一类 ATP依赖性 (ATP-dependent) 的酶,能够利用ATP水解提供的能量, 解开DNA双螺旋结构,破坏碱基对之间的氢键,形成单链DNA,为后续的复制过程提供模板。
▮▮▮▮⚝ 作用方式:解旋酶通常在复制叉的前端移动,沿着DNA链 5'→3' 或 3'→5' 方向移动,解开双螺旋。
▮▮▮▮⚝ 实例:大肠杆菌的 DnaB解旋酶 (DnaB helicase) 和真核生物的 MCM复合体 (MCM complex) 等。

引物酶 (Primase)
▮▮▮▮⚝ 功能:引物酶是一种 RNA聚合酶 (RNA polymerase),能够 从头开始合成短的RNA引物。RNA引物为DNA聚合酶提供 3'-OH 末端,启动DNA链的合成。
▮▮▮▮⚝ 作用方式:引物酶在DNA模板链上识别复制起始位点,并合成一段长度约为 10 个核苷酸的RNA引物。
▮▮▮▮⚝ 实例:大肠杆菌的 DnaG引物酶 (DnaG primase) 和真核生物的 DNA聚合酶α (Pol α) 的引物酶亚基 等。

单链DNA结合蛋白 (Single-Stranded DNA-Binding Protein, SSB)
▮▮▮▮⚝ 功能:SSB 是一类 不具有酶活性的蛋白质,能够 结合到单链DNA上,防止单链DNA重新退火形成双链,保持单链DNA的状态,并保护单链DNA免受核酸酶的降解。
▮▮▮▮⚝ 作用方式:SSB 协同解旋酶工作,稳定解开的单链DNA,为DNA聚合酶提供模板。
▮▮▮▮⚝ 实例:大肠杆菌的 SSB蛋白 (SSB protein) 和真核生物的 RPA蛋白 (replication protein A, RPA) 等。

DNA连接酶 (DNA Ligase)
▮▮▮▮⚝ 功能:DNA连接酶催化 DNA片段之间形成磷酸二酯键,连接DNA片段。在DNA复制中,DNA连接酶主要负责 连接冈崎片段,形成完整的滞后链。
▮▮▮▮⚝ 作用方式:DNA连接酶识别DNA链中的缺口 (nick),即 3'-OH 末端和 5'-磷酸末端相邻但不连接的情况,利用ATP或NAD+提供的能量,催化形成磷酸二酯键,封闭缺口。
▮▮▮▮⚝ 实例:大肠杆菌的 DNA连接酶 (DNA ligase) 和真核生物的 DNA连接酶I (DNA ligase I) 等。

拓扑异构酶 (Topoisomerase)
▮▮▮▮⚝ 功能:拓扑异构酶是一类 能够改变DNA拓扑结构 的酶。在DNA复制过程中,DNA双螺旋解链会导致DNA分子前方产生 正超螺旋 (positive supercoiling),增加DNA分子的扭曲程度,阻碍复制叉的移动。拓扑异构酶能够 解除DNA复制过程中的拓扑张力,保证DNA复制的顺利进行。
▮▮▮▮⚝ 作用方式:拓扑异构酶通过 切断DNA链,使DNA分子旋转,然后 重新连接DNA链,从而改变DNA的拓扑结构。拓扑异构酶分为 I型拓扑异构酶 (type I topoisomerase)II型拓扑异构酶 (type II topoisomerase)
I型拓扑异构酶:切断一条DNA链,解除超螺旋,不需要ATP。
II型拓扑异构酶:切断双链DNA,解除更复杂的拓扑结构,需要ATP。 DNA促旋酶 (DNA gyrase) 是一种II型拓扑异构酶,在细菌DNA复制中发挥重要作用。
▮▮▮▮⚝ 实例:大肠杆菌的 DNA促旋酶 (DNA gyrase) 和真核生物的 拓扑异构酶I (topoisomerase I)拓扑异构酶II (topoisomerase II) 等。

滑动夹 (Sliding Clamp)
▮▮▮▮⚝ 功能:滑动夹是一种 环状蛋白质,能够 套在DNA双链上,与DNA聚合酶相互作用, 提高DNA聚合酶的加工性 (processivity)。加工性是指DNA聚合酶在不脱离模板的情况下,连续合成DNA链的能力。
▮▮▮▮⚝ 作用方式:滑动夹将DNA聚合酶固定在DNA模板上,防止DNA聚合酶在复制过程中脱落,使得DNA聚合酶能够连续合成更长的DNA链,提高复制效率。
▮▮▮▮⚝ 实例:大肠杆菌的 β-滑环 (β-clamp) 和真核生物的 PCNA (增殖细胞核抗原, proliferating cell nuclear antigen) 等。

这些酶类和蛋白质相互协作,构成了一个高效、精确的DNA复制机器 (replisome),保证了遗传信息的准确复制和传递,维持了生命的连续性。对DNA复制酶学的深入理解,不仅有助于我们认识生命的基本过程,也为开发抗病毒药物和抗肿瘤药物提供了重要的靶点。

5. 基因表达:转录与翻译 (Gene Expression: Transcription and Translation)

摘要

本章深入探讨了基因表达的核心过程——转录 (transcription) 和翻译 (translation),并阐述了基因表达的中心法则 (central dogma)。我们将详细解析遗传信息如何从 DNA (脱氧核糖核酸) 传递到 RNA (核糖核酸),最终指导蛋白质 (protein) 的合成。此外,本章还将介绍不同种类 RNA 的结构、功能及其在基因表达调控中的作用,为理解基因的功能和调控奠定基础。

5.1 基因表达的中心法则 (Central Dogma of Gene Expression)

摘要

本节将介绍基因表达的中心法则,阐述遗传信息从 DNA 流向 RNA 再到蛋白质的基本途径,并讨论逆转录 (reverse transcription) 等对中心法则的例外情况。

5.1.1 DNA -> RNA -> 蛋白质 (DNA -> RNA -> Protein)

基因表达的中心法则 🧬 是分子生物学的核心概念,它描述了细胞内遗传信息传递的基本方向,即从 DNA 到 RNA 再到蛋白质,通常用以下公式表示:

\[ \text{DNA} \xrightarrow{\text{转录 (Transcription)}} \text{RNA} \xrightarrow{\text{翻译 (Translation)}} \text{蛋白质 (Protein)} \]

DNA (脱氧核糖核酸):作为遗传信息的载体,DNA 存储着生物体生长、发育和繁殖所需的全部遗传信息。DNA 分子具有稳定的双螺旋结构,能够长期存储和精确复制遗传信息。

转录 (Transcription):转录是指以 DNA 为模板合成 RNA 的过程。在细胞核内,特定的 DNA 片段(基因,gene)被 RNA 聚合酶 (RNA polymerase) 识别并结合。RNA 聚合酶解开 DNA 双螺旋,以其中一条链(模板链,template strand)为模板,按照碱基互补配对原则(A 与 U 配对,G 与 C 配对),合成与 DNA 模板链互补的 RNA 分子。新合成的 RNA 分子携带了 DNA 基因中的遗传信息。

RNA (核糖核酸):RNA 是遗传信息传递的中间分子。与 DNA 相比,RNA 通常为单链结构,含有核糖 (ribose) 而非脱氧核糖,以及尿嘧啶 (uracil, U) 碱基代替胸腺嘧啶 (thymine, T)。在基因表达过程中,主要有以下几种重要的 RNA 类型:
▮▮▮▮ⓑ 信使 RNA (mRNA, messenger RNA):mRNA 是将 DNA 上的遗传信息传递到核糖体 (ribosome) 的信使。mRNA 分子携带编码蛋白质氨基酸序列的遗传密码 (genetic code)。
▮▮▮▮ⓒ 转运 RNA (tRNA, transfer RNA):tRNA 在翻译过程中起着桥梁作用。每种 tRNA 分子能够特异性地识别 mRNA 上的密码子 (codon) 并携带相应的氨基酸 (amino acid) 到达核糖体,参与蛋白质的合成。
▮▮▮▮ⓓ 核糖体 RNA (rRNA, ribosomal RNA):rRNA 是核糖体的重要组成成分。核糖体是由 rRNA 和蛋白质组成的复合物,是蛋白质合成的场所。rRNA 在核糖体的结构和催化活性中发挥关键作用。

翻译 (Translation):翻译是指以 mRNA 为模板,在核糖体上将 mRNA 上的遗传密码翻译成蛋白质氨基酸序列的过程。在翻译过程中,mRNA、tRNA 和核糖体协同作用。核糖体沿着 mRNA 分子移动,tRNA 识别 mRNA 上的密码子并携带相应的氨基酸,氨基酸之间通过肽键 (peptide bond) 连接,逐步合成多肽链 (polypeptide chain)。多肽链经过折叠和修饰,最终形成具有特定功能的蛋白质分子。

蛋白质 (Protein):蛋白质是生命活动的主要承担者。细胞内的各种生命活动,如催化代谢反应、运输物质、调控基因表达、构成细胞结构等,都离不开蛋白质的参与。蛋白质的结构和功能多样性决定了生物体的复杂性和多样性。

总结来说,中心法则描述了遗传信息从 DNA 复制、转录到翻译,最终实现基因表达的完整过程。DNA 存储信息,RNA 传递信息,蛋白质执行功能,这三者共同构成了生命活动的基础。

5.1.2 逆转录及其他例外情况 (Reverse Transcription and Other Exceptions)

虽然 “DNA -> RNA -> 蛋白质” 是基因表达的主要途径,但在生物界也存在一些对中心法则的例外情况,其中最著名的就是 逆转录 (reverse transcription)

逆转录 (Reverse Transcription)
▮▮▮▮ⓑ 逆转录病毒 (Retrovirus):某些病毒,如人类免疫缺陷病毒 (HIV, Human Immunodeficiency Virus),属于逆转录病毒。这类病毒的遗传物质是 RNA 而非 DNA。
▮▮▮▮ⓒ 逆转录酶 (Reverse Transcriptase):逆转录病毒携带一种特殊的酶,称为逆转录酶。逆转录酶能够以 RNA 为模板,反向合成 DNA,这个过程称为逆转录。
▮▮▮▮ⓓ 逆转录过程:逆转录病毒感染宿主细胞后,首先通过逆转录酶将自身的 RNA 基因组逆转录成 DNA。然后,这段 DNA 可以整合到宿主细胞的基因组中,并像宿主细胞的基因一样进行转录和翻译,合成病毒的 RNA 和蛋白质,最终组装成新的病毒颗粒。

逆转录的发现 🔬 颠覆了传统的中心法则,表明遗传信息的流动并非总是单向的 “DNA -> RNA”。逆转录在病毒复制、基因组进化以及生物技术领域都具有重要意义。例如,逆转录酶被广泛应用于 cDNA (互补 DNA, complementary DNA) 文库的构建、基因克隆和 PCR (聚合酶链式反应, Polymerase Chain Reaction) 等分子生物学实验中。

其他例外情况
▮▮▮▮ⓑ RNA 复制 (RNA Replication):某些 RNA 病毒,如流感病毒 (influenza virus) 和 SARS-CoV-2 病毒,其遗传物质也是 RNA。这类病毒在复制过程中,可以直接以 RNA 为模板合成 RNA,而不需要经过 DNA 中间步骤。RNA 复制酶 (RNA-dependent RNA polymerase) 催化 RNA 的复制过程。
▮▮▮▮ⓒ RNA 编辑 (RNA Editing):在某些情况下,RNA 分子的序列可以在转录后发生改变,这个过程称为 RNA 编辑。RNA 编辑可以改变 mRNA 的编码信息,导致翻译出的蛋白质与基因组 DNA 编码的蛋白质序列有所不同。RNA 编辑机制增加了基因表达的多样性。
▮▮▮▮ⓓ 朊病毒 (Prion):朊病毒是一种具有感染性的蛋白质分子,它不含有核酸 (DNA 或 RNA) 遗传物质。朊病毒能够通过改变正常蛋白质的构象,使其转变成具有致病性的朊病毒,并不断复制和传播。朊病毒疾病的发生机制挑战了传统的遗传信息传递模式。

尽管存在这些例外情况,但中心法则 “DNA -> RNA -> 蛋白质” 仍然是生物学中最基本的原理之一,它概括了基因表达和遗传信息传递的主流模式。对中心法则的深入理解是学习遗传学和分子生物学的基石。

5.2 转录:从DNA到RNA (Transcription: From DNA to RNA)

摘要

本节将详细描述转录的过程,包括转录的起始 (initiation)、延伸 (elongation) 和终止 (termination) 阶段,以及 RNA 聚合酶 (RNA polymerase) 在转录过程中的作用。

5.2.1 RNA聚合酶与转录起始 (RNA Polymerase and Transcription Initiation)

RNA 聚合酶 (RNA Polymerase):RNA 聚合酶是催化转录过程的关键酶。它能够识别 DNA 上的特定序列,解开 DNA 双螺旋,并以 DNA 模板链为模板合成 RNA 分子。不同生物的细胞中存在不同类型的 RNA 聚合酶,例如:
▮▮▮▮ⓑ 原核生物 RNA 聚合酶 (Prokaryotic RNA Polymerase):细菌等原核生物通常只含有一种 RNA 聚合酶,负责合成所有类型的 RNA (mRNA, tRNA, rRNA)。原核生物 RNA 聚合酶由多个亚基组成,包括 α, β, β', σ 和 ω 亚基。其中,σ 亚基 (sigma factor) 负责识别 DNA 上的启动子 (promoter) 序列,指导 RNA 聚合酶结合到正确的起始位点。
▮▮▮▮ⓒ 真核生物 RNA 聚合酶 (Eukaryotic RNA Polymerases):真核生物细胞核内通常含有三种主要的 RNA 聚合酶:
▮▮▮▮▮▮▮▮❹ RNA 聚合酶 I (RNA polymerase I, Pol I):主要负责转录 rRNA 基因 (rDNA),合成 rRNA 的前体分子 (pre-rRNA)。
▮▮▮▮▮▮▮▮❺ RNA 聚合酶 II (RNA polymerase II, Pol II):主要负责转录 mRNA 基因 (protein-coding genes) 和 snRNA 基因 (small nuclear RNA genes),合成 mRNA 前体 (pre-mRNA) 和 snRNA。Pol II 对基因表达调控非常敏感,需要多种转录因子 (transcription factors) 的辅助才能启动转录。
▮▮▮▮▮▮▮▮❻ RNA 聚合酶 III (RNA polymerase III, Pol III):主要负责转录 tRNA 基因、5S rRNA 基因和其他小 RNA 基因,合成 tRNA、5S rRNA 和其他小 RNA。

启动子 (Promoter):启动子是 DNA 上位于基因起始位点上游的特定 DNA 序列,是 RNA 聚合酶识别和结合的位点,决定了基因转录的起始位置和方向。
▮▮▮▮ⓑ 原核生物启动子:典型的原核生物启动子包含两个保守序列:-10 区 (Pribnow box, TATAAT 序列) 和 -35 区 (TTGACA 序列),位于转录起始位点上游 10 个碱基对和 35 个碱基对附近。σ 因子识别并结合 -10 区和 -35 区,引导 RNA 聚合酶正确结合到启动子区域。
▮▮▮▮ⓒ 真核生物启动子:真核生物启动子结构更加复杂多样。常见的真核生物启动子元件包括:
▮▮▮▮▮▮▮▮❹ 核心启动子 (core promoter):位于转录起始位点附近,包含 TATA 盒 (TATA box, TATAAA 序列,约位于起始位点上游 -25 处)、起始位点选择区 (INR, initiator) 和下游启动子元件 (DPE, downstream promoter element) 等。TATA 盒是 RNA 聚合酶 II 和通用转录因子 (general transcription factors, GTFs) 结合的重要位点。
▮▮▮▮▮▮▮▮❺ 近端启动子区 (proximal promoter region):位于核心启动子上游,包含 CAAT 盒、GC 盒等调控元件,可以结合特异性转录因子,调控基因的转录效率。
▮▮▮▮▮▮▮▮❻ 远端调控元件 (distal regulatory elements):位于启动子远端,包括增强子 (enhancer) 和沉默子 (silencer) 等。增强子可以增强基因的转录活性,沉默子则抑制基因的转录活性。这些元件可以结合激活蛋白 (activator protein) 或抑制蛋白 (repressor protein),远程调控基因的表达。

转录起始 (Transcription Initiation):转录起始是转录过程的第一步,包括以下步骤:
▮▮▮▮ⓑ RNA 聚合酶结合启动子:在 σ 因子 (原核生物) 或通用转录因子 (真核生物) 的辅助下,RNA 聚合酶识别并结合到启动子区域。
▮▮▮▮ⓒ 形成转录起始复合物 (Transcription Initiation Complex):真核生物中,通用转录因子 (如 TFIIB, TFIID, TFIIE, TFIIF, TFIIH) 依次与启动子结合,形成转录起始前复合物 (preinitiation complex, PIC)。TFIID 中的 TATA 结合蛋白 (TBP, TATA-binding protein) 识别并结合 TATA 盒,是 PIC 组装的关键步骤。
▮▮▮▮ⓓ DNA 双螺旋解开:RNA 聚合酶或 TFIIH (具有解旋酶活性) 解开启动子区域的 DNA 双螺旋,形成转录泡 (transcription bubble),暴露出 DNA 模板链。
▮▮▮▮ⓔ RNA 合成起始:RNA 聚合酶以 DNA 模板链为模板,按照碱基互补配对原则,将游离的核糖核苷三磷酸 (rNTPs) 聚合起来,合成最初几个核苷酸的 RNA 片段。
▮▮▮▮ⓕ 启动子逃逸 (Promoter Escape):当 RNA 链达到一定长度后,RNA 聚合酶从启动子区域解离,进入延伸阶段。σ 因子 (原核生物) 或部分通用转录因子 (真核生物) 在启动子逃逸后可能会解离。

转录因子 (Transcription Factors):转录因子是一类能够与 DNA 特定序列结合,调控基因转录的蛋白质。转录因子分为通用转录因子和特异性转录因子。
▮▮▮▮ⓑ 通用转录因子 (General Transcription Factors, GTFs):真核生物 RNA 聚合酶 II 转录 mRNA 基因时,需要一组通用转录因子的辅助。GTFs 参与形成转录起始复合物,定位 RNA 聚合酶 II 到启动子,解开 DNA 双螺旋,启动 RNA 合成。
▮▮▮▮ⓒ 特异性转录因子 (Specific Transcription Factors):特异性转录因子能够识别并结合基因启动子或增强子上的特定 DNA 序列,激活或抑制基因的转录。特异性转录因子在基因表达调控中发挥重要作用,参与细胞分化、发育和对环境刺激的响应。特异性转录因子通常具有模块化的结构,包括 DNA 结合域 (DNA-binding domain, DBD) 和激活域 (activation domain) 或抑制域 (repression domain)。

5.2.2 转录的延伸与终止 (Transcription Elongation and Termination)

转录延伸 (Transcription Elongation):转录延伸是指 RNA 聚合酶沿着 DNA 模板链移动,不断合成 RNA 分子的过程。转录延伸过程包括以下步骤:
▮▮▮▮ⓑ DNA 双螺旋解旋:RNA 聚合酶前端解开 DNA 双螺旋,形成转录泡,暴露出 DNA 模板链。
▮▮▮▮ⓒ 碱基配对与 RNA 链合成:RNA 聚合酶识别 DNA 模板链上的碱基序列,按照碱基互补配对原则 (A-U, G-C),将游离的核糖核苷三磷酸 (rNTPs) 逐个添加到 RNA 链的 3'-OH 末端,形成磷酸二酯键 (phosphodiester bond)。RNA 链的合成方向为 5' -> 3',与 DNA 模板链方向相反。
▮▮▮▮ⓓ DNA 双螺旋复原:RNA 聚合酶后端 DNA 双螺旋重新形成。新合成的 RNA 链与 DNA 模板链形成 RNA-DNA 杂合链,但很快与 DNA 模板链分离,释放出来。
▮▮▮▮ⓔ 转录泡移动:RNA 聚合酶沿着 DNA 模板链不断移动,转录泡也随之移动,持续合成 RNA 分子。

转录终止 (Transcription Termination):转录终止是指 RNA 聚合酶在到达转录终止信号后,停止 RNA 合成,并从 DNA 模板上释放 RNA 分子的过程。转录终止机制在原核生物和真核生物中有所不同:
▮▮▮▮ⓑ 原核生物转录终止:原核生物转录终止主要有两种机制:
▮▮▮▮▮▮▮▮❸ ρ 依赖性终止 (Rho-dependent termination):依赖于 ρ 因子 (Rho factor) 的参与。ρ 因子是一种 ATP 酶,能够结合到 RNA 分子的特定序列 (rut 位点, Rho utilization site),沿着 RNA 链向 RNA 聚合酶方向移动。当 RNA 聚合酶在终止位点附近停顿 (stall) 时,ρ 因子追上 RNA 聚合酶,利用 ATP 水解提供的能量,解开 RNA-DNA 杂合链,导致 RNA 分子和 RNA 聚合酶从 DNA 模板上释放。
▮▮▮▮▮▮▮▮❹ ρ 非依赖性终止 (Rho-independent termination):不依赖于 ρ 因子,也称为内在终止 (intrinsic termination)。终止信号是 DNA 模板链上的一段富含 GC 的反向重复序列,转录形成的 RNA 分子可以折叠成发夹结构 (hairpin loop)。发夹结构后紧跟着一段富含 U 的序列。发夹结构的形成导致 RNA 聚合酶停顿,RNA-DNA 杂合链中 A-U 碱基对稳定性较弱,容易解离,最终导致转录终止。
▮▮▮▮ⓔ 真核生物转录终止:真核生物 RNA 聚合酶 II 转录终止机制较为复杂,与 RNA 的加工修饰密切相关。
▮▮▮▮▮▮▮▮❻ 多聚腺苷酸化信号 (polyadenylation signal):真核生物 mRNA 前体 (pre-mRNA) 的 3' 端加工需要多聚腺苷酸化信号序列 (poly(A) signal, AAUAAA 序列)。当 RNA 聚合酶 II 转录到多聚腺苷酸化信号序列下游时,pre-mRNA 被切割,并在 3' 端添加多聚腺苷酸尾巴 (poly(A) tail)。
▮▮▮▮▮▮▮▮❼ 鱼雷模型 (torpedo model):RNA 聚合酶 II 转录过终止位点后,仍然继续转录一段 RNA。5' -> 3' 外切核酸酶 (exonuclease) Xrn2 结合到新转录出的 RNA 链的 5' 端,并沿着 RNA 链向 RNA 聚合酶方向移动,像 “鱼雷” 一样追赶 RNA 聚合酶。当 Xrn2 追上 RNA 聚合酶时,导致转录终止复合物解体,RNA 聚合酶和 RNA 分子从 DNA 模板上释放。

RNA 加工修饰 (RNA Processing):真核生物转录产生的 RNA 分子需要经过一系列加工修饰,才能成为成熟的、具有功能的 RNA 分子。mRNA 的加工修饰主要包括:
▮▮▮▮ⓑ 5' 端加帽 (5' Capping):在 mRNA 前体的 5' 端添加一个 7-甲基鸟嘌呤核苷 (7-methylguanosine) 帽子结构。加帽有助于 mRNA 的稳定性、核糖体结合和翻译起始。
▮▮▮▮ⓒ 3' 端加尾 (3' Polyadenylation):在 mRNA 前体的 3' 端添加一段由多个腺嘌呤核苷酸组成的 poly(A) 尾巴。加尾有助于 mRNA 的稳定性、翻译和 mRNA 从细胞核输出到细胞质。
▮▮▮▮ⓓ RNA 剪接 (RNA Splicing):真核生物基因通常由外显子 (exon) 和内含子 (intron) 组成。转录产生的 mRNA 前体 (pre-mRNA) 包含外显子和内含子序列。RNA 剪接是指切除 pre-mRNA 中的内含子序列,并将外显子序列连接起来,形成成熟 mRNA 的过程。剪接体 (spliceosome) 是一种由 snRNA 和蛋白质组成的复合物,催化 RNA 剪接反应。
▮▮▮▮▮▮▮▮❺ 构成型剪接 (Constitutive Splicing):所有内含子都被切除,外显子按照基因组上的顺序连接起来。
▮▮▮▮▮▮▮▮❻ 选择性剪接 (Alternative Splicing):某些 pre-mRNA 可以通过不同的剪接方式,将不同的外显子组合起来,产生多种不同的成熟 mRNA 和蛋白质异构体 (protein isoform)。选择性剪接是增加基因表达多样性的重要机制。

tRNA 和 rRNA 也需要经过加工修饰才能成熟。tRNA 的加工包括 5' 端和 3' 端剪切、内含子剪接 (tRNA 内含子与 mRNA 内含子剪接机制不同)、碱基修饰和 3' 端 CCA 添加等。rRNA 的加工主要包括 pre-rRNA 的剪切和碱基修饰。

5.3 翻译:从RNA到蛋白质 (Translation: From RNA to Protein)

摘要

本节将详细描述翻译的过程,包括翻译的起始 (initiation)、延伸 (elongation) 和终止 (termination) 阶段,以及核糖体 (ribosome)、tRNA (transfer RNA) 和 mRNA (messenger RNA) 在翻译过程中的作用。

5.3.1 核糖体、tRNA与mRNA (Ribosomes, tRNA and mRNA)

核糖体 (Ribosome):核糖体是蛋白质合成的场所,是一种由 rRNA (核糖体 RNA) 和蛋白质组成的核糖核蛋白复合物 (ribonucleoprotein complex)。核糖体主要功能是识别 mRNA 上的遗传密码,结合 tRNA 携带的氨基酸,并催化肽键的形成,合成多肽链。
▮▮▮▮ⓑ 核糖体的结构:核糖体由大小两个亚基组成:
▮▮▮▮▮▮▮▮❸ 大亚基 (Large Subunit):真核生物核糖体大亚基为 60S 亚基,原核生物为 50S 亚基。大亚基主要负责催化肽键的形成 (肽基转移酶活性, peptidyl transferase activity)。
▮▮▮▮▮▮▮▮❹ 小亚基 (Small Subunit):真核生物核糖体小亚基为 40S 亚基,原核生物为 30S 亚基。小亚基主要负责 mRNA 和 tRNA 的结合,以及密码子的识别和解码。
▮▮▮▮ⓔ 核糖体的位点:核糖体上有三个 tRNA 结合位点:
▮▮▮▮▮▮▮▮❻ A 位点 (Aminoacyl-tRNA site):氨基酰-tRNA (aminoacyl-tRNA) 进入核糖体的入口位点,接受携带氨基酸的 tRNA。
▮▮▮▮▮▮▮▮❼ P 位点 (Peptidyl-tRNA site):肽酰-tRNA (peptidyl-tRNA) 位点,结合携带正在延伸的肽链的 tRNA。
▮▮▮▮▮▮▮▮❽ E 位点 (Exit site):空载 tRNA (deacylated tRNA) 离开核糖体的出口位点。

转运 RNA (tRNA, transfer RNA):tRNA 是一种小分子 RNA,在翻译过程中起着 “适配器 (adaptor)” 的作用。每种 tRNA 分子能够特异性地识别 mRNA 上的密码子 (codon) 并携带相应的氨基酸 (amino acid) 到达核糖体,参与蛋白质的合成。
▮▮▮▮ⓑ tRNA 的结构:tRNA 分子具有典型的三叶草结构 (cloverleaf structure) 和 L 形三维结构。tRNA 的重要结构区域包括:
▮▮▮▮▮▮▮▮❸ 氨基酸臂 (Acceptor arm):tRNA 的 3' 端 CCA 序列,氨基酸连接到位点。
▮▮▮▮▮▮▮▮❹ 反密码子环 (Anticodon loop):包含反密码子 (anticodon) 序列,能够与 mRNA 上的密码子进行碱基互补配对。
▮▮▮▮▮▮▮▮❺ D 环 (D loop) 和 TΨC 环 (TΨC loop):含有修饰碱基,参与 tRNA 的折叠和稳定。
▮▮▮▮ⓕ 氨基酰-tRNA 合成酶 (Aminoacyl-tRNA Synthetase):氨基酰-tRNA 合成酶是一类酶,负责将氨基酸正确地连接到相应的 tRNA 分子上,形成氨基酰-tRNA。每种氨基酸至少有一种特异性的氨基酰-tRNA 合成酶。氨基酰-tRNA 合成酶的保真度 (fidelity) 对于保证翻译的准确性至关重要。

信使 RNA (mRNA, messenger RNA):mRNA 携带编码蛋白质氨基酸序列的遗传密码 (genetic code)。mRNA 分子上的密码子 (codon) 是由三个核苷酸组成的序列,每种密码子编码一种特定的氨基酸或终止信号。
▮▮▮▮ⓑ 遗传密码 (Genetic Code):遗传密码是由 64 个密码子组成的系统,其中 61 个密码子编码 20 种氨基酸,3 个密码子 (UAA, UAG, UGA) 作为终止密码子 (stop codon),不编码氨基酸,而是指示翻译终止。遗传密码具有以下特点:
▮▮▮▮▮▮▮▮❸ 三联体密码 (Triplet Code):密码子由三个核苷酸组成。
▮▮▮▮▮▮▮▮❹ 简并性 (Degeneracy):大多数氨基酸由多个密码子编码,称为密码子的简并性。简并性降低了突变对蛋白质序列的影响。
▮▮▮▮▮▮▮▮❺ 通用性 (Universality):遗传密码在生物界具有通用性,几乎所有生物都使用相同的遗传密码。
▮▮▮▮▮▮▮▮❻ 非重叠性 (Non-overlapping):密码子之间是非重叠的,即每个核苷酸只属于一个密码子。
▮▮▮▮▮▮▮▮❼ 有起始密码子和终止密码子 (Start and Stop Codons):AUG 密码子既作为起始密码子 (编码甲硫氨酸, methionine),也作为内部密码子编码甲硫氨酸。UAA, UAG, UGA 是终止密码子,指示翻译终止。
▮▮▮▮ⓗ mRNA 的结构:成熟 mRNA 分子通常包含 5' 端非翻译区 (5'UTR, 5' untranslated region)、编码区 (coding region, ORF, open reading frame)、3' 端非翻译区 (3'UTR, 3' untranslated region)、5' 帽子结构 (5' cap) 和 3' poly(A) 尾巴 (3' poly(A) tail)。编码区 ORF 包含一系列密码子,决定蛋白质的氨基酸序列。

5.3.2 翻译的起始、延伸与终止 (Translation Initiation, Elongation and Termination)

翻译起始 (Translation Initiation):翻译起始是翻译过程的第一步,将核糖体、mRNA 和起始 tRNA (initiator tRNA) 组装在一起,形成翻译起始复合物 (translation initiation complex)。
▮▮▮▮ⓑ 原核生物翻译起始
▮▮▮▮▮▮▮▮❸ 核糖体小亚基结合 mRNA:原核生物核糖体小亚基 (30S 亚基) 结合 mRNA 的 5' 端,通过 Shine-Dalgarno 序列 (SD 序列) 识别 mRNA 的起始密码子 AUG。SD 序列位于起始密码子上游,与 rRNA 的 3' 端序列互补,引导核糖体正确结合到起始位点。
▮▮▮▮▮▮▮▮❹ 起始 tRNA 进入 P 位点:起始 tRNA (fMet-tRNAfMet,携带甲酰甲硫氨酸, N-formylmethionine) 进入核糖体 P 位点,与起始密码子 AUG 配对。
▮▮▮▮▮▮▮▮❺ 核糖体大亚基结合:核糖体大亚基 (50S 亚基) 结合到小亚基上,形成完整的 70S 核糖体起始复合物。起始 tRNA 占据 P 位点,A 位点空置。
▮▮▮▮ⓕ 真核生物翻译起始:真核生物翻译起始过程更加复杂,需要多种起始因子 (initiation factors, IFs) 的参与。
▮▮▮▮▮▮▮▮❼ 40S 亚基与起始 tRNA 结合:真核生物核糖体小亚基 (40S 亚基) 与起始 tRNA (Met-tRNAMet,携带甲硫氨酸, methionine) 和起始因子 eIF2 结合,形成 43S 前起始复合物 (43S preinitiation complex)。
▮▮▮▮▮▮▮▮❽ mRNA 结合:43S 前起始复合物结合 mRNA 的 5' 帽子结构,沿着 mRNA 扫描,寻找起始密码子 AUG。扫描过程需要起始因子 eIF4F 和 eIF4B 的参与。
▮▮▮▮▮▮▮▮❾ 起始密码子识别:当 43S 前起始复合物扫描到起始密码子 AUG 时,起始 tRNA 的反密码子与 AUG 密码子配对,触发起始因子 GTP 水解,导致起始因子释放。
▮▮▮▮▮▮▮▮❿ 60S 亚基结合:核糖体大亚基 (60S 亚基) 结合到 40S 亚基上,形成完整的 80S 核糖体起始复合物。起始 tRNA 占据 P 位点,A 位点空置。

翻译延伸 (Translation Elongation):翻译延伸是指核糖体沿着 mRNA 分子移动,不断添加氨基酸到肽链上的过程。翻译延伸是一个循环过程,包括三个步骤:
▮▮▮▮ⓑ 密码子识别 (Codon Recognition):下一个密码子 (位于 A 位点) 指导下一个氨基酰-tRNA 进入 A 位点。氨基酰-tRNA 的反密码子与 mRNA 上的密码子进行碱基互补配对。这个过程需要延伸因子 (elongation factor) EF-Tu (原核生物) 或 eEF1A (真核生物) 的辅助。
▮▮▮▮ⓒ 肽键形成 (Peptide Bond Formation):核糖体大亚基的肽基转移酶活性催化 P 位点 tRNA 上的肽链与 A 位点氨基酰-tRNA 携带的氨基酸之间形成肽键。肽键形成后,肽链转移到 A 位点 tRNA 上,P 位点 tRNA 变成空载 tRNA。
▮▮▮▮ⓓ 转位 (Translocation):核糖体沿着 mRNA 分子移动一个密码子的距离。P 位点空载 tRNA 移动到 E 位点并释放,A 位点携带肽链的 tRNA 移动到 P 位点,A 位点空置,准备接受下一个氨基酰-tRNA。转位过程需要延伸因子 EF-G (原核生物) 或 eEF2 (真核生物) 的辅助。

翻译延伸过程不断重复,直到核糖体遇到终止密码子。

翻译终止 (Translation Termination):翻译终止是指当核糖体移动到 mRNA 上的终止密码子 (UAA, UAG, UGA) 时,停止蛋白质合成,释放完整多肽链的过程。
▮▮▮▮ⓑ 释放因子识别终止密码子:终止密码子不编码氨基酸,而是被释放因子 (release factor, RF) 识别。原核生物有 RF1 (识别 UAA, UAG) 和 RF2 (识别 UAA, UGA),真核生物只有 eRF1 (识别所有三个终止密码子)。
▮▮▮▮ⓒ 肽链释放:释放因子进入 A 位点,催化肽链从 P 位点 tRNA 上水解脱落,释放出核糖体。
▮▮▮▮ⓓ 核糖体解体:释放因子和核糖体回收因子 (ribosome recycling factor, RRF) 共同作用,使核糖体大小亚基解离,mRNA 和 tRNA 也从核糖体上释放。核糖体亚基可以重新参与下一轮翻译起始。

多核糖体 (Polyribosome):在细胞内,一条 mRNA 分子可以同时与多个核糖体结合,形成多核糖体或聚核糖体 (polysome)。多核糖体可以提高 mRNA 的翻译效率,加速蛋白质的合成。

5.4 RNA的种类与功能 (Types and Functions of RNA)

摘要

本节将介绍不同种类的 RNA,如 mRNA (信使 RNA)、tRNA (转运 RNA)、rRNA (核糖体 RNA)、miRNA (微小 RNA)、siRNA (小干扰 RNA) 等,以及它们在基因表达调控中的作用。

5.4.1 mRNA、tRNA、rRNA (mRNA, tRNA, rRNA)

信使 RNA (mRNA, messenger RNA):mRNA 的主要功能是将 DNA 上的遗传信息传递到核糖体,作为蛋白质合成的模板。mRNA 携带编码蛋白质氨基酸序列的遗传密码,指导蛋白质的合成。
▮▮▮▮ⓑ mRNA 的结构:成熟 mRNA 分子通常包含 5' 端非翻译区 (5'UTR)、编码区 (ORF)、3' 端非翻译区 (3'UTR)、5' 帽子结构和 3' poly(A) 尾巴。
▮▮▮▮ⓒ mRNA 的合成:mRNA 由 RNA 聚合酶 II 转录 mRNA 基因 (protein-coding genes) 产生,需要经过 5' 加帽、3' 加尾和 RNA 剪接等加工修饰才能成熟。
▮▮▮▮ⓓ mRNA 的功能:mRNA 是蛋白质合成的模板,决定蛋白质的氨基酸序列。mRNA 的寿命和翻译效率受到多种因素的调控,如 RNA 结合蛋白 (RNA-binding protein, RBP) 和 miRNA 等。

转运 RNA (tRNA, transfer RNA):tRNA 的主要功能是在翻译过程中作为 “适配器”,识别 mRNA 上的密码子并携带相应的氨基酸到核糖体,参与蛋白质的合成。
▮▮▮▮ⓑ tRNA 的结构:tRNA 分子具有典型的三叶草结构和 L 形三维结构,包含氨基酸臂、反密码子环、D 环和 TΨC 环等结构区域。
▮▮▮▮ⓒ tRNA 的合成:tRNA 由 RNA 聚合酶 III 转录 tRNA 基因产生,需要经过 5' 端和 3' 端剪切、内含子剪接、碱基修饰和 3' 端 CCA 添加等加工修饰才能成熟。
▮▮▮▮ⓓ tRNA 的功能:tRNA 携带氨基酸,参与翻译过程。每种 tRNA 分子能够特异性地识别 mRNA 上的密码子并携带相应的氨基酸。tRNA 的种类和丰度也可能影响翻译效率和蛋白质合成的调控。

核糖体 RNA (rRNA, ribosomal RNA):rRNA 是核糖体的重要组成成分,构成核糖体的骨架,并参与核糖体的催化活性。rRNA 在蛋白质合成中发挥结构和功能双重作用。
▮▮▮▮ⓑ rRNA 的种类:真核生物核糖体 rRNA 主要有 28S rRNA, 18S rRNA, 5.8S rRNA 和 5S rRNA 四种。原核生物核糖体 rRNA 主要有 23S rRNA, 16S rRNA 和 5S rRNA 三种。
▮▮▮▮ⓒ rRNA 的合成:rRNA 基因 (rDNA) 通常以串联重复 (tandem repeat) 的形式存在于基因组中。rRNA 由 RNA 聚合酶 I (28S, 18S, 5.8S rRNA) 和 RNA 聚合酶 III (5S rRNA) 转录产生。真核生物 rRNA 前体 (pre-rRNA) 需要经过剪切和修饰才能成熟。
▮▮▮▮ⓓ rRNA 的功能:rRNA 是核糖体的结构骨架,与核糖体蛋白质组装形成核糖体大小亚基。rRNA 具有肽基转移酶活性,催化肽键的形成。rRNA 还参与 mRNA 和 tRNA 的结合,以及核糖体的移动和转位。

5.4.2 非编码RNA:miRNA、siRNA等 (Non-coding RNA: miRNA, siRNA, etc.)

除了 mRNA, tRNA, rRNA 等编码 RNA (coding RNA) 外,细胞内还存在大量的非编码 RNA (non-coding RNA, ncRNA)。ncRNA 不编码蛋白质,但具有重要的调控功能,参与基因表达调控、染色质结构调控、细胞发育和疾病发生等多种生物学过程。常见的非编码 RNA 包括:

微小 RNA (miRNA, microRNA):miRNA 是一类长度约为 21-25 个核苷酸的小分子 RNA,在真核生物基因表达调控中发挥重要作用。
▮▮▮▮ⓑ miRNA 的生成:miRNA 基因转录产生初级 miRNA (pri-miRNA),pri-miRNA 在细胞核内被 Drosha 酶加工成前体 miRNA (pre-miRNA),pre-miRNA 输出到细胞质,被 Dicer 酶加工成成熟 miRNA 双链。成熟 miRNA 双链解旋,其中一条链 (引导链, guide strand) 与 AGO 蛋白 (Argonaute protein) 结合,形成 RNA 诱导沉默复合物 (RISC, RNA-induced silencing complex)。
▮▮▮▮ⓒ miRNA 的作用机制:RISC 通过 miRNA 的引导链识别靶 mRNA 的 3'UTR 区域,与靶 mRNA 结合。如果 miRNA 与靶 mRNA 完全互补配对,则 RISC 诱导靶 mRNA 的降解 (mRNA cleavage)。如果 miRNA 与靶 mRNA 部分互补配对,则 RISC 抑制靶 mRNA 的翻译 (translational repression)。
▮▮▮▮ⓓ miRNA 的功能:miRNA 参与调控细胞生长、分化、凋亡、发育和代谢等多种生物学过程。miRNA 表达异常与多种疾病的发生发展密切相关,如癌症、心血管疾病和神经退行性疾病等。miRNA 可以作为疾病诊断和治疗的生物标志物和靶点。

小干扰 RNA (siRNA, small interfering RNA):siRNA 是一类长度约为 20-25 个核苷酸的双链 RNA 分子,主要参与 RNA 干扰 (RNA interference, RNAi) 途径,介导基因沉默 (gene silencing)。
▮▮▮▮ⓑ siRNA 的来源:siRNA 可以是外源性导入细胞的双链 RNA,也可以是内源性产生的双链 RNA 前体,如长双链 RNA 或发夹 RNA。
▮▮▮▮ⓒ siRNA 的作用机制:外源性或内源性双链 RNA 进入细胞后,被 Dicer 酶加工成 siRNA 双链。siRNA 双链解旋,其中一条链 (引导链) 与 AGO 蛋白结合,形成 RISC 复合物。RISC 通过 siRNA 的引导链识别靶 mRNA,与靶 mRNA 完全互补配对,诱导靶 mRNA 的降解 (mRNA cleavage)。
▮▮▮▮ⓓ siRNA 的功能:siRNA 介导 RNA 干扰,导致基因沉默。RNA 干扰是一种重要的基因表达调控机制,参与细胞防御病毒感染、转座子沉默和基因表达调控等。siRNA 技术被广泛应用于基因功能研究、基因治疗和药物开发等领域。

其他非编码 RNA:除了 miRNA 和 siRNA 外,还有许多其他类型的非编码 RNA,如:
▮▮▮▮ⓑ 核仁 RNA (snoRNA, small nucleolar RNA):参与 rRNA 的加工修饰,如 rRNA 的甲基化和假尿嘧啶化。
▮▮▮▮ⓒ 小核 RNA (snRNA, small nuclear RNA):参与 RNA 剪接,是剪接体的组成成分。
▮▮▮▮ⓓ Piwi 相互作用 RNA (piRNA, Piwi-interacting RNA):主要存在于生殖细胞中,参与生殖细胞发育和基因组稳定性维持,抑制转座子活性。
▮▮▮▮ⓔ 长链非编码 RNA (lncRNA, long non-coding RNA):长度超过 200 个核苷酸的非编码 RNA,参与多种生物学过程的调控,如基因表达调控、染色质修饰、细胞周期调控和疾病发生等。lncRNA 的作用机制复杂多样,可以通过与 DNA、RNA 或蛋白质相互作用,发挥调控功能。

非编码 RNA 的发现 🔬 极大地拓展了我们对基因表达调控和生命活动复杂性的认识。非编码 RNA 已经成为生物学研究的热点领域,并在疾病诊断和治疗方面展现出巨大的潜力。

6. 基因调控 (Gene Regulation)

6.1 原核生物的基因调控 (Gene Regulation in Prokaryotes)

6.1.1 操纵子模型 (Operon Model)

操纵子模型 (Operon Model) 是解释原核生物基因调控机制的经典模型,尤其适用于细菌等生物。操纵子 (Operon) 是一组功能相关的基因,它们在基因组上相邻排列,并受到同一套调控元件的控制,实现协同表达。操纵子模型的核心组件包括:启动子 (Promoter)、操纵基因 (Operator)、结构基因 (Structural Genes) 和调节基因 (Regulator Gene)。

启动子 (Promoter)

⚝ 启动子是DNA上的一段序列,位于结构基因的上游,是RNA聚合酶 (RNA polymerase) 结合和启动转录 (transcription) 的位点。
⚝ 启动子区域含有RNA聚合酶识别和结合的特定序列,例如在细菌中常见的 -10 区 (Pribnow box) 和 -35 区序列。
⚝ 启动子的强度决定了基因转录起始的效率,强启动子能够高效地启动转录,而弱启动子则效率较低。

操纵基因 (Operator)

⚝ 操纵基因是位于启动子下游、结构基因上游的一段DNA序列,通常位于启动子和结构基因之间。
⚝ 操纵基因是阻遏蛋白 (repressor protein) 结合的位点。阻遏蛋白与操纵基因的结合就像一个“分子开关”,可以阻止RNA聚合酶沿着DNA移动,从而阻止下游结构基因的转录。
⚝ 操纵基因的存在使得基因表达可以被外部信号或细胞内部条件精确调控。

结构基因 (Structural Genes)

⚝ 结构基因是操纵子中编码蛋白质的基因,它们通常编码参与同一代谢途径或功能相关的酶或蛋白质。
⚝ 操纵子中的结构基因通常是多顺反子 (polycistronic) 的,即一条mRNA分子上编码多个蛋白质。这使得操纵子能够实现对一组相关基因的协同调控和表达。
⚝ 例如,在lac 操纵子 (乳糖操纵子, lac operon) 中,结构基因包括 lacZlacYlacA,它们分别编码 β-半乳糖苷酶 (β-galactosidase)、渗透酶 (permease) 和转乙酰酶 (transacetylase),这些酶都参与乳糖的代谢。

调节基因 (Regulator Gene)

⚝ 调节基因通常位于操纵子的附近,但不属于操纵子的结构组成部分。
⚝ 调节基因编码调节蛋白 (regulatory protein),例如阻遏蛋白或激活蛋白 (activator protein)。这些调节蛋白能够与操纵基因或启动子区域结合,从而调控结构基因的转录。
⚝ 调节基因的表达通常是组成型 (constitutive) 的,即持续低水平表达,以保证细胞内始终存在一定量的调节蛋白。
⚝ 例如,在lac 操纵子中,调节基因 lacI 编码 lac 阻遏蛋白。

操纵子模型的工作原理

操纵子模型通过调节蛋白与操纵基因的结合与解离,控制结构基因的转录起始,从而实现基因表达的调控。根据调节蛋白的作用方式和调控效果,操纵子模型可以分为负调控 (negative regulation) 和 正调控 (positive regulation) 两种基本类型,并且可以进一步细分为可诱导型 (inducible) 和 可阻遏型 (repressible) 操纵子。

负调控 (Negative Regulation):调节蛋白作为阻遏蛋白,结合到操纵基因上,阻止转录的发生。只有当阻遏蛋白从操纵基因上解离时,转录才能进行。
正调控 (Positive Regulation):调节蛋白作为激活蛋白,必须结合到启动子区域,才能促进RNA聚合酶的结合和转录的起始。

操纵子模型是理解原核生物基因调控的基础,它展示了基因表达调控的精巧性和高效性,使得细菌能够快速响应环境变化,调控代谢途径,适应生存。

6.1.2 正调控与负调控 (Positive and Negative Regulation)

原核生物的基因调控机制可以分为正调控 (positive regulation) 和负调控 (negative regulation) 两种基本类型,这两种调控方式主要通过调节蛋白 (regulatory protein) 与DNA调控序列的相互作用来实现。

负调控 (Negative Regulation)

⚝ 在负调控中,调节蛋白作为阻遏蛋白 (repressor protein) 发挥作用。阻遏蛋白通常在没有诱导物 (inducer) 或存在核心阻遏物 (corepressor) 的情况下,能够结合到操纵基因 (operator) 上,阻碍RNA聚合酶 (RNA polymerase) 的移动,从而抑制结构基因 (structural genes) 的转录。
⚝ 只有当诱导物 存在并与阻遏蛋白结合,导致阻遏蛋白构象改变,使其无法结合操纵基因,或者当核心阻遏物 缺失,导致阻遏蛋白无法有效结合操纵基因时,阻遏蛋白才会从操纵基因上解离,RNA聚合酶才能顺利启动转录,结构基因才能表达。
⚝ 负调控的操纵子可以进一步分为 可诱导型操纵子 (inducible operon) 和 可阻遏型操纵子 (repressible operon)。

▮▮▮▮⚝ 可诱导型操纵子 (Inducible Operon):通常情况下,结构基因的转录是被阻遏的,只有当诱导物 存在时,转录才会被诱导 发生。
▮▮▮▮▮▮▮▮⚝ 例子:乳糖操纵子 (lac operon)。在没有乳糖 (lactose) 的情况下,lacI 基因编码的 lac 阻遏蛋白 (Lac repressor) 结合到 lac 操纵基因上,阻止 lacZYA 结构基因的转录。当乳糖存在时,乳糖的异构体 异乳糖 (allolactose) 作为诱导物,与 lac 阻遏蛋白结合,导致阻遏蛋白构象改变,使其无法结合操纵基因。这样,RNA聚合酶就可以结合启动子,启动 lacZYA 结构基因的转录,产生代谢乳糖所需的酶。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[无乳糖] --> B(Lac阻遏蛋白结合操纵基因);
3 B --> C{转录受阻};
4 D[有乳糖] --> E(异乳糖作为诱导物);
5 E --> F(异乳糖结合Lac阻遏蛋白);
6 F --> G(Lac阻遏蛋白构象改变);
7 G --> H(Lac阻遏蛋白无法结合操纵基因);
8 H --> I{转录发生};
9 I --> J[LacZYA基因表达];

▮▮▮▮⚝ 可阻遏型操纵子 (Repressible Operon):通常情况下,结构基因的转录是激活的,只有当核心阻遏物 存在时,转录才会被阻遏
▮▮▮▮▮▮▮▮⚝ 例子:色氨酸操纵子 (trp operon)。在色氨酸 (tryptophan) 浓度较低时,trpR 基因编码的 Trp 阻遏蛋白 (Trp repressor) 本身不能结合 trp 操纵基因,trpEDCBA 结构基因可以正常转录,合成色氨酸。当细胞内色氨酸浓度升高时,色氨酸作为核心阻遏物,与 Trp 阻遏蛋白结合,形成活性阻遏蛋白。活性阻遏蛋白能够结合到 trp 操纵基因上,阻止 trpEDCBA 结构基因的转录,从而减少色氨酸的合成,维持细胞内色氨酸浓度的平衡。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[色氨酸浓度低] --> B(Trp阻遏蛋白无活性);
3 B --> C{转录发生};
4 C --> D[trpEDCBA基因表达];
5 E[色氨酸浓度高] --> F(色氨酸作为核心阻遏物);
6 F --> G(色氨酸结合Trp阻遏蛋白);
7 G --> H(Trp阻遏蛋白激活);
8 H --> I(活性Trp阻遏蛋白结合操纵基因);
9 I --> J{转录受阻};

正调控 (Positive Regulation)

⚝ 在正调控中,调节蛋白作为激活蛋白 (activator protein) 发挥作用。激活蛋白本身不能直接阻碍转录,而是需要结合到启动子 (promoter) 区域的特定位点,促进RNA聚合酶与启动子的结合,或者增强RNA聚合酶的转录起始活性,从而激活结构基因的转录。
⚝ 激活蛋白的活性通常受到小分子 激活物 (activator) 或 抑制物 (inhibitor) 的调控。激活物与激活蛋白结合可以增强其活性,促进转录;抑制物与激活蛋白结合则会降低其活性,抑制转录。
⚝ 正调控通常与负调控结合使用,实现对基因表达更精细的调控。

▮▮▮▮⚝ 例子:乳糖操纵子的 Catabolite Activator Protein (CAP) 调控。即使乳糖存在,lac 操纵子也需要葡萄糖 (glucose) 浓度低时才能高效表达。当葡萄糖浓度低时,细胞内 环腺苷酸 (cyclic AMP, cAMP) 浓度升高,cAMP 与 Catabolite Activator Protein (CAP) 结合,形成 cAMP-CAP 复合物。cAMP-CAP 复合物作为激活蛋白,结合到 lac 操纵子的启动子区域,增强 RNA 聚合酶与启动子的结合能力,从而显著提高 lacZYA 结构基因的转录效率。如果葡萄糖浓度高,cAMP 浓度低,CAP 蛋白不能有效结合启动子,即使 lac 阻遏蛋白被异乳糖解除,lac 操纵子的转录水平仍然较低。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[葡萄糖浓度低] --> B(cAMP浓度升高);
3 B --> C(cAMP结合CAP);
4 C --> D(cAMP-CAP复合物形成);
5 D --> E(cAMP-CAP结合启动子);
6 E --> F{转录效率显著提高};
7 G[葡萄糖浓度高] --> H(cAMP浓度降低);
8 H --> I(CAP不能有效结合启动子);
9 I --> J{转录效率低};

总结

负调控 通过 阻遏蛋白 阻止转录,解除阻遏需要诱导物或缺乏核心阻遏物。
正调控 通过 激活蛋白 促进转录,激活需要激活物或解除抑制物。
⚝ 原核生物基因调控常常是 负调控和正调控相结合 的复杂系统,以实现对基因表达的精确调控,适应多变的环境条件。例如,lac 操纵子同时受到 lac 阻遏蛋白的负调控和 cAMP-CAP 复合物的正调控,只有当乳糖存在而葡萄糖缺乏时,lac 操纵子才能高效表达。


6.2 真核生物的基因调控 (Gene Regulation in Eukaryotes)

真核生物的基因调控 (Gene Regulation in Eukaryotes) 比原核生物更为复杂,因为真核细胞具有细胞核 (nucleus) 和复杂的细胞结构,基因组 (genome) 也更为庞大和复杂。真核生物的基因调控发生在多个层次,包括染色质结构 (chromatin structure)、转录 (transcription)、转录后加工 (post-transcriptional processing)、翻译 (translation) 和蛋白质修饰 (protein modification) 等多个环节。

6.2.1 染色质结构与基因调控 (Chromatin Structure and Gene Regulation)

真核生物的DNA不是裸露存在的,而是与组蛋白 (histone) 等蛋白质结合形成 染色质 (chromatin)。染色质的结构状态对基因的表达具有重要的调控作用。染色质可以分为两种基本状态: 常染色质 (euchromatin) 和 异染色质 (heterochromatin)。

常染色质 (Euchromatin)

⚝ 常染色质是染色质的 疏松 状态,DNA 相对伸展开,组蛋白的修饰水平较高,例如 组蛋白乙酰化 (histone acetylation) 水平较高。
⚝ 常染色质区域的DNA更容易接近转录 machinery,包括转录因子 (transcription factors) 和 RNA 聚合酶 (RNA polymerase),因此常染色质区域的基因通常是 活跃转录 的。
⚝ 常染色质通常富含基因,是基因表达的主要区域。

异染色质 (Heterochromatin)

⚝ 异染色质是染色质的 紧密 状态,DNA 高度压缩,组蛋白的修饰水平较低,例如 组蛋白甲基化 (histone methylation) (特别是 H3K9me3 和 H3K27me3) 水平较高,DNA甲基化 (DNA methylation) 水平也较高。
⚝ 异染色质区域的DNA不易接近转录 machinery,转录因子和RNA聚合酶难以进入,因此异染色质区域的基因通常是 转录沉默 的。
⚝ 异染色质可以分为 组成型异染色质 (constitutive heterochromatin) 和 兼性异染色质 (facultative heterochromatin)。
▮▮▮▮⚝ 组成型异染色质:在所有细胞类型和发育阶段都保持高度压缩状态,通常位于染色体的着丝粒 (centromere) 和端粒 (telomere) 区域,富含重复序列,基因密度低,主要功能是维持染色体结构稳定。
▮▮▮▮⚝ 兼性异染色质:在不同细胞类型或发育阶段,可以在常染色质和异染色质状态之间转换,参与调控细胞分化和基因表达的动态变化。例如,X染色体失活 (X-chromosome inactivation) 形成的 巴尔小体 (Barr body) 就是兼性异染色质的典型例子。

染色质结构调控基因表达的机制 主要包括以下几个方面:

组蛋白修饰 (Histone Modification)

⚝ 组蛋白是染色质的主要蛋白质成分,核心组蛋白包括 H2A、H2B、H3 和 H4。组蛋白的 N-端尾巴 (N-terminal tail) 可以发生多种 共价修饰 (covalent modification),包括 乙酰化 (acetylation)、甲基化 (methylation)、磷酸化 (phosphorylation)、泛素化 (ubiquitination) 等。
⚝ 不同的组蛋白修饰类型和修饰位点对基因表达产生不同的影响,形成所谓的 组蛋白密码 (histone code)。
▮▮▮▮⚝ 组蛋白乙酰化:通常与基因 激活 相关。组蛋白乙酰转移酶 (histone acetyltransferase, HAT) 催化组蛋白赖氨酸残基的乙酰化,中和赖氨酸残基的正电荷,减弱组蛋白与带负电荷的DNA之间的静电吸引力,使染色质结构变得疏松,有利于转录因子和RNA聚合酶的结合,促进基因转录。组蛋白去乙酰化酶 (histone deacetylase, HDAC) 则催化组蛋白去乙酰化,使染色质结构变得紧密,抑制基因转录。
▮▮▮▮⚝ 组蛋白甲基化:对基因表达的影响较为复杂,取决于甲基化的位点和甲基化的程度。例如,H3K4me3 (组蛋白H3第4位赖氨酸三甲基化) 通常与基因 激活 相关,而 H3K9me3 和 H3K27me3 (组蛋白H3第9位和第27位赖氨酸三甲基化) 通常与基因 沉默 相关。组蛋白甲基转移酶 (histone methyltransferase, HMT) 催化组蛋白甲基化,组蛋白去甲基化酶 (histone demethylase, HDM) 催化组蛋白去甲基化。

DNA甲基化 (DNA Methylation)

⚝ 在哺乳动物中,DNA甲基化主要是指 胞嘧啶甲基化 (cytosine methylation),即在胞嘧啶 (cytosine, C) 碱基的 5 位碳原子上添加一个甲基 (CH3) 基团,形成 5-甲基胞嘧啶 (5-methylcytosine, 5mC)。DNA甲基化主要发生在 CpG 二核苷酸序列 (cytosine-phosphate-guanine dinucleotide) 上。
⚝ DNA甲基化通常与基因 沉默 相关。DNA甲基转移酶 (DNA methyltransferase, DNMT) 催化DNA甲基化。甲基化的 CpG 序列可以招募 甲基-CpG 结合域蛋白 (methyl-CpG-binding domain protein, MBD),例如 MeCP2,MBD 蛋白进一步招募 染色质重塑复合物 (chromatin remodeling complex) 和 组蛋白去乙酰化酶 等,导致染色质结构紧密化,抑制基因转录。
⚝ DNA去甲基化酶 (DNA demethylase) 可以去除DNA上的甲基化修饰,促进基因表达。

染色质重塑复合物 (Chromatin Remodeling Complex)

⚝ 染色质重塑复合物是一类 ATP依赖性 的蛋白质复合物,能够利用ATP水解的能量,改变核小体 (nucleosome) 的位置和结构,从而影响DNA的可及性,调控基因转录。
⚝ 染色质重塑复合物可以 滑动核小体 (nucleosome sliding)、移除核小体 (nucleosome eviction) 或 替换组蛋白变体 (histone variant exchange),使DNA更容易或更不容易接近转录因子和RNA聚合酶。
⚝ 常见的染色质重塑复合物包括 SWI/SNF 家族、ISWI 家族、NuRD/Mi-2/CHD 家族和 INO80 家族等。

总结

⚝ 染色质结构是真核生物基因调控的重要层次。常染色质 状态有利于基因转录,异染色质 状态抑制基因转录。
组蛋白修饰 (乙酰化、甲基化等) 和 DNA甲基化 是调控染色质结构和基因表达的重要表观遗传修饰。
染色质重塑复合物 通过改变核小体的位置和结构,动态调控染色质的可及性和基因表达。
⚝ 染色质结构调控与转录因子等其他调控机制协同作用,共同精细调控真核生物的基因表达。

6.2.2 转录因子与转录调控 (Transcription Factors and Transcriptional Regulation)

转录因子 (transcription factors, TFs) 是真核生物基因调控的核心元件。转录因子是一类能够 特异性结合DNA序列 的蛋白质,它们通过与 顺式作用元件 (cis-acting elements) 结合,调控靶基因的转录起始。顺式作用元件是位于基因附近的DNA序列,例如启动子 (promoter)、增强子 (enhancer) 和沉默子 (silencer) 等。

转录因子的结构域 (Domains of Transcription Factors)

⚝ 转录因子通常具有 模块化结构,包含至少两个功能结构域 (functional domain):
▮▮▮▮⚝ DNA结合结构域 (DNA-binding domain, DBD):负责识别和结合特定的DNA序列,例如顺式作用元件。常见的DNA结合结构域包括 锌指结构域 (zinc finger domain)、螺旋-转角-螺旋结构域 (helix-turn-helix domain, HTH)、螺旋-环-螺旋结构域 (helix-loop-helix domain, HLH)、同源异型结构域 (homeodomain) 和 β-折叠结构域 (β-sheet domain) 等。
▮▮▮▮⚝ 激活结构域 (Activation domain, AD)阻遏结构域 (Repression domain, RD):负责与其他蛋白质 (例如 辅激活因子 (coactivator) 或 辅阻遏因子 (corepressor)) 相互作用,从而 激活抑制 基因转录。激活结构域通常富含酸性氨基酸、谷氨酰胺或脯氨酸;阻遏结构域则较为多样,例如 KRAB 结构域。

转录因子的分类 (Classification of Transcription Factors)

⚝ 根据功能,转录因子可以分为 通用转录因子 (general transcription factors, GTFs) 和 特异性转录因子 (specific transcription factors)。
▮▮▮▮⚝ 通用转录因子 (GTFs):参与所有RNA聚合酶II (RNA polymerase II) 启动子驱动的基因的基本转录起始过程。GTFs 包括 TFIIA、TFIIB、TFIID、TFIIE、TFIIF 和 TFIIH 等。TFIID 复合物中的 TATA-结合蛋白 (TATA-binding protein, TBP) 能够识别和结合启动子区域的 TATA 盒 序列,是转录起始复合物 (preinitiation complex, PIC) 组装的关键步骤。
▮▮▮▮⚝ 特异性转录因子 (Specific TFs):调控特定基因或基因集合的表达,参与细胞分化、发育和应激反应等过程。特异性转录因子种类繁多,例如 激素受体 (hormone receptors)、核受体 (nuclear receptors)、信号转导通路下游的转录因子 (例如 NF-κB、STATs、AP-1) 和 发育调控转录因子 (例如 Hox 基因、Pax 基因) 等。

转录调控的顺式作用元件 (Cis-acting Regulatory Elements)

⚝ 顺式作用元件是位于基因附近的DNA序列,是转录因子结合的位点,调控基因转录。常见的顺式作用元件包括:
▮▮▮▮⚝ 启动子 (Promoter):位于基因转录起始位点 (transcription start site, TSS) 附近,是RNA聚合酶和通用转录因子结合的区域。核心启动子 (core promoter) 通常包含 TATA 盒、起始点序列 (initiator, Inr) 和 CpG 岛 (CpG island) 等元件。近端启动子 (proximal promoter) 位于核心启动子上游,包含多种特异性转录因子结合位点。
▮▮▮▮⚝ 增强子 (Enhancer):位于基因上游、下游或内含子区域,距离基因可以很远 (几 kb 甚至 Mb),增强基因的转录活性,具有 位置和方向独立性。增强子区域富含特异性转录因子结合位点,通过 DNA环化 (DNA looping) 与启动子区域相互作用,促进转录起始。
▮▮▮▮⚝ 沉默子 (Silencer):与增强子类似,但结合阻遏性转录因子,抑制基因的转录活性。
▮▮▮▮⚝ 绝缘子 (Insulator):位于染色质区域边界,阻止增强子或沉默子对邻近基因的影响,防止调控信号 “串扰” (crosstalk),维持基因表达的区域特异性。

转录调控的协同作用 (Combinatorial Control of Transcription)

⚝ 真核生物基因的转录调控通常不是由单个转录因子决定的,而是由 多个转录因子协同作用 的结果。不同的转录因子可以 协同拮抗 作用,共同精细调控基因的表达水平和时空特异性。
协同激活 (synergistic activation):多个激活性转录因子共同作用,产生的激活效果远大于单个转录因子作用效果的简单叠加。
组合调控 (combinatorial regulation):不同的基因可以共享一些相同的转录因子,但通过不同的转录因子组合和顺式作用元件排列,实现基因表达的多样性和特异性。
染色质介导的调控 (chromatin-mediated regulation):转录因子的活性和可及性受到染色质结构状态的调控,染色质修饰和重塑影响转录因子与DNA的结合。

总结

转录因子 是真核生物基因调控的核心元件,通过与 顺式作用元件 结合,调控基因转录起始。
⚝ 转录因子具有 DNA结合结构域激活/阻遏结构域
通用转录因子 参与基本转录起始,特异性转录因子 调控特定基因表达。
启动子、增强子、沉默子和绝缘子 是重要的顺式作用元件。
⚝ 基因转录调控是 多个转录因子协同作用染色质介导 的复杂过程。

6.2.3 转录后调控:RNA加工、RNA稳定性、翻译调控 (Post-transcriptional Regulation: RNA Processing, RNA Stability, Translational Control)

真核生物的基因表达调控不仅发生在转录水平,还包括 转录后调控 (post-transcriptional regulation),即在RNA转录产生后,通过调控 RNA加工 (RNA processing)、RNA稳定性 (RNA stability) 和 翻译 (translation) 等环节,精细调控基因的表达水平。

RNA加工 (RNA Processing)

⚝ 真核生物基因转录产生的 初级转录本 (primary transcript, pre-mRNA) 需要经过一系列加工修饰,才能成为成熟的 信使RNA (messenger RNA, mRNA),用于翻译蛋白质。RNA加工主要包括 5' 端加帽 (5' capping)、3' 端加尾 (3' polyadenylation) 和 RNA剪接 (RNA splicing)。
▮▮▮▮⚝ 5' 端加帽 (5' Capping):在 pre-mRNA 5' 端添加一个 7-甲基鸟苷帽 (7-methylguanosine cap),形成 5'-5' 三磷酸键结构。5' 帽结构对 mRNA 的 稳定性翻译起始RNA剪接 都具有重要作用。
▮▮▮▮⚝ 3' 端加尾 (3' Polyadenylation):在 pre-mRNA 3' 端通过 酶促反应 添加一段 多聚腺苷酸尾巴 (poly(A) tail),长度通常为 100-250 个腺嘌呤核苷酸。poly(A) 尾巴对 mRNA 的 稳定性翻译效率转运 都具有重要作用。
▮▮▮▮⚝ RNA剪接 (RNA Splicing):真核生物基因通常包含 外显子 (exon) 和 内含子 (intron) 两种序列。外显子编码蛋白质序列,内含子是非编码序列。RNA剪接是指 切除内含子连接外显子,形成连续编码序列的过程。RNA剪接由 剪接体 (spliceosome) 复合体催化完成。
▮▮▮▮▮▮▮▮⚝ 可变剪接 (Alternative Splicing):同一个 pre-mRNA 可以通过不同的剪接方式,产生 多种不同的 mRNA 异构体 (mRNA isoforms),编码 不同的蛋白质。可变剪接是增加蛋白质多样性的重要机制,调控基因表达的复杂性和特异性。

RNA稳定性 (RNA Stability)

⚝ mRNA 的 稳定性 (或 半衰期,half-life) 决定了 mRNA 在细胞内的 存在时间丰度,从而影响蛋白质的合成量。mRNA 的稳定性受到多种因素的调控,包括 RNA 结构RNA 结合蛋白 (RNA-binding proteins, RBPs) 和 RNA降解途径 (RNA degradation pathways)。
▮▮▮▮⚝ RNA结构:mRNA 5' 端帽结构和 3' 端 poly(A) 尾巴可以 保护 mRNA 免受核酸外切酶降解。mRNA 5' 和 3' 非翻译区 (untranslated region, UTR) 的 二级结构三级结构 也影响 mRNA 的稳定性。
▮▮▮▮⚝ RNA结合蛋白 (RBPs):RBPs 可以 结合 mRNA 的特定序列或结构稳定 mRNA促进 mRNA 降解。例如,AU-富含元件结合蛋白 1 (AU-rich element binding protein 1, AUF1) 结合 mRNA 3' UTR 的 AU-富含元件 (AU-rich element, ARE),促进 mRNA 降解;Hu 抗原 R (Hu antigen R, HuR) 结合 ARE,稳定 mRNA。
▮▮▮▮⚝ RNA降解途径:主要的 mRNA 降解途径包括 5'-3' 降解途径3'-5' 降解途径脱帽酶 (decapping enzyme) 去除 5' 帽结构,核酸外切酶 XRN1 从 5' 端降解 mRNA;多聚腺苷酸酶 (poly(A) nuclease) 缩短 poly(A) 尾巴,外切体 (exosome) 从 3' 端降解 mRNA。无义突变介导的 mRNA 降解 (nonsense-mediated mRNA decay, NMD) 途径特异性降解含有 提前终止密码子 (premature termination codon, PTC) 的 mRNA。

翻译调控 (Translational Control)

⚝ 即使 mRNA 已经成熟,其 翻译效率 (translational efficiency) 仍然可以受到调控,影响蛋白质的合成量。翻译调控发生在翻译起始、延伸和终止等多个阶段,但 翻译起始 是主要的调控环节。翻译调控机制包括 核糖体结合起始因子活性mRNA 结构 等。
▮▮▮▮⚝ 核糖体结合 (Ribosome Binding):mRNA 5' UTR 的 帽子依赖性翻译起始 (cap-dependent translation initiation) 是真核生物主要的翻译起始方式。起始因子 eIF4F 复合物识别 mRNA 5' 帽结构,招募 40S 核糖体亚基 (40S ribosomal subunit) 和 起始 tRNA (initiator tRNA) 到 mRNA,形成 43S 前起始复合物 (43S preinitiation complex, 43S PIC)。扫描机制 (scanning mechanism) 指导 43S PIC 沿 mRNA 5' UTR 移动,寻找 起始密码子 AUG
▮▮▮▮⚝ 起始因子活性 (Initiation Factor Activity)真核生物起始因子 2α (eukaryotic initiation factor 2α, eIF2α) 的 磷酸化 (phosphorylation) 是翻译调控的重要机制。eIF2α 磷酸化抑制 鸟嘌呤核苷酸交换因子 eIF2B (guanine nucleotide exchange factor eIF2B) 的活性,减少 GTP-eIF2-tRNAiMet 三元复合物 (GTP-eIF2-tRNAiMet ternary complex) 的形成,抑制翻译起始。整合应激反应 (integrated stress response, ISR) 激活 eIF2α 激酶,例如 PERK、GCN2、PKR 和 HRI,介导应激条件下的翻译抑制。
▮▮▮▮⚝ mRNA结构 (mRNA Structure):mRNA 5' UTR 的 二级结构 (例如发夹结构) 可以 阻碍核糖体扫描翻译起始内部核糖体进入位点 (internal ribosome entry site, IRES) 是一种特殊的 mRNA 结构,可以 绕过 5' 帽依赖性翻译起始,直接招募核糖体到 mRNA 内部起始翻译。IRES 介导的翻译在细胞应激、细胞凋亡和病毒感染等条件下发挥重要作用。

总结

转录后调控 是真核生物基因表达调控的重要层次,发生在 RNA 转录产生之后。
RNA加工 (5' 加帽、3' 加尾、RNA剪接) 产生成熟的 mRNA,可变剪接增加蛋白质多样性。
RNA稳定性 调控 mRNA 在细胞内的存在时间和丰度,受到 RNA 结构、RBPs 和 RNA 降解途径的调控。
翻译调控 影响 mRNA 的翻译效率,翻译起始是主要的调控环节,受到核糖体结合、起始因子活性和 mRNA 结构等因素的调控。
⚝ 转录后调控与转录调控等其他调控机制协同作用,共同精细调控真核生物的基因表达。


6.3 表观遗传调控 (Epigenetic Regulation)

表观遗传学 (epigenetics) 研究的是 在DNA序列不发生改变的情况下,基因表达发生可遗传的改变 的现象和机制。表观遗传修饰 (epigenetic modification) 是指 DNA序列之外的,可以影响基因表达的可遗传修饰,主要包括 DNA甲基化 (DNA methylation)、组蛋白修饰 (histone modification) 和 非编码RNA调控 (non-coding RNA regulation) 等。表观遗传修饰可以 调控染色质结构影响基因转录参与细胞分化和发育,并在 疾病发生 中发挥重要作用。

6.3.1 表观遗传学的基本概念 (Basic Concepts of Epigenetics)

表观遗传的定义 (Definition of Epigenetics)

广义的表观遗传学:指所有 非基因序列依赖的遗传现象,包括 DNA 甲基化、组蛋白修饰、染色质重塑、非编码 RNA 调控、甚至蛋白质构象的改变等。
狭义的表观遗传学:更侧重于 可遗传的、稳定的基因表达模式的改变,这些改变不是由 DNA 序列变化引起的,而是由表观遗传修饰建立和维持的。
核心概念可遗传性 (heritability)、非基因序列依赖性 (non-DNA sequence-dependent)、基因表达调控 (gene expression regulation)。

表观遗传的特点 (Characteristics of Epigenetics)

可遗传性 (Heritability):表观遗传修饰可以 跨代遗传,即从亲代细胞传递到子代细胞,甚至可以跨世代遗传,从亲代生物传递到子代生物。但表观遗传的跨代遗传性通常不如 DNA 序列遗传那样稳定和持久,容易受到环境因素的影响。
可逆性 (Reversibility):表观遗传修饰是 动态可逆 的,可以被建立、维持和去除。表观遗传修饰酶 (epigenetic modifying enzymes),例如 DNA 甲基转移酶、组蛋白修饰酶和 RNA 调控因子,可以催化表观遗传修饰的添加和去除,响应细胞内外的信号,调控基因表达的动态变化。
环境敏感性 (Environmental Sensitivity):表观遗传修饰容易受到 环境因素 的影响,例如 营养应激毒物生活方式 等。环境因素可以通过改变表观遗传修饰模式,影响基因表达,进而影响生物体的表型和健康。
细胞类型特异性 (Cell Type Specificity):不同细胞类型具有 不同的表观遗传修饰模式,这有助于建立和维持细胞的 特异性基因表达谱,实现细胞分化和组织功能。例如,神经细胞和肌肉细胞具有不同的 DNA 甲基化和组蛋白修饰模式,导致它们表达不同的基因集合,执行不同的功能。

表观遗传的研究范畴 (Scope of Epigenetics)

表观遗传修饰的类型和机制:研究 DNA 甲基化、组蛋白修饰、非编码 RNA 调控等表观遗传修饰的 化学本质酶学机制调控网络相互作用
表观遗传修饰的建立、维持和去除:研究表观遗传修饰如何被 建立复制稳定遗传,以及如何被 动态调控去除
表观遗传修饰在生物学过程中的作用:研究表观遗传修饰在 基因表达调控染色质结构组织细胞分化和发育基因组印记 (genomic imprinting)、X染色体失活衰老跨代遗传 等生物学过程中的作用。
表观遗传修饰与疾病的关系:研究表观遗传修饰在 癌症神经退行性疾病代谢性疾病自身免疫性疾病精神疾病 等疾病发生发展中的作用,以及表观遗传修饰作为 疾病诊断标志物治疗靶点 的潜力。
表观遗传学与环境互作:研究 环境因素 如何影响表观遗传修饰模式,以及表观遗传修饰如何介导 环境与基因的互作,影响生物体的表型和适应性。

总结

表观遗传学 研究 DNA 序列不变的情况下,基因表达的可遗传改变。
⚝ 表观遗传具有 可遗传性可逆性环境敏感性细胞类型特异性 等特点。
⚝ 表观遗传研究范畴广泛,涉及表观遗传修饰的 类型、机制、建立、维持、生物学作用、疾病关系和环境互作 等多个方面。
⚝ 表观遗传学是理解基因表达调控、细胞命运决定和疾病发生机制的重要领域。

6.3.2 DNA甲基化与基因调控 (DNA Methylation and Gene Regulation)

DNA甲基化 (DNA methylation) 是表观遗传修饰的重要类型,主要指 胞嘧啶甲基化 (cytosine methylation),即在胞嘧啶 (cytosine, C) 碱基的 5 位碳原子上添加一个甲基 (CH3) 基团,形成 5-甲基胞嘧啶 (5-methylcytosine, 5mC)。在哺乳动物中,DNA甲基化主要发生在 CpG 二核苷酸序列 (cytosine-phosphate-guanine dinucleotide) 上。

DNA甲基化的酶学机制 (Enzymatic Mechanism of DNA Methylation)

DNA甲基转移酶 (DNA Methyltransferase, DNMT) 催化 DNA 甲基化反应。在哺乳动物中,主要的 DNMT 包括:
▮▮▮▮⚝ DNMT1维持性甲基转移酶 (maintenance methyltransferase),主要负责 复制后维持 DNA 甲基化模式。DNMT1 优先识别 半甲基化 CpG 位点 (hemimethylated CpG site),即一条链甲基化,另一条链未甲基化的 CpG 位点。在 DNA 复制过程中,子链是新合成的,最初是未甲基化的。DNMT1 能够识别母链上的甲基化标记,将甲基化修饰 复制到子链上,从而维持 DNA 甲基化模式的 代代相传
▮▮▮▮⚝ DNMT3A 和 DNMT3B从头甲基转移酶 (de novo methyltransferase),主要负责 建立新的 DNA 甲基化模式。DNMT3A 和 DNMT3B 对甲基化位点没有特异性,可以 从头 将甲基添加到 CpG 位点上,参与 早期胚胎发育细胞分化 过程中 DNA 甲基化模式的建立。
▮▮▮▮⚝ DNMT3LDNMT3 样蛋白 (DNMT3-like protein),本身没有甲基转移酶活性,但可以 作为辅助因子,与 DNMT3A 和 DNMT3B 相互作用,增强 DNMT3A 和 DNMT3B 的活性,并 调控它们的靶向性

DNA甲基化与基因沉默 (DNA Methylation and Gene Silencing)

⚝ DNA甲基化通常与基因 沉默 (gene silencing) 相关。高 CpG 密度区域 (CpG island) 通常位于基因的 启动子区域,富含 CpG 二核苷酸序列。启动子 CpG 岛的甲基化 常常导致基因转录 抑制沉默
机制
▮▮▮▮⚝ 直接阻碍转录因子结合:启动子 CpG 岛的甲基化可以 直接阻碍某些转录因子 (transcription factors) 与 DNA 的结合,例如某些激活性转录因子,从而抑制基因转录起始。
▮▮▮▮⚝ 招募 MBD 蛋白:甲基化的 CpG 序列可以招募 甲基-CpG 结合域蛋白 (MBD),例如 MeCP2MBD1 等。MBD 蛋白可以 识别和结合甲基化的 CpG 位点,作为 支架蛋白 (scaffold protein),进一步招募 辅阻遏因子 (corepressor) 和 染色质重塑复合物 (chromatin remodeling complex),例如 组蛋白去乙酰化酶 (HDAC)NuRD 复合物。这些复合物可以 去除组蛋白乙酰化修饰促进组蛋白甲基化修饰重塑染色质结构,使染色质变得 紧密抑制基因转录

DNA去甲基化与基因激活 (DNA Demethylation and Gene Activation)

DNA去甲基化 (DNA demethylation) 是 去除 DNA 甲基化修饰 的过程,通常与基因 激活 (gene activation) 相关。DNA去甲基化由 DNA去甲基化酶 (DNA demethylase) 催化完成。
⚝ 在哺乳动物中,主要的 DNA 去甲基化途径是 TET 酶介导的氧化途径Ten-eleven translocation (TET) 酶 是一类 双加氧酶 (dioxygenase),可以催化 5mC 氧化,产生 5-羟甲基胞嘧啶 (5hmC)5-甲酰基胞嘧啶 (5fC)5-羧基胞嘧啶 (5caC) 等中间产物。胸腺嘧啶 DNA 糖基化酶 (TDG) 可以识别和切除 5fC 和 5caC。碱基切除修复途径 (base excision repair, BER) 进一步修复 TDG 切除后产生的碱基空位,最终将 5mC 转化为 未修饰的胞嘧啶 (C),实现 DNA 去甲基化。
DNA去甲基化在基因激活中的作用
▮▮▮▮⚝ 解除转录抑制:DNA 去甲基化可以 去除启动子 CpG 岛的甲基化修饰解除 MBD 蛋白的招募恢复染色质的开放状态促进转录因子和 RNA 聚合酶的结合激活基因转录
▮▮▮▮⚝ 动态调控基因表达:DNA 去甲基化与 DNA 甲基化动态平衡,共同调控基因表达的 时空特异性环境响应性。例如,在 细胞分化发育 过程中,某些基因的启动子区域发生 DNA 去甲基化,导致基因激活,参与细胞命运决定和组织器官形成。

DNA甲基化在生物学过程中的作用 (Roles of DNA Methylation in Biological Processes)

基因组印记 (Genomic Imprinting):在基因组印记基因 (imprinted gene) 中,等位基因的表达 受到 亲本来源 的影响,即 父本等位基因母本等位基因 选择性沉默,而另一个等位基因表达。基因组印记的建立和维持主要依赖于 DNA甲基化差异甲基化区域 (differentially methylated region, DMR) 是基因组印记调控的关键元件,通常位于印记基因的启动子或调控区域。
X染色体失活 (X-chromosome Inactivation):在雌性哺乳动物细胞中,两条 X 染色体中的一条 随机失活,形成 巴尔小体 (Barr body),以实现 剂量补偿,避免雌性个体 X 染色体基因表达量过高。X 染色体失活的建立和维持也与 DNA甲基化 密切相关。Xist 非编码 RNA 启动 X 染色体失活过程,DNA甲基化 参与 失活 X 染色体的稳定维持
重复序列沉默 (Repeat Sequence Silencing):基因组中存在大量的 重复序列,例如 转座子 (transposon) 和 卫星DNA (satellite DNA)。重复序列的异常激活 会导致基因组不稳定和细胞功能紊乱。DNA甲基化重复序列的沉默 中发挥重要作用,抑制转座子的转座活性维持基因组的稳定性
发育调控 (Developmental Regulation):DNA甲基化模式在 早期胚胎发育细胞分化组织器官形成 过程中发生 动态变化,参与调控 发育相关基因的表达决定细胞命运组织特异性
疾病发生 (Disease Development)DNA甲基化模式的异常改变 与多种疾病的发生发展密切相关,例如 癌症神经退行性疾病代谢性疾病自身免疫性疾病 等。癌症细胞 中常常发生 全基因组低甲基化 (global hypomethylation) 和 启动子 CpG 岛高甲基化 (promoter CpG island hypermethylation) 的现象。全基因组低甲基化 可能导致 基因组不稳定癌基因激活启动子 CpG 岛高甲基化 常常导致 抑癌基因沉默

总结

DNA甲基化 是重要的表观遗传修饰,主要指 CpG 位点的胞嘧啶甲基化。
DNMT 酶 催化 DNA 甲基化,TET 酶 介导 DNA 去甲基化。
DNA甲基化通常与基因沉默相关,通过阻碍转录因子结合和招募 MBD 蛋白等机制抑制基因转录。
DNA去甲基化通常与基因激活相关,解除转录抑制,促进基因表达。
⚝ DNA甲基化在 基因组印记X染色体失活重复序列沉默发育调控疾病发生 等生物学过程中发挥重要作用。

6.3.3 组蛋白修饰与基因调控 (Histone Modification and Gene Regulation)

组蛋白修饰 (histone modification) 是表观遗传修饰的另一重要类型,指 组蛋白 N-端尾巴 (histone N-terminal tail) 发生的 共价修饰 (covalent modification),包括 乙酰化 (acetylation)、甲基化 (methylation)、磷酸化 (phosphorylation)、泛素化 (ubiquitination) 和 SUMO化 (SUMOylation) 等。不同的组蛋白修饰类型和修饰位点对基因表达产生不同的影响,形成所谓的 组蛋白密码 (histone code)。

组蛋白修饰的类型 (Types of Histone Modification)

组蛋白乙酰化 (Histone Acetylation):发生在 赖氨酸 (Lys, K) 残基 上,由 组蛋白乙酰转移酶 (HAT) 催化添加 乙酰基 (acetyl group),由 组蛋白去乙酰化酶 (HDAC) 催化去除乙酰基。组蛋白乙酰化通常与基因激活相关,中和赖氨酸残基的正电荷,减弱组蛋白与 DNA 之间的静电吸引力,使染色质结构疏松,有利于转录。常见的乙酰化位点包括 H3K9ac、H3K14ac、H3K27ac 和 H4K16ac 等。
组蛋白甲基化 (Histone Methylation):发生在 赖氨酸 (Lys, K) 残基精氨酸 (Arg, R) 残基 上,由 组蛋白甲基转移酶 (HMT) 催化添加 甲基 (methyl group),由 组蛋白去甲基化酶 (HDM) 催化去除甲基。组蛋白甲基化对基因表达的影响较为复杂,取决于甲基化的位点和甲基化的程度。
▮▮▮▮⚝ 激活性甲基化:例如 H3K4me3 (组蛋白 H3 第 4 位赖氨酸三甲基化) 和 H3K36me3 (组蛋白 H3 第 36 位赖氨酸三甲基化) 通常与基因 激活 相关,富集在 转录活跃基因的启动子区域和基因体区域
▮▮▮▮⚝ 阻遏性甲基化:例如 H3K9me3 (组蛋白 H3 第 9 位赖氨酸三甲基化) 和 H3K27me3 (组蛋白 H3 第 27 位赖氨酸三甲基化) 通常与基因 沉默 相关,富集在 异染色质区域和转录沉默基因区域。H3K27me3 是 多梳抑制复合物 2 (PRC2) 催化的主要修饰,参与 发育基因的沉默细胞命运的维持。H3K9me3 是 异染色质蛋白 1 (HP1) 识别和结合的修饰,参与 组成型异染色质的形成和维持
组蛋白磷酸化 (Histone Phosphorylation):发生在 丝氨酸 (Ser, S) 残基苏氨酸 (Thr, T) 残基 上,由 蛋白激酶 催化添加 磷酸基团 (phosphate group),由 蛋白磷酸酶 催化去除磷酸基团。组蛋白磷酸化通常与基因激活和染色体动力学相关。例如,H3S10ph (组蛋白 H3 第 10 位丝氨酸磷酸化) 与 基因转录激活染色体凝聚 相关,在 细胞分裂应激反应 中发挥重要作用。
组蛋白泛素化 (Histone Ubiquitination):发生在 赖氨酸 (Lys, K) 残基 上,由 泛素连接酶 催化添加 泛素 (ubiquitin) 分子,由 去泛素化酶 催化去除泛素分子。组蛋白泛素化对基因表达的影响也较为复杂,取决于泛素化的位点和泛素链的类型。
▮▮▮▮⚝ H2AK119ub1 (组蛋白 H2A 第 119 位赖氨酸单泛素化) 通常与基因 阻遏 相关,由 多梳抑制复合物 1 (PRC1) 催化,参与 基因沉默和染色质压实
▮▮▮▮⚝ H2BK120ub1 (组蛋白 H2B 第 120 位赖氨酸单泛素化) 通常与基因 激活 相关,促进 转录延伸组蛋白甲基化

组蛋白修饰的识别与效应蛋白 (Recognition and Effector Proteins of Histone Modification)

⚝ 组蛋白修饰本身并不直接调控基因表达,而是作为 “信号标签” (signal tag),被 效应蛋白 (effector protein) 识别和结合,介导下游的生物学效应。效应蛋白通常包含 特定的结构域,可以 特异性识别 某种或某几种组蛋白修饰类型。常见的组蛋白修饰识别结构域包括:
▮▮▮▮⚝ 溴结构域 (Bromodomain):识别 乙酰化赖氨酸,例如 BET 家族蛋白 (BRD4) 包含溴结构域,可以结合乙酰化组蛋白,招募 转录激活复合物,促进基因转录。
▮▮▮▮⚝ 色度结构域 (Chromodomain):识别 甲基化赖氨酸,例如 HP1 蛋白 包含色度结构域,可以结合 H3K9me3,参与 异染色质的形成和维持多梳蛋白 (Polycomb protein) 包含色度结构域,可以结合 H3K27me3,参与 基因沉默
▮▮▮▮⚝ Tudor 结构域 (Tudor domain):识别 甲基化赖氨酸和精氨酸,例如 Spindlin1 蛋白 包含 Tudor 结构域,可以结合 H4R3me2,参与 早期胚胎发育
▮▮▮▮⚝ PH 结构域 (Pleckstrin homology domain):识别 磷酸化磷脂酰肌醇,也参与 蛋白质-蛋白质相互作用,例如 BPTF 蛋白 包含 PH 结构域,参与 染色质重塑和转录调控

组蛋白修饰的协同作用与组蛋白密码 (Synergistic Action and Histone Code)

组蛋白密码 (histone code) 假说 认为,不同的组蛋白修饰类型修饰位点修饰组合 可以 协同作用,形成 复杂的 “密码”,被细胞解读,调控基因表达和染色质功能。
协同激活:例如,H3K4me3H3K9ac 常常 共富集在转录活跃基因的启动子区域协同促进基因转录激活。H3K4me3 招募 CHD1 染色质重塑酶,促进染色质开放;H3K9ac 招募 溴结构域蛋白,促进转录激活复合物的组装。
拮抗作用:例如,H3K27me3H3K27ac互斥 的修饰,H3K27me3 与基因沉默相关H3K27ac 与基因激活相关组蛋白去甲基化酶 UTX/KDM6A 可以去除 H3K27me3,组蛋白乙酰转移酶 CBP/p300 可以添加 H3K27ac,动态调控 H3K27me3 和 H3K27ac 的平衡,决定基因的激活或沉默状态。

组蛋白修饰在生物学过程中的作用 (Roles of Histone Modification in Biological Processes)

基因转录调控 (Transcriptional Regulation):组蛋白修饰是 基因转录调控的重要机制,通过 改变染色质结构招募效应蛋白激活或抑制基因转录。不同的组蛋白修饰类型和修饰组合在基因转录调控中发挥不同的作用,共同精细调控基因表达的 时空特异性环境响应性
染色质结构组织 (Chromatin Organization):组蛋白修饰参与 染色质高级结构的组织和维持,例如 常染色质和异染色质的形成染色质区室化 (chromatin compartmentalization) 和 染色质环状结构 (chromatin loop)。H3K9me3 和 HP1 蛋白 参与 组成型异染色质的形成H3K27me3 和 PRC2 复合物 参与 兼性异染色质的形成
DNA修复 (DNA Repair):组蛋白修饰参与 DNA损伤修复 过程,调控 DNA 损伤修复蛋白的招募和活性。例如,H2AX 磷酸化 (γH2AX) 是 DNA 双链断裂 (double-strand break, DSB) 发生后的 早期事件招募 DNA 修复蛋白 到损伤位点,启动 DNA 修复。组蛋白乙酰化 也参与 DNA 修复促进染色质开放,有利于 DNA 修复 machinery 的接近。
染色体动力学 (Chromosome Dynamics):组蛋白修饰参与 染色体凝聚染色体分离姐妹染色单体分离 等染色体动力学过程。H3S10ph染色体凝聚 中发挥重要作用;着丝粒区域的组蛋白修饰 参与 着丝粒功能和染色体分离
疾病发生 (Disease Development)组蛋白修饰模式的异常改变 与多种疾病的发生发展密切相关,例如 癌症神经退行性疾病炎症性疾病发育缺陷 等。癌症细胞 中常常发生 组蛋白修饰酶的异常表达或突变,导致 组蛋白修饰模式紊乱影响基因表达细胞功能表观遗传药物,例如 HDAC 抑制剂溴结构域抑制剂,已经应用于 癌症治疗

总结

组蛋白修饰 是重要的表观遗传修饰,包括乙酰化、甲基化、磷酸化和泛素化等多种类型。
组蛋白修饰酶 催化组蛋白修饰的添加和去除。
不同的组蛋白修饰类型和修饰位点对基因表达产生不同的影响,形成 组蛋白密码
效应蛋白 识别和结合组蛋白修饰,介导下游的生物学效应。
⚝ 组蛋白修饰在 基因转录调控染色质结构组织DNA修复染色体动力学疾病发生 等生物学过程中发挥重要作用。

7. 突变与DNA修复 (Mutation and DNA Repair)

章节概要

本章深入探讨突变 (mutation) 的类型、发生机制和生物学效应,以及DNA修复 (DNA repair) 的机制和重要性。突变是遗传变异的最终来源,既是生物进化的动力,也可能导致疾病。了解突变的本质和细胞应对DNA损伤的机制,对于深入理解生命现象至关重要。本章将从不同层面对突变和DNA修复进行系统解析,旨在帮助读者全面掌握这一遗传学核心概念。

7.1 突变的类型与发生机制 (Types and Mechanisms of Mutation)

章节概要

本节将介绍遗传物质发生改变的不同形式,即突变的类型,并深入探讨这些突变是如何产生的,即突变的发生机制。我们将从点突变 (point mutation)染色体畸变 (chromosome aberration) 两个主要方面展开,并阐述自发突变 (spontaneous mutation)诱发突变 (induced mutation) 的发生机制和诱变因素。

7.1.1 点突变:碱基替换、插入、缺失 (Point Mutations: Base Substitution, Insertion, Deletion)

点突变是指发生在DNA分子中单个碱基对 (base pair)少数相邻碱基对的改变。根据改变的具体形式,点突变可以进一步分为以下几种类型:

碱基替换 (base substitution):指DNA分子中一个碱基对被另一个碱基对替换。根据替换碱基的类型,碱基替换又可分为:
▮▮▮▮ⓑ 转换 (transition):嘌呤 (purine) 替换为另一种嘌呤 (A<->G),或嘧啶 (pyrimidine) 替换为另一种嘧啶 (C<->T)。例如,腺嘌呤 (adenine, A) 被鸟嘌呤 (guanine, G) 替换,或者胞嘧啶 (cytosine, C) 被胸腺嘧啶 (thymine, T) 替换。
▮▮▮▮ⓒ 颠换 (transversion):嘌呤替换为嘧啶,或嘧啶替换为嘌呤。例如,腺嘌呤 (A) 被胞嘧啶 (C) 替换,或者鸟嘌呤 (G) 被胸腺嘧啶 (T) 替换。

碱基替换对基因功能的影响取决于替换发生的位置和性质。
同义突变 (synonymous mutation) (也称为沉默突变, silent mutation):如果碱基替换发生在密码子 (codon) 的第三位,由于遗传密码的简并性 (degeneracy),可能编码相同的氨基酸,因此对蛋白质序列没有影响,表型通常也不发生改变。
错义突变 (missense mutation):碱基替换导致密码子编码不同的氨基酸。这可能导致蛋白质功能部分丧失、增强或改变,也可能没有明显影响,取决于氨基酸替换的性质和在蛋白质结构中的位置。例如,镰刀型细胞贫血症 (sickle cell anemia) 就是由于血红蛋白 β 链基因 (β-globin gene) 第6位密码子的错义突变(GAG -> GTG),导致谷氨酸 (glutamic acid) 被缬氨酸 (valine) 替换,改变了血红蛋白的结构和功能。
无义突变 (nonsense mutation):碱基替换导致密码子变为终止密码子 (stop codon) (UAA, UAG, UGA)。这会导致蛋白质翻译提前终止,产生截短的、通常无功能的蛋白质。无义突变通常对基因功能产生严重影响。

插入 (insertion):指DNA分子中插入一个或多个碱基对。
缺失 (deletion):指DNA分子中缺失一个或多个碱基对。

插入和缺失统称为移码突变 (frameshift mutation),特别是当插入或缺失的碱基数目不是3的倍数时。由于密码子是由三个碱基组成的,非3的倍数的插入或缺失会改变突变位点之后的所有密码子的阅读框 (reading frame),导致翻译产生的蛋白质序列从突变位点之后完全改变,通常产生无功能的蛋白质。即使插入或缺失的碱基数目是3的倍数,如果发生在关键区域,也可能影响蛋白质功能。

7.1.2 染色体畸变:缺失、重复、倒位、易位 (Chromosome Aberrations: Deletion, Duplication, Inversion, Translocation)

染色体畸变是指染色体结构发生较大规模的改变,通常涉及多个基因 (gene) 甚至大段DNA序列。染色体畸变主要包括以下几种类型:

缺失 (deletion):染色体上丢失一段DNA序列。缺失可以是末端缺失 (terminal deletion),即染色体末端片段的丢失;也可以是中间缺失 (interstitial deletion),即染色体中间片段的丢失。染色体缺失可能导致基因丢失,从而影响细胞功能,甚至导致染色体缺失综合征 (chromosome deletion syndrome),例如猫叫综合征 (Cri-du-chat syndrome) 就是由于5号染色体短臂部分缺失引起的。

重复 (duplication):染色体上某段DNA序列重复出现。重复可以是串联重复 (tandem duplication),即重复序列紧邻原始序列排列;也可以是散在重复 (dispersed duplication),即重复序列插入到染色体其他位置。基因重复可以增加基因的剂量,可能导致基因表达量增加,在进化中也可能产生新的基因功能。

倒位 (inversion):染色体上某段DNA序列方向颠倒。倒位可以是臂内倒位 (pericentric inversion),即包含着丝粒 (centromere) 的片段发生倒位;也可以是臂间倒位 (paracentric inversion),即不包含着丝粒的片段发生倒位。倒位本身可能不影响基因剂量,但可能破坏基因的完整性,或者改变基因的位置效应 (position effect),影响基因表达调控。

易位 (translocation):染色体上某段DNA序列转移到另一条染色体上。易位可以是相互易位 (reciprocal translocation),即两条非同源染色体之间相互交换片段;也可以是罗伯逊易位 (Robertsonian translocation),即两条近端着丝粒染色体 (acrocentric chromosome) 在着丝粒附近断裂后融合形成一条大的染色体,并丢失一条小的染色体片段。染色体易位可能导致基因位置改变,影响基因表达,也可能形成融合基因 (fusion gene),例如某些类型的白血病 (leukemia) 就与染色体易位形成的融合基因有关。

7.1.3 突变的发生机制:自发突变与诱发突变 (Mechanisms of Mutation: Spontaneous and Induced Mutations)

根据突变发生的原因,可以分为自发突变 (spontaneous mutation)诱发突变 (induced mutation)

自发突变 (spontaneous mutation):指在正常细胞生长和代谢过程中自然发生的突变,没有明显的外界诱变因素。自发突变的发生机制主要包括:
▮▮▮▮ⓑ DNA复制错误 (DNA replication error):DNA复制过程中,DNA聚合酶 (DNA polymerase) 虽然具有校对功能 (proofreading activity),但仍可能发生碱基错配、插入或缺失等错误。这些错误如果未能被及时修复,就会导致突变。例如,互变异构 (tautomerization) 现象可能导致碱基配对错误。碱基可以以不同的互变异构体 (tautomer) 形式存在,罕见的互变异构体可能与错误的碱基配对,导致复制错误。
▮▮▮▮ⓒ DNA自发损伤 (spontaneous DNA damage):DNA分子在细胞内环境中会自发发生化学损伤,例如:
▮▮▮▮▮▮▮▮❹ 脱嘌呤 (depurination):嘌呤碱基 (A或G) 与脱氧核糖之间的糖苷键 (glycosidic bond) 自发断裂,导致碱基丢失,形成脱嘌呤位点 (apurinic site, AP site)
▮▮▮▮▮▮▮▮❺ 脱氨基 (deamination):碱基上的氨基 (amino group) 自发脱落。例如,胞嘧啶 (C) 脱氨基变成尿嘧啶 (U)。
▮▮▮▮▮▮▮▮❻ 氧化损伤 (oxidative damage):细胞代谢产生的活性氧 (reactive oxygen species, ROS),如超氧自由基 (superoxide radical, \(O_2^-\)), 过氧化氢 (hydrogen peroxide, \(H_2O_2\)), 羟自由基 (hydroxyl radical, \(OH^\cdot\)) 等,可以攻击DNA碱基,导致碱基氧化修饰。例如,鸟嘌呤 (G) 被氧化成 8-oxo-鸟嘌呤 (8-oxo-G),8-oxo-G 容易与腺嘌呤 (A) 发生错配。

诱发突变 (induced mutation):指由外界诱变剂 (mutagen) 引起的突变。诱变剂可以分为物理诱变剂 (physical mutagen)化学诱变剂 (chemical mutagen)
▮▮▮▮ⓑ 物理诱变剂 (physical mutagen)
▮▮▮▮▮▮▮▮❸ 紫外线 (ultraviolet, UV):UV辐射,特别是UV-B和UV-C,可以被DNA碱基吸收,导致相邻的嘧啶碱基 (特别是胸腺嘧啶, T) 之间形成嘧啶二聚体 (pyrimidine dimer),阻碍DNA复制和转录。
▮▮▮▮▮▮▮▮❹ 电离辐射 (ionizing radiation):如X射线、γ射线等,具有高能量,可以直接或间接地损伤DNA,导致DNA链断裂、碱基修饰、染色体畸变等。电离辐射可以通过水解作用 (hydrolysis) 产生自由基,间接损伤DNA。
▮▮▮▮ⓔ 化学诱变剂 (chemical mutagen):种类繁多,作用机制复杂,主要包括:
▮▮▮▮▮▮▮▮❻ 碱基类似物 (base analog):结构类似于正常碱基的化合物,可以掺入DNA复制过程中,但配对特性不同,导致复制错误。例如,5-溴尿嘧啶 (5-bromouracil, 5-BU) 类似于胸腺嘧啶 (T),但可以与腺嘌呤 (A) 或鸟嘌呤 (G) 配对。
▮▮▮▮▮▮▮▮❼ 碱基修饰剂 (base-modifying agent):可以与DNA碱基反应,改变碱基的结构和配对特性。例如:
⚝▮▮▮▮▮▮▮▮▮▮▮- 烷化剂 (alkylating agent):如甲基磺酸乙酯 (ethyl methanesulfonate, EMS), 亚硝基胍 (nitrosoguanidine, NG) 等,可以给碱基添加烷基,改变碱基配对特性。
⚝▮▮▮▮▮▮▮▮▮▮▮- 脱氨基剂 (deaminating agent):如亚硝酸 (nitrous acid, \(HNO_2\)),可以使碱基脱氨基。例如,腺嘌呤 (A) 脱氨基变成次黄嘌呤 (hypoxanthine, H),胞嘧啶 (C) 脱氨基变成尿嘧啶 (U)。
⚝▮▮▮▮▮▮▮▮▮▮▮- 羟胺 (hydroxylamine, \(NH_2OH\)):特异性地修饰胞嘧啶 (C),使其与腺嘌呤 (A) 配对。
▮▮▮▮▮▮▮▮❸ 嵌入剂 (intercalating agent):如吖啶橙 (acridine orange), 溴化乙锭 (ethidium bromide, EB) 等,可以嵌入DNA双螺旋碱基对之间,导致DNA链的插入或缺失,引起移码突变。

7.2 突变的生物学效应 (Biological Effects of Mutation)

章节概要

突变是遗传变异的来源,对生物体的影响是多方面的。本节将阐述突变对生物体的不同效应,包括有害突变 (deleterious mutation), 有利突变 (beneficial mutation)中性突变 (neutral mutation),并探讨突变在进化 (evolution) 中的作用。

7.2.1 有害突变、有利突变与中性突变 (Deleterious, Beneficial and Neutral Mutations)

根据突变对生物体适应性 (fitness) 的影响,可以分为:

有害突变 (deleterious mutation):降低生物体适应性的突变。大多数新发生的突变是有害的,因为生物体经过长期自然选择,基因组已经高度适应现有环境。有害突变可能导致:
▮▮▮▮ⓑ 功能丧失突变 (loss-of-function mutation):基因功能完全丧失或部分丧失。例如,基因编码的酶失去活性,或结构蛋白失去结构完整性。许多遗传疾病是由功能丧失突变引起的,例如囊性纤维化 (cystic fibrosis) 是由于 CFTR 基因的功能丧失突变引起的。
▮▮▮▮ⓒ 功能获得突变 (gain-of-function mutation):基因获得新的功能或原有功能增强。虽然功能获得突变有时可能是有利的,但在许多情况下,特别是对于调控基因,功能获得突变可能导致细胞生长失控,例如癌基因 (oncogene) 的激活突变通常是功能获得突变。
▮▮▮▮ⓓ 显性负效应突变 (dominant-negative mutation):突变基因的产物不仅自身失去正常功能,还会干扰正常基因产物的功能。例如,某些结构蛋白的显性负效应突变,突变蛋白与正常蛋白组装形成异常的复合物,影响细胞结构。

有利突变 (beneficial mutation):提高生物体适应性的突变。有利突变相对较少,但对于生物进化至关重要。在环境条件改变时,原先的中性或有害突变可能变为有利突变。例如,乳糖酶持续性 (lactase persistence) 突变使成年人能够消化乳糖,在以畜牧业为主的群体中是一种有利突变。抗生素抗性突变 (antibiotic resistance mutation) 使细菌能够抵抗抗生素的杀伤作用,在抗生素环境下是一种有利突变。

中性突变 (neutral mutation):对生物体适应性没有明显影响的突变。许多同义突变和发生在非编码区的突变是中性突变。即使是错义突变,如果氨基酸替换发生在蛋白质非关键区域,或者替换的氨基酸与原氨基酸性质相似,也可能对蛋白质功能没有明显影响,从而成为中性突变。中性突变在群体中积累,形成遗传多态性 (genetic polymorphism)

7.2.2 突变与进化 (Mutation and Evolution)

突变是遗传变异的最终来源,是生物进化的原始动力 (driving force)自然选择 (natural selection) 作用于由突变产生的遗传变异,使有利突变在群体中积累,有害突变被淘汰,从而导致生物进化。

突变产生遗传变异 (Mutation generates genetic variation):突变不断地产生新的等位基因 (allele),增加群体中的遗传多样性。没有突变,就没有新的遗传变异,自然选择就失去了作用的基础。

自然选择作用于遗传变异 (Natural selection acts on genetic variation):自然选择不是随机的,它倾向于保留有利的遗传变异,淘汰有害的遗传变异。在特定环境下,某些突变可能是有利的,携带这些突变的个体在生存和繁殖上更具优势,其突变基因在群体中的频率会逐渐增加。

突变与适应性进化 (Mutation and adaptive evolution):长期积累的有利突变,使生物体逐渐适应环境,产生适应性进化 (adaptive evolution)。例如,细菌对抗生素的抗性进化,病毒逃避宿主免疫系统和抗病毒药物的进化,都是突变和自然选择共同作用的结果。

突变率与进化速率 (Mutation rate and evolutionary rate)突变率 (mutation rate) 指单位时间、单位基因组或单位基因发生的突变频率。不同物种的突变率差异很大,病毒和细菌的突变率通常高于真核生物。突变率影响进化的速率,突变率高的物种进化速率可能更快,但也可能面临更高的突变负荷 (mutational load)

7.3 DNA修复机制 (DNA Repair Mechanisms)

章节概要

DNA是遗传信息的载体,维持基因组的稳定性至关重要。细胞进化出多种 DNA修复机制 (DNA repair mechanism),以应对各种DNA损伤。本节将介绍主要的DNA修复机制,包括直接修复 (direct repair), 切除修复 (excision repair), 重组修复 (recombination repair)错配修复 (mismatch repair),并阐述DNA修复在维持基因组稳定性中的重要性。

7.3.1 直接修复 (Direct Repair)

直接修复 (direct repair) 机制是指直接逆转DNA损伤,将受损的碱基或结构恢复到原始状态,而不需要切除和重新合成DNA片段。直接修复机制主要包括:

光修复 (photoreactivation):主要修复紫外线 (UV) 引起的嘧啶二聚体 (pyrimidine dimer) 损伤。光修复酶 (photolyase) 可以结合到嘧啶二聚体上,在可见光或近紫外光照射下,利用光能断裂嘧啶二聚体之间的共价键,恢复正常的嘧啶碱基。光修复是细菌、真菌、植物和许多动物细胞中重要的修复机制,但在哺乳动物 (包括人类) 细胞中,光修复酶基因通常是假基因 (pseudogene),光修复机制不活跃。

\(O^6\)-甲基鸟嘌呤-DNA甲基转移酶 ( \(O^6\)-methylguanine-DNA methyltransferase, MGMT) 修复:MGMT 酶可以修复由烷化剂 (alkylating agent) 引起的 \(O^6\)-甲基鸟嘌呤 (\(O^6\)-methylguanine, \(O^6\)-MeG) 损伤。\(O^6\)-MeG 是鸟嘌呤 (G) 的 \(O^6\) 位被甲基化的产物,容易与胸腺嘧啶 (T) 发生错配,导致 G:C -> A:T 转换突变。MGMT 酶可以将甲基转移到自身的一个半胱氨酸 (cysteine) 残基上,直接去除 \(O^6\)-MeG 上的甲基,恢复正常的鸟嘌呤 (G)。MGMT 酶是一种自杀酶 (suicide enzyme),每个酶分子只能修复一次损伤,修复后自身失活。

7.3.2 切除修复:碱基切除修复、核苷酸切除修复 (Excision Repair: Base Excision Repair, Nucleotide Excision Repair)

切除修复 (excision repair) 机制是指先识别并切除受损的碱基或核苷酸,然后利用另一条链作为模板,重新合成DNA片段,填补切除造成的空隙。切除修复主要包括 碱基切除修复 (base excision repair, BER)核苷酸切除修复 (nucleotide excision repair, NER) 两种途径。

碱基切除修复 (base excision repair, BER):主要修复小型的碱基损伤 (small base damage),例如脱氨基、烷基化、氧化损伤等。BER 途径主要步骤包括:
▮▮▮▮ⓑ DNA糖基化酶 (DNA glycosylase) 识别并切除受损的碱基,在DNA链上留下一个脱碱基位点 (abasic site) (也称为 AP 位点)。不同的DNA糖基化酶识别不同的受损碱基。例如,尿嘧啶-DNA糖基化酶 (uracil-DNA glycosylase, UDG) 识别并切除尿嘧啶 (U)。
▮▮▮▮ⓒ AP核酸内切酶 (AP endonuclease) 切割 AP 位点 5' 端的磷酸二酯键,产生一个 3'-OH 和一个 5'-脱氧核糖磷酸 (deoxyribose phosphate, dRP) 末端。
▮▮▮▮ⓓ dRP酶 (dRP lyase) 切除 5'-dRP 末端。
▮▮▮▮ⓔ DNA聚合酶 (DNA polymerase) 利用另一条链作为模板,从 3'-OH 末端开始合成新的DNA片段,填补空隙。在哺乳动物细胞中,主要的BER DNA聚合酶是 DNA聚合酶 β (DNA polymerase β, Pol β)
▮▮▮▮ⓕ DNA连接酶 (DNA ligase) 连接新合成的DNA片段和原有DNA链,完成修复。DNA连接酶 IIIα (DNA ligase IIIα, LigIIIα)X射线修复交叉互补蛋白 1 (X-ray repair cross-complementing protein 1, XRCC1) 形成复合物,参与BER的连接步骤。

核苷酸切除修复 (nucleotide excision repair, NER):主要修复 大型的DNA损伤 (bulky DNA lesion),例如嘧啶二聚体、DNA链间交联 (DNA interstrand crosslink, ICL)、某些化学修饰的碱基等。NER 途径比 BER 途径更为复杂,主要步骤包括:
▮▮▮▮ⓑ 损伤识别 (damage recognition):NER 途径的损伤识别比较复杂,在真核生物中,主要有两种 NER 途径:
▮▮▮▮▮▮▮▮❸ 全局基因组NER (global genome NER, GG-NER):负责修复整个基因组中的大型DNA损伤,由 DDB1-DDB2 复合物和 XPC-RAD23B 复合物等参与损伤识别。
▮▮▮▮▮▮▮▮❹ 转录偶联NER (transcription-coupled NER, TC-NER):特异性地修复转录活跃基因的转录区 (transcribed region) 的损伤,由停滞的 RNA聚合酶 II (RNA polymerase II, Pol II) 信号触发,CSACSB 蛋白 (Cockayne syndrome proteins A and B) 参与损伤识别。
▮▮▮▮ⓔ 双切口 (dual incision):一旦损伤被识别,NER 途径利用核酸内切酶在损伤位点两侧切开DNA链。在真核生物中,XPA, RPA, XPC, TFIIH 等多种蛋白因子组装形成 前切口复合物 (pre-incision complex),然后 XPG 核酸内切酶在损伤位点 3' 端切割,XPF-ERCC1 核酸内切酶在损伤位点 5' 端切割,切除包含损伤的 寡核苷酸片段 (oligonucleotide) (长度约为 25-30 个核苷酸)。
▮▮▮▮ⓕ DNA合成与连接 (DNA synthesis and ligation)复制蛋白A (replication protein A, RPA) 稳定单链DNA区域,复制因子C (replication factor C, RFC) 加载 增殖细胞核抗原 (proliferating cell nuclear antigen, PCNA) 滑动钳,DNA聚合酶 δ/ε (DNA polymerase δ/ε, Pol δ/ε) 利用另一条链作为模板,合成新的DNA片段,填补空隙。最后,DNA连接酶 I (DNA ligase I, LigI) 完成连接。

7.3.3 重组修复与错配修复 (Recombination Repair and Mismatch Repair)

除了直接修复和切除修复,细胞还存在其他重要的DNA修复机制,包括 重组修复 (recombination repair)错配修复 (mismatch repair, MMR)

重组修复 (recombination repair):主要修复 DNA双链断裂 (DNA double-strand break, DSB) 损伤。DSB 是最严重的DNA损伤类型,如果修复不当,可能导致染色体畸变、基因组不稳定,甚至细胞死亡。重组修复主要通过 同源重组 (homologous recombination, HR)非同源末端连接 (non-homologous end joining, NHEJ) 两种途径修复 DSB。
▮▮▮▮ⓑ 同源重组 (homologous recombination, HR):利用同源染色体或姐妹染色单体 (sister chromatid) 作为模板,修复DSB。HR 途径是精确的修复 (error-free repair) 途径,主要发生在S期和G2期,当姐妹染色单体存在时。HR 途径主要步骤包括:
▮▮▮▮▮▮▮▮❸ 末端切除 (end resection):DSB 断裂末端 5' -> 3' 方向被核酸外切酶 (如 Mre11-Rad50-Nbs1 (MRN) 复合物Exo1) 切除,产生 3' 单链DNA尾。
▮▮▮▮▮▮▮▮❹ 链入侵 (strand invasion):单链DNA尾 Rad51 蛋白结合,形成 Rad51-DNA丝状体 (Rad51-DNA filament),在同源DNA模板上寻找同源序列,并入侵到同源双链DNA中,形成 D-loop 结构。
▮▮▮▮▮▮▮▮❺ DNA合成与连接 (DNA synthesis and ligation):利用同源DNA模板,DNA聚合酶合成新的DNA片段,填补DSB 造成的空隙。最后,DNA连接酶完成连接。
▮▮▮▮ⓕ 非同源末端连接 (non-homologous end joining, NHEJ):直接连接DSB 断裂的DNA末端,不需要同源模板。NHEJ 途径是 易错的修复 (error-prone repair) 途径,可能导致插入或缺失突变。NHEJ 途径在整个细胞周期都活跃,是哺乳动物细胞修复DSB 的主要途径。NHEJ 途径主要步骤包括:
▮▮▮▮▮▮▮▮❼ 末端识别与结合 (end recognition and binding)Ku70/Ku80 二聚体蛋白结合到DSB 断裂末端,招募其他 NHEJ 因子。
▮▮▮▮▮▮▮▮❽ 末端加工 (end processing):如果DNA末端不兼容,需要 核酸酶 (nuclease) (如 Artemis) 和 聚合酶 (polymerase) (如 DNA聚合酶 μ/λ (DNA polymerase μ/λ, Pol μ/λ)) 对DNA末端进行加工,使其变得平齐。
▮▮▮▮▮▮▮▮❾ 连接 (ligation)DNA连接酶 IV (DNA ligase IV, LigIV)XRCC4XLF 等辅助因子形成复合物,连接DNA末端。

错配修复 (mismatch repair, MMR):主要修复DNA复制过程中产生的 碱基错配 (base mismatch)小段插入/缺失环 (small insertion/deletion loop, IDL) 损伤。MMR 途径可以提高DNA复制的保真性。MMR 途径主要步骤包括:
▮▮▮▮ⓑ 错配识别 (mismatch recognition):MMR 蛋白复合物识别DNA错配。在细菌中,主要的MMR 蛋白是 MutS, MutL, MutH。在真核生物中,MutS 同源蛋白包括 MSH2, MSH3, MSH6,MutL 同源蛋白包括 MLH1, PMS2, MLH3, PMS1
▮▮▮▮ⓒ 切口形成 (incision):MMR 蛋白复合物区分新合成链和模板链,并在新合成链上切开一个切口。在细菌中,MutH 核酸内切酶在新合成链的非甲基化 GATC 序列上切开切口。在真核生物中,新合成链的区分机制尚不完全清楚,可能与 PCNA, 单链DNA断裂 (single-strand break, SSB) 等信号有关。
▮▮▮▮ⓓ 切除与合成 (excision and synthesis):核酸外切酶 (如 Exo1) 从切口处开始,切除包含错配的DNA片段。然后,DNA聚合酶 (如 DNA聚合酶 δ (DNA polymerase δ, Pol δ)) 利用模板链合成新的DNA片段,填补空隙。
▮▮▮▮ⓔ 连接 (ligation):DNA连接酶完成连接。

DNA修复机制对于维持基因组的稳定性至关重要。DNA修复缺陷与许多疾病有关,包括癌症、神经退行性疾病、衰老等。例如,遗传性非息肉病性结直肠癌 (hereditary nonpolyposis colorectal cancer, HNPCC) (也称为 Lynch 综合征 (Lynch syndrome)) 就是由于 MMR 基因 (如 MLH1, MSH2, MSH6, PMS2) 的突变引起的。着色性干皮病 (xeroderma pigmentosum, XP) 是一种罕见的遗传性疾病,患者 NER 途径缺陷,对紫外线高度敏感,容易发生皮肤癌。

8. 重组DNA技术与生物技术 (Recombinant DNA Technology and Biotechnology)

8.1 重组DNA技术的基本原理 (Basic Principles of Recombinant DNA Technology)

8.1.1 限制性内切酶与DNA切割 (Restriction Enzymes and DNA Cutting)

限制性内切酶 (restriction enzymes),也称为限制酶 (restriction enzymes),是重组DNA技术 (recombinant DNA technology) 的基石。它们是一类能够识别DNA分子中特定核苷酸序列并在此序列或其附近切割双链DNA的酶。这些酶在细菌和古细菌中天然存在,作为一种防御机制,抵抗噬菌体 (bacteriophages) 等外源DNA的入侵。

限制性内切酶的类型 (Types of Restriction Enzymes)

限制性内切酶主要分为四种类型:I型、II型、III型和IV型,其中II型限制性内切酶在基因工程 (genetic engineering) 中应用最为广泛,因为它们具有以下特点:

▮▮▮▮ⓐ 识别位点明确 (Specific Recognition Sites):II型限制酶识别的DNA序列通常是4到8个碱基对 (base pairs, bp) 长度的回文序列 (palindromic sequences)。回文序列指的是DNA双链中正向和反向序列一致的片段,例如 5'-GAATTC-3' 和 3'-CTTAAG-5'。
▮▮▮▮ⓑ 切割位点固定 (Defined Cleavage Sites):II型限制酶在识别序列内部或非常靠近识别序列的位置进行切割,切割位点是固定的。
▮▮▮▮ⓒ 切割方式多样 (Diverse Cleavage Patterns):II型限制酶的切割方式可以产生两种类型的DNA末端:
▮▮▮▮▮▮▮▮❹ 黏性末端 (sticky ends),也称为粘端或粘性突出末端 (cohesive ends or cohesive termini):酶切割位点在回文序列中错开,产生单链突出,这些突出端可以与其他具有互补序列的DNA片段通过碱基配对 (base pairing) 相互连接。例如, EcoRI 酶切割后产生 5' 突出端。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 5'-G A A T T C-3' 5'-G A A T T C-3'
2 3'-C T T A A G-5' EcoRI 3'-C T T A A G-5'

▮▮▮▮▮▮▮▮❷ 平末端 (blunt ends):酶切割位点在回文序列的正中间,产生平齐的末端,没有单链突出。例如, AluI 酶切割后产生平末端。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 5'-A G C T-3' 5'-A G C T-3'
2 3'-T C G A-5' AluI 3'-T C G A-5'

限制性内切酶的功能 (Functions of Restriction Enzymes)

在重组DNA技术中,限制性内切酶的主要功能是精确切割DNA分子,为后续的DNA片段连接 (DNA ligation) 创造条件。通过选择合适的限制酶,可以:

▮▮▮▮ⓐ 获取目的基因片段 (Obtain Target Gene Fragments):从供体DNA (donor DNA) 中切割出含有目的基因 (target gene) 的DNA片段。
▮▮▮▮ⓑ 线性化载体DNA (Linearize Vector DNA):将环状的载体DNA (vector DNA),如质粒 (plasmid),切割成线性分子,以便插入外源DNA片段。
▮▮▮▮ⓒ 产生相容的末端 (Generate Compatible Ends):使用相同的限制酶切割目的基因片段和载体DNA,可以产生具有相同黏性末端或平末端的DNA片段,方便后续的连接反应。

限制性内切酶的应用实例 (Examples of Restriction Enzymes)

以下是一些常用的II型限制性内切酶及其识别序列和切割位点:

限制酶 (Restriction Enzyme)来源 (Source)识别序列 (Recognition Sequence) (5'-3')切割位点 (Cleavage Site)末端类型 (End Type)
EcoRIEscherichia coli RY13G<0xE2><0x88><0xB7>AATTCG<0xE2><0x88><0xB7> AATTC黏性末端 (Sticky End)
HindIIIHaemophilus influenzae RdA<0xE2><0x88><0xB7>AGCTTA<0xE2><0x88><0xB7> AGCTT黏性末端 (Sticky End)
BamHIBacillus amyloliquefaciens HG<0xE2><0x88><0xB7>GATCCG<0xE2><0x88><0xB7> GATCC黏性末端 (Sticky End)
AluIArthrobacter luteusAG<0xE2><0x88><0xB7>CTAG<0xE2><0x88><0xB7> CT平末端 (Blunt End)
SmaISerratia marcescensCCC<0xE2><0x88><0xB7>GGGCCC<0xE2><0x88><0xB7>GGG平末端 (Blunt End)
NotINocardia otitidis-caviarumGC<0xE2><0x88><0xB7>GGCCGCGC<0xE2><0x88><0xB7>GGCCGC黏性末端 (Sticky End)

在实际操作中,选择合适的限制酶需要考虑以下因素:

▮▮▮▮ⓐ 目的基因和载体DNA上的酶切位点 (Enzyme Cutting Sites on Target Gene and Vector DNA):需要选择在目的基因两侧和载体DNA上具有合适酶切位点的限制酶,以便于目的基因的插入。
▮▮▮▮ⓑ 酶切位点的唯一性 (Uniqueness of Enzyme Cutting Sites):理想情况下,选择的限制酶在载体DNA上只有一个酶切位点,以确保载体被线性化,而不是被切成多段。
▮▮▮▮ⓒ 酶切效率和条件 (Enzyme Digestion Efficiency and Conditions):不同限制酶的酶切效率和最佳反应条件可能不同,需要根据具体情况进行优化。

8.1.2 DNA连接酶与DNA连接 (DNA Ligase and DNA Ligation)

DNA连接酶 (DNA ligase) 是一类催化DNA片段之间磷酸二酯键 (phosphodiester bond) 形成的酶,在重组DNA技术中,DNA连接酶扮演着“分子胶水”的角色,用于将DNA片段连接起来,构建重组DNA分子 (recombinant DNA molecules)。

DNA连接酶的功能 (Functions of DNA Ligase)

DNA连接酶的主要功能是连接DNA片段的末端,修复DNA链中的缺口 (nicks)。在DNA复制 (DNA replication)、DNA修复 (DNA repair) 和DNA重组 (DNA recombination) 等生物过程中,DNA连接酶都发挥着重要作用。在重组DNA技术中,DNA连接酶主要用于:

▮▮▮▮ⓐ 连接DNA片段 (Joining DNA Fragments):将用限制性内切酶切割产生的DNA片段,包括目的基因片段和线性化的载体DNA,通过DNA连接酶连接起来,形成环状的重组DNA分子。
▮▮▮▮ⓑ 修复DNA缺口 (Repairing DNA Nicks):在DNA复制、修复和重组过程中,可能会产生DNA链的缺口,DNA连接酶可以修复这些缺口,维持DNA的完整性。

DNA连接酶的连接机制 (Mechanism of DNA Ligation)

DNA连接酶催化DNA连接反应通常需要以下几个步骤:

▮▮▮▮ⓐ 酶的激活 (Enzyme Activation):DNA连接酶首先与辅因子 (cofactor) 结合而被激活。常用的DNA连接酶,如 E. coli DNA 连接酶和 T4 DNA 连接酶,以NAD\(^{+}\) 或 ATP 作为辅因子。酶与辅因子结合后,辅因子上的腺苷酸基团 (adenylate group) 转移到酶的活性中心,形成酶-腺苷酸中间体。
\[ \text{酶} + \text{ATP (或 NAD}^+ \text{)} \rightleftharpoons \text{酶-腺苷酸} + \text{PP}_i \text{ (或 NMN)} \]
▮▮▮▮ⓑ 腺苷酸基团转移到DNA 5'-磷酸末端 (Adenylate Group Transfer to DNA 5'-Phosphate Terminus):酶-腺苷酸中间体将腺苷酸基团转移到DNA片段的5'-磷酸末端,形成DNA-腺苷酸中间体。
\[ \text{酶-腺苷酸} + \text{DNA-5'-P} \rightleftharpoons \text{酶} + \text{DNA-5'-腺苷酸} \]
▮▮▮▮ⓒ 磷酸二酯键形成 (Phosphodiester Bond Formation):DNA-腺苷酸中间体上的腺苷酸基团被DNA片段的3'-羟基末端上的氧原子攻击,形成磷酸二酯键,同时释放腺苷酸单磷酸 (AMP)。
\[ \text{DNA-5'-腺苷酸} + \text{DNA-3'-OH} \rightleftharpoons \text{DNA-5'-3' 磷酸二酯键-DNA} + \text{AMP} \]

DNA连接酶可以连接具有黏性末端平末端的DNA片段,但连接效率有所不同。

▮▮▮▮ⓐ 黏性末端连接 (Sticky End Ligation):黏性末端连接效率较高,因为黏性末端之间可以通过碱基配对形成氢键 (hydrogen bonds),使DNA片段末端靠近,有利于DNA连接酶催化磷酸二酯键的形成。此外,黏性末端连接具有方向性,可以控制DNA片段的连接方向。
▮▮▮▮ⓑ 平末端连接 (Blunt End Ligation):平末端连接效率较低,因为平末端之间缺乏碱基配对的相互作用,DNA片段末端不易靠近。为了提高平末端连接效率,通常需要使用较高浓度的DNA连接酶和聚乙二醇 (polyethylene glycol, PEG) 等促连接剂。平末端连接没有方向性,连接产物可能是多种方向的组合。

常用的DNA连接酶 (Commonly Used DNA Ligases)

在分子克隆 (molecular cloning) 中,常用的DNA连接酶主要有两种:

▮▮▮▮ⓐ T4 DNA连接酶 (T4 DNA Ligase):来源于T4噬菌体,以ATP为辅因子,可以连接DNA和RNA的双链或单链片段,既可以连接黏性末端,也可以连接平末端,应用范围广泛,是分子克隆中最常用的DNA连接酶。
▮▮▮▮ⓑ E. coli DNA连接酶 (E. coli DNA Ligase):来源于大肠杆菌 (Escherichia coli),以NAD\(^{+}\)为辅因子,主要用于修复DNA双链中的缺口,连接效率较低,通常只用于连接黏性末端。

影响DNA连接效率的因素 (Factors Affecting DNA Ligation Efficiency)

DNA连接效率受多种因素影响,为了获得高效的连接,需要优化反应条件:

▮▮▮▮ⓐ DNA末端类型 (DNA End Type):黏性末端连接效率高于平末端连接。
▮▮▮▮ⓑ DNA末端浓度 (DNA End Concentration):适当提高DNA末端浓度可以增加连接效率,但过高浓度可能导致DNA片段自连 (self-ligation) 或形成多聚体 (multimers)。
▮▮▮▮ⓒ DNA片段比例 (Molar Ratio of DNA Fragments):在连接目的基因片段和载体DNA时,需要优化两者的摩尔比 (molar ratio),通常载体DNA与插入片段的摩尔比为1:3或1:5。
▮▮▮▮ⓓ DNA连接酶浓度 (DNA Ligase Concentration):适当提高DNA连接酶浓度可以提高连接效率,但过高浓度可能导致非特异性连接。
▮▮▮▮ⓔ 反应温度和时间 (Reaction Temperature and Time):T4 DNA连接酶的最佳反应温度为16℃,通常在16℃连接过夜 (overnight) 或室温连接数小时。
▮▮▮▮ⓕ 连接缓冲液成分 (Ligation Buffer Components):连接缓冲液中含有ATP、MgCl\(_{2}\) 等辅因子和金属离子,对DNA连接酶的活性至关重要。

8.1.3 载体与DNA导入宿主细胞 (Vectors and DNA Introduction into Host Cells)

载体 (vectors) 是重组DNA技术中用于携带外源DNA片段进入宿主细胞 (host cells) 并进行复制的DNA分子。理想的载体应具备以下特点:

载体的基本特性 (Basic Characteristics of Vectors)

▮▮▮▮ⓐ 自我复制能力 (Self-replication):载体必须能够在宿主细胞内自主复制,以扩增外源DNA片段。
▮▮▮▮ⓑ 大小适中 (Appropriate Size):载体分子不宜过大,以便于操作和导入宿主细胞。
▮▮▮▮ⓒ 具有多个酶切位点 (Multiple Cloning Sites, MCS):载体应具有多个限制性内切酶酶切位点,方便外源DNA片段的插入。这些酶切位点通常集中在一个区域,称为多克隆位点 (multiple cloning site, MCS) 或多酶切位点 (polylinker)。
▮▮▮▮ⓓ 具有选择标记 (Selectable Markers):载体应带有选择标记基因 (selectable marker genes),如抗生素抗性基因 (antibiotic resistance genes) 或营养缺陷型互补基因 (auxotrophic marker genes),用于筛选含有重组DNA分子的宿主细胞。
▮▮▮▮ⓔ 操作简便 (Easy to Manipulate):载体的构建、改造和提取应操作简便。

常用的载体类型 (Common Types of Vectors)

根据载体类型和宿主细胞的不同,常用的载体主要有以下几种:

▮▮▮▮ⓐ 质粒载体 (Plasmid Vectors):质粒 (plasmids) 是细菌和酵母菌等细胞中存在的环状双链DNA分子,可以自主复制。质粒载体是最常用的克隆载体,适用于克隆较小的DNA片段(0.1-10 kb)。
▮▮▮▮▮▮▮▮❷ 质粒载体的组成 (Components of Plasmid Vectors)
复制起点 (origin of replication, ori):是质粒DNA复制的起始位点,决定质粒的复制和拷贝数 (copy number)。
选择标记基因 (selectable marker gene):如氨苄青霉素抗性基因 (ampicillin resistance gene, ampR)、卡那霉素抗性基因 (kanamycin resistance gene, kanR) 等,用于筛选转化子 (transformants)。
多克隆位点 (multiple cloning site, MCS):含有多个限制性内切酶酶切位点,方便外源DNA片段的插入。
▮▮▮▮▮▮▮▮❷ 质粒载体的类型 (Types of Plasmid Vectors)
克隆质粒 (cloning plasmids):主要用于DNA片段的克隆和扩增,如pBR322、pUC系列质粒。
表达质粒 (expression plasmids):除了克隆质粒的基本元件外,还含有启动子 (promoter)、核糖体结合位点 (ribosome binding site, RBS)、转录终止子 (transcription terminator) 等调控元件,用于外源基因的表达。
▮▮▮▮ⓑ 噬菌体载体 (Bacteriophage Vectors):噬菌体 (bacteriophages) 是感染细菌的病毒,常用的噬菌体载体有λ噬菌体 (lambda phage) 和M13噬菌体 (M13 phage)。噬菌体载体适用于克隆较大的DNA片段(λ噬菌体可克隆10-20 kb,M13噬菌体用于制备单链DNA)。
▮▮▮▮▮▮▮▮❷ λ噬菌体载体 (Lambda Phage Vectors):λ噬菌体基因组中间区域的DNA可以被外源DNA替换,构建替换型载体 (replacement vectors);也可以将外源DNA插入到λ噬菌体基因组的特定位点,构建插入型载体 (insertion vectors)。λ噬菌体载体包装效率高,可以高效导入细菌细胞。
▮▮▮▮▮▮▮▮❸ M13噬菌体载体 (M13 Phage Vectors):M13噬菌体是丝状噬菌体,其基因组为单链DNA。M13噬菌体载体主要用于制备单链DNA,方便进行DNA测序 (DNA sequencing) 和定点诱变 (site-directed mutagenesis)。
▮▮▮▮ⓓ 病毒载体 (Viral Vectors):病毒 (viruses) 可以感染多种细胞,包括哺乳动物细胞。病毒载体适用于基因治疗 (gene therapy) 和真核细胞基因表达,常用的病毒载体有腺病毒载体 (adenovirus vectors)、逆转录病毒载体 (retrovirus vectors) 和腺相关病毒载体 (adeno-associated virus vectors, AAV vectors)。
▮▮▮▮▮▮▮▮❺ 腺病毒载体 (Adenovirus Vectors):腺病毒 (adenoviruses) 可以感染多种哺乳动物细胞,滴度高,感染效率高,但腺病毒载体介导的基因表达是短暂的,且可能引起免疫反应。
▮▮▮▮▮▮▮▮❻ 逆转录病毒载体 (Retrovirus Vectors):逆转录病毒 (retroviruses) 可以将RNA基因组逆转录 (reverse transcription) 成DNA整合到宿主细胞基因组中,实现外源基因的长期稳定表达。但逆转录病毒载体只能感染分裂细胞,且有插入突变 (insertional mutagenesis) 的风险。
▮▮▮▮▮▮▮▮❼ 腺相关病毒载体 (Adeno-associated Virus Vectors, AAV Vectors):腺相关病毒 (adeno-associated viruses, AAV) 是一种无致病性的细小病毒,AAV载体感染细胞范围广,免疫原性低,基因表达持久稳定,是基因治疗中最有前景的病毒载体之一
▮▮▮▮ⓗ 其他载体 (Other Vectors):除了上述常用的载体外,还有一些特殊的载体,如:
▮▮▮▮▮▮▮▮❾ 粘粒 (Cosmids):结合了质粒和λ噬菌体 cos 位点的载体,可以包装到λ噬菌体颗粒中,高效导入细菌细胞,适用于克隆较大的DNA片段(30-45 kb)。
▮▮▮▮▮▮▮▮❿ 酵母人工染色体 (Yeast Artificial Chromosomes, YACs)细菌人工染色体 (Bacterial Artificial Chromosomes, BACs):用于克隆非常大的DNA片段(YACs可克隆100 kb-3 Mb,BACs可克隆100-300 kb),常用于基因组文库 (genomic library) 的构建和大型基因的研究。

DNA导入宿主细胞的方法 (Methods for DNA Introduction into Host Cells)

将重组DNA分子导入宿主细胞的过程称为转化 (transformation)、转染 (transfection) 或转导 (transduction),根据宿主细胞类型和载体类型的不同,常用的DNA导入方法主要有:

▮▮▮▮ⓐ 转化 (Transformation):主要用于细菌细胞酵母细胞的DNA导入。
▮▮▮▮▮▮▮▮❷ 细菌转化 (Bacterial Transformation)
感受态细胞法 (Competent Cell Method):利用物理或化学方法处理细菌细胞,使其细胞膜通透性增加,易于DNA分子进入细胞。常用的方法有:
钙离子转化法 (Calcium Chloride Transformation):用氯化钙 (CaCl\(_{2}\)) 处理细菌细胞,使其成为感受态细胞,然后将质粒DNA与感受态细胞混合,经过热激 (heat shock) 处理,促使DNA进入细胞。
电穿孔转化法 (Electroporation):利用高压脉冲在细胞膜上形成瞬时孔道,使DNA分子通过孔道进入细胞。电穿孔转化法转化效率高,适用于多种细菌和酵母菌。
▮▮▮▮▮▮▮▮❷ 酵母转化 (Yeast Transformation):酵母细胞壁较厚,DNA导入相对困难,常用的方法有:
锂离子转化法 (Lithium Acetate Transformation):用醋酸锂 (lithium acetate) 处理酵母细胞,破坏细胞壁结构,增加细胞膜通透性,然后加入质粒DNA和聚乙二醇 (PEG) 等促转化剂,促使DNA进入细胞。
电穿孔转化法 (Electroporation):电穿孔转化法也适用于酵母细胞的DNA导入,转化效率较高。
▮▮▮▮ⓑ 转染 (Transfection):主要用于真核细胞,特别是哺乳动物细胞的DNA导入。
▮▮▮▮▮▮▮▮❷ 化学转染法 (Chemical Transfection):利用化学试剂,如磷酸钙 (calcium phosphate)、脂质体 (liposomes)、阳离子聚合物 (cationic polymers) 等,中和DNA的负电荷,促进DNA与细胞膜的结合,并帮助DNA进入细胞。
磷酸钙转染法 (Calcium Phosphate Transfection):利用磷酸钙沉淀与DNA共沉淀,沉淀物被细胞内吞 (endocytosis) 进入细胞。
脂质体转染法 (Lipofection):利用脂质体包裹DNA,脂质体与细胞膜融合,将DNA释放到细胞内。脂质体转染法效率高,毒性低,是常用的真核细胞转染方法。
阳离子聚合物转染法 (Cationic Polymer Transfection):利用阳离子聚合物,如聚乙烯亚胺 (polyethyleneimine, PEI),与DNA结合形成复合物,复合物通过内吞作用进入细胞。
▮▮▮▮▮▮▮▮❷ 物理转染法 (Physical Transfection):利用物理方法直接将DNA导入细胞。
电穿孔转染法 (Electroporation):电穿孔转染法也适用于真核细胞,特别是悬浮细胞的DNA导入。
显微注射法 (Microinjection):直接将DNA注射到细胞核或细胞质中,适用于少量细胞的转染,效率高,但操作复杂。
基因枪法 (Gene Gun):将DNA包裹在金或钨微粒上,用高压气体将微粒射入细胞,适用于植物细胞和组织转染。
▮▮▮▮ⓒ 转导 (Transduction):利用病毒载体将外源基因导入宿主细胞。病毒载体具有天然的感染细胞能力,转导效率高,适用于多种细胞类型,特别是难以转染的细胞,如原代细胞 (primary cells) 和干细胞 (stem cells)。

8.1.4 基因克隆与筛选 (Gene Cloning and Screening)

基因克隆 (gene cloning),也称为DNA克隆 (DNA cloning) 或分子克隆 (molecular cloning),是指将特定的基因或DNA片段分离出来,并进行大量复制的过程。基因克隆是重组DNA技术的核心内容,为基因功能研究、基因工程应用奠定了基础。

基因克隆的步骤 (Steps of Gene Cloning)

基因克隆通常包括以下几个基本步骤:

▮▮▮▮ⓐ DNA片段的制备 (Preparation of DNA Fragments)
目的基因的获取 (Obtaining Target Gene):从供体DNA (基因组DNA、cDNA等) 中获取含有目的基因的DNA片段。常用的方法包括:
限制性内切酶酶切 (Restriction Enzyme Digestion):使用限制性内切酶切割供体DNA,获得含有目的基因的DNA片段。
聚合酶链式反应 (PCR) 扩增 (PCR Amplification):利用PCR技术,以特定的引物 (primers) 从供体DNA中扩增目的基因片段。
化学合成 (Chemical Synthesis):对于较小的基因或DNA片段,可以通过化学方法合成。
载体DNA的制备 (Preparation of Vector DNA):选择合适的载体 (如质粒、噬菌体、病毒载体),并用与目的基因片段相同的限制性内切酶进行酶切,使载体DNA线性化。
▮▮▮▮ⓑ DNA片段的连接 (DNA Ligation):将目的基因片段与线性化的载体DNA混合,加入DNA连接酶,在合适的条件下进行连接反应,形成重组DNA分子。
▮▮▮▮ⓒ 重组DNA分子的导入 (Introduction of Recombinant DNA Molecules):将构建好的重组DNA分子导入宿主细胞 (如细菌、酵母菌、哺乳动物细胞)。常用的方法包括转化 (transformation)、转染 (transfection) 和转导 (transduction)。
▮▮▮▮ⓓ 转化子的筛选 (Screening of Transformants):将导入重组DNA分子的宿主细胞进行培养,并利用载体上的选择标记基因 (selectable marker gene) 筛选出成功导入重组DNA分子的转化子。
▮▮▮▮ⓔ 克隆的鉴定与扩增 (Identification and Amplification of Clones):从筛选得到的转化子中,进一步鉴定含有目的基因的克隆,并进行培养扩增,获得大量的重组DNA分子和含有目的基因的宿主细胞克隆。

转化子的筛选方法 (Screening Methods for Transformants)

转化子的筛选是基因克隆的关键步骤,常用的筛选方法主要有:

▮▮▮▮ⓐ 抗生素筛选 (Antibiotic Selection):载体上通常带有抗生素抗性基因 (antibiotic resistance gene),如氨苄青霉素抗性基因 (ampR) 或卡那霉素抗性基因 (kanR)。将转化后的宿主细胞培养在含有相应抗生素的培养基上,只有成功导入含有抗生素抗性基因的重组DNA分子的细胞才能存活,从而筛选出转化子。
▮▮▮▮ⓑ 蓝白斑筛选 (Blue-White Screening):蓝白斑筛选是一种常用的筛选重组质粒的方法,常用于pUC系列质粒。pUC系列质粒的多克隆位点位于 lacZ 基因 (β-半乳糖苷酶基因) 的编码区内。
▮▮▮▮▮▮▮▮❸ 筛选原理 (Screening Principle)
未插入外源DNA的质粒 (Non-recombinant Plasmid):当外源DNA没有插入到质粒的多克隆位点时,lacZ 基因可以正常表达,产生具有活性的β-半乳糖苷酶 (β-galactosidase)。在培养基中加入显色底物X-gal (5-溴-4-氯-3-吲哚-β-D-半乳糖苷) 和诱导剂IPTG (异丙基-β-D-硫代半乳糖苷),β-半乳糖苷酶可以水解X-gal,产生蓝色产物,菌落呈现蓝色 (blue)
插入外源DNA的质粒 (Recombinant Plasmid):当外源DNA插入到质粒的多克隆位点后,lacZ 基因的编码区被破坏,不能正常表达,不能产生具有活性的β-半乳糖苷酶。在含有X-gal和IPTG的培养基上,菌落不能水解X-gal,呈现白色 (white)
▮▮▮▮▮▮▮▮❷ 筛选步骤 (Screening Steps):将连接产物转化大肠杆菌感受态细胞,涂布在含有抗生素、X-gal和IPTG的平板上培养。观察菌落颜色,白色菌落即为可能含有重组质粒的克隆,蓝色菌落为含有未重组质粒的克隆。
▮▮▮▮ⓒ 菌落/噬菌斑杂交 (Colony/Plaque Hybridization):利用核酸探针 (nucleic acid probe) 检测含有目的基因的克隆。
▮▮▮▮▮▮▮▮❸ 筛选原理 (Screening Principle):将转化后的菌落或噬菌斑转移到固相支持物 (如硝酸纤维素膜或尼龙膜) 上,进行DNA原位杂交 (in situ hybridization)。用放射性同位素或非放射性标记的目的基因探针与膜上的DNA进行杂交,洗去未杂交的探针,通过放射自显影 (autoradiography) 或化学发光 (chemiluminescence) 检测杂交信号。
▮▮▮▮▮▮▮▮❹ 筛选步骤 (Screening Steps)
⚝ 将转化后的菌落或噬菌斑转移到膜上,进行碱变性 (alkaline denaturation) 和固定 (fixation) 处理,使DNA单链化并固定在膜上。
⚝ 用标记的目的基因探针与膜进行杂交。
⚝ 洗去未杂交的探针。
⚝ 检测杂交信号,阳性信号对应的菌落或噬菌斑即为含有目的基因的克隆。
▮▮▮▮ⓓ 聚合酶链式反应 (PCR) 筛选 (PCR Screening):利用PCR技术快速检测含有目的基因的克隆。
▮▮▮▮▮▮▮▮❷ 筛选原理 (Screening Principle):从转化子中提取质粒DNA或直接裂解菌体,以目的基因特异性引物进行PCR扩增。如果PCR产物中出现目的基因片段,则表明该克隆含有目的基因。
▮▮▮▮▮▮▮▮❸ 筛选步骤 (Screening Steps)
⚝ 提取转化子的质粒DNA或裂解菌体。
⚝ 以提取的DNA为模板,进行PCR扩增,引物为目的基因特异性引物。
⚝ 对PCR产物进行琼脂糖凝胶电泳 (agarose gel electrophoresis) 分析,检测是否出现目的基因片段大小的条带。

8.2 聚合酶链式反应 (PCR) (Polymerase Chain Reaction (PCR))

8.2.1 PCR的原理与步骤 (Principles and Steps of PCR)

聚合酶链式反应 (Polymerase Chain Reaction, PCR) 是一种在体外 (in vitro) 快速扩增特定DNA片段的分子生物学技术。PCR技术可以在数小时内将目标DNA片段扩增数百万甚至数十亿倍,如同“基因的体外扩增器 (in vitro gene amplifier)”。PCR技术的发明被誉为分子生物学领域的一场革命,极大地推动了遗传学、生物化学、医学、法医学等领域的发展。

PCR的原理 (Principles of PCR)

PCR的原理是DNA复制。在PCR反应中,利用DNA聚合酶 (DNA polymerase) 催化DNA链的延伸,以模板DNA (template DNA) 为指导,以引物 (primers) 为起始,以dNTPs (脱氧核苷三磷酸) 为原料,通过变性 (denaturation)、退火 (annealing)、延伸 (extension) 三个步骤的循环,实现DNA片段的指数扩增 (exponential amplification)。

PCR的步骤 (Steps of PCR)

一个标准的PCR循环包括以下三个步骤:

▮▮▮▮ⓐ 变性 (Denaturation):将反应体系加热到94-98℃,高温破坏DNA双链之间的氢键,使双链DNA解链成单链DNA,为引物退火和DNA聚合酶延伸提供模板。变性时间通常为20-30秒。
▮▮▮▮ⓑ 退火 (Annealing):将反应体系温度降低到50-65℃ (具体退火温度根据引物序列而定),使引物与单链DNA模板上的互补序列结合,形成局部双链结构,为DNA聚合酶提供起始延伸的3'-OH末端。退火时间通常为20-40秒。
▮▮▮▮ⓒ 延伸 (Extension):将反应体系温度升高到72℃ (对于 Taq DNA 聚合酶的最佳延伸温度),DNA聚合酶以单链DNA为模板,以dNTPs为原料,从引物的3'-OH末端开始,按照5'→3'方向合成新的DNA链。延伸时间根据扩增片段的长度和DNA聚合酶的延伸速度而定,通常每kb延伸时间为1分钟。

完成一个循环后,新合成的DNA链可以作为下一轮循环的模板,重复进行变性、退火、延伸三个步骤。每完成一个循环,目标DNA片段的拷贝数就增加一倍,经过20-30个循环,目标DNA片段就可以扩增数百万倍。

PCR反应体系的组成 (Components of PCR Reaction System)

一个标准的PCR反应体系通常包含以下组分:

▮▮▮▮ⓐ DNA模板 (DNA Template):作为PCR扩增的起始材料,可以是基因组DNA、cDNA、质粒DNA等。模板DNA的质量和纯度对PCR反应的成功至关重要。
▮▮▮▮ⓑ 引物 (Primers):是PCR反应特异性的关键。引物是人工合成的寡核苷酸链,通常为18-30个碱基对长度,与模板DNA两侧 flanking 序列互补。一对引物包括上游引物 (forward primer)下游引物 (reverse primer),分别与模板DNA的两条链结合,并确定PCR扩增的DNA片段的起始和终止位置。引物设计需要考虑以下因素:
▮▮▮▮▮▮▮▮❸ 引物长度 (Primer Length):通常为18-30个碱基对,过短特异性差,过长退火温度过高。
▮▮▮▮▮▮▮▮❹ 碱基组成 (Base Composition):GC含量 (GC content) 宜为40-60%,GC含量过高或过低都会影响引物退火和延伸。
▮▮▮▮▮▮▮▮❺ 退火温度 (Melting Temperature, Tm):引物退火温度应略低于引物的熔解温度 (melting temperature, Tm),Tm值可以通过公式估算或软件计算。
▮▮▮▮▮▮▮▮❻ 引物二聚体和发夹结构 (Primer Dimers and Hairpin Structures):引物序列应避免形成引物二聚体 (primer dimers) 和发夹结构 (hairpin structures),以免影响PCR反应的特异性和效率。
▮▮▮▮ⓖ DNA聚合酶 (DNA Polymerase):PCR反应需要使用耐热的DNA聚合酶,最常用的是来源于嗜热细菌 Thermus aquaticusTaq DNA聚合酶 (Taq polymerase)Taq DNA聚合酶具有以下特点:
▮▮▮▮▮▮▮▮❽ 耐热性 (Thermostability):在95℃高温下仍能保持活性,可以耐受PCR循环中的变性高温。
▮▮▮▮▮▮▮▮❾ 5'→3' DNA聚合酶活性 (5'→3' DNA Polymerase Activity):具有5'→3' DNA聚合酶活性,可以催化dNTPs聚合形成新的DNA链。
▮▮▮▮▮▮▮▮❿ 缺乏3'→5'外切酶活性 (Lack of 3'→5' Exonuclease Activity)Taq DNA聚合酶缺乏3'→5'外切酶活性 (校对活性, proofreading activity),因此PCR扩增产物的错误率相对较高。
▮▮▮▮ⓚ dNTPs (脱氧核苷三磷酸):是DNA合成的原料,包括dATP、dCTP、dGTP、dTTP四种。dNTPs的浓度通常为200 μM。
▮▮▮▮ⓛ 缓冲液 (Buffer):提供PCR反应所需的适宜pH值和离子强度。
▮▮▮▮ⓜ Mg\(^{2+}\) 离子 (Magnesium Ions):Mg\(^{2+}\) 离子是DNA聚合酶的辅因子,对DNA聚合酶的活性和PCR反应的特异性有重要影响。Mg\(^{2+}\) 离子浓度通常需要优化。

PCR反应条件的优化 (Optimization of PCR Reaction Conditions)

为了获得高效、特异的PCR扩增,需要对PCR反应条件进行优化,主要包括:

▮▮▮▮ⓐ 退火温度 (Annealing Temperature):退火温度过高,引物与模板结合不稳定,PCR效率降低;退火温度过低,引物可能与非特异位点结合,产生非特异性扩增产物。最佳退火温度通常比引物的Tm值低5-10℃。
▮▮▮▮ⓑ Mg\(^{2+}\) 离子浓度 (Mg\(^{2+}\) Ion Concentration):Mg\(^{2+}\) 离子浓度过低,DNA聚合酶活性降低,PCR效率降低;Mg\(^{2+}\) 离子浓度过高,PCR特异性降低,容易产生非特异性扩增产物。
▮▮▮▮ⓒ 引物浓度 (Primer Concentration):引物浓度过低,PCR效率降低;引物浓度过高,容易形成引物二聚体,产生非特异性扩增产物。
▮▮▮▮ⓓ 循环次数 (Cycle Number):循环次数过少,PCR产物量不足;循环次数过多,容易产生非特异性扩增产物和副反应。通常PCR循环次数为25-35个循环。

8.2.2 PCR的应用 (Applications of PCR)

PCR技术以其高效、快速、灵敏的特点,在生物学、医学、农业、法医学等领域得到广泛应用。

基因克隆 (Gene Cloning):利用PCR技术可以快速扩增目的基因片段,为基因克隆提供大量的DNA片段。通过设计含有酶切位点的引物,PCR扩增产物可以直接用于酶切连接到载体中,简化了基因克隆的流程。

基因检测 (Gene Detection):PCR技术可以灵敏地检测样品中是否含有特定的基因序列,广泛应用于病原微生物检测、转基因生物检测、遗传病基因诊断等领域。
▮▮▮▮ⓑ 病原微生物检测 (Pathogen Detection):利用病原微生物特异性基因序列设计引物,通过PCR扩增,可以快速、灵敏地检测样品中是否含有病原微生物,如病毒、细菌、真菌等。
▮▮▮▮ⓒ 转基因生物检测 (Genetically Modified Organism, GMO Detection):利用转基因成分特异性基因序列设计引物,通过PCR扩增,可以检测食品、农产品中是否含有转基因成分。
▮▮▮▮ⓓ 遗传病基因诊断 (Genetic Disease Gene Diagnosis):利用遗传病致病基因特异性引物,通过PCR扩增,可以检测个体是否携带遗传病致病基因,用于遗传病诊断和携带者筛查。

疾病诊断 (Disease Diagnosis):PCR技术在疾病诊断中发挥着重要作用,特别是在感染性疾病遗传性疾病的诊断方面。
▮▮▮▮ⓑ 感染性疾病诊断 (Infectious Disease Diagnosis):PCR技术可以快速、灵敏地检测病原微生物,如病毒性肝炎、艾滋病、结核病、流感等感染性疾病的病原体,为早期诊断和治疗提供依据。
▮▮▮▮ⓒ 遗传性疾病诊断 (Genetic Disease Diagnosis):PCR技术可以用于检测遗传病致病基因,如地中海贫血、囊性纤维化、苯丙酮尿症等遗传性疾病的基因诊断,为遗传咨询和产前诊断提供依据。
▮▮▮▮ⓓ 肿瘤诊断 (Tumor Diagnosis):PCR技术可以用于检测肿瘤细胞特异性基因突变,如癌基因突变、抑癌基因突变,为肿瘤早期诊断、分子分型和靶向治疗提供依据。

法医学 (Forensics):PCR技术在法医学DNA鉴定 (forensic DNA identification) 中具有重要应用价值。利用PCR技术可以扩增微量生物样品 (如血液、精液、毛发、唾液等) 中的DNA,进行DNA指纹图谱分析 (DNA fingerprinting),用于个体识别、亲子鉴定、犯罪现场证据分析等。

突变检测 (Mutation Detection):PCR技术结合其他技术,可以用于检测基因突变,如点突变、插入、缺失、染色体易位等。常用的突变检测方法包括:
▮▮▮▮ⓑ 等位基因特异性PCR (Allele-Specific PCR, ASP-PCR):利用突变位点特异性引物进行PCR扩增,可以区分野生型和突变型等位基因。
▮▮▮▮ⓒ 限制性酶切片段长度多态性分析 (Restriction Fragment Length Polymorphism, RFLP):利用限制性内切酶酶切PCR扩增产物,根据酶切片段长度的多态性检测基因突变。
▮▮▮▮ⓓ 单链构象多态性分析 (Single-Strand Conformation Polymorphism, SSCP):利用单链DNA在不同序列下的构象差异,通过非变性聚丙烯酰胺凝胶电泳 (non-denaturing polyacrylamide gel electrophoresis) 检测基因突变。
▮▮▮▮ⓔ DNA测序 (DNA Sequencing):对PCR扩增产物进行DNA测序,可以直接检测基因突变类型和位点。

基因表达分析 (Gene Expression Analysis):PCR技术可以用于分析基因表达水平,常用的方法包括:
▮▮▮▮ⓑ 逆转录PCR (Reverse Transcription PCR, RT-PCR):首先将RNA反转录 (reverse transcription) 成cDNA,然后以cDNA为模板进行PCR扩增,检测特定基因的mRNA表达水平。
▮▮▮▮ⓒ 实时荧光定量PCR (Quantitative Real-time PCR, qPCR):在PCR反应体系中加入荧光染料或荧光探针,实时监测PCR扩增过程中荧光信号的变化,定量分析基因表达水平。qPCR技术具有高灵敏度、高准确性和高通量等优点,是基因表达分析的重要手段。

8.3 生物技术在医学、农业和工业中的应用 (Applications of Biotechnology in Medicine, Agriculture and Industry)

8.3.1 生物技术在医学中的应用:基因治疗与药物开发 (Biotechnology in Medicine: Gene Therapy and Drug Development)

生物技术 (biotechnology) 在医学领域有着广泛的应用,尤其在基因治疗 (gene therapy)药物开发 (drug development) 方面取得了显著进展。

基因治疗 (Gene Therapy)

基因治疗是指将外源基因导入靶细胞 (target cells),以纠正或补偿缺陷基因,从而达到治疗疾病的目的。基因治疗为治疗遗传性疾病、癌症、感染性疾病等提供了新的途径。

▮▮▮▮ⓐ 基因治疗的类型 (Types of Gene Therapy)
▮▮▮▮▮▮▮▮❷ 体细胞基因治疗 (Somatic Cell Gene Therapy):将外源基因导入患者的体细胞 (somatic cells),如血液细胞、肝细胞、肌肉细胞等。体细胞基因治疗只影响受治疗的个体,不遗传给后代。目前大多数基因治疗研究都属于体细胞基因治疗。
▮▮▮▮▮▮▮▮❸ 生殖细胞基因治疗 (Germline Gene Therapy):将外源基因导入患者的生殖细胞 (germ cells),如精子、卵细胞或早期胚胎细胞。生殖细胞基因治疗不仅影响受治疗的个体,还会将遗传改变传递给后代。生殖细胞基因治疗涉及伦理和社会问题,目前在人类基因治疗中受到严格限制。
▮▮▮▮ⓓ 基因导入方式 (Gene Delivery Methods)
▮▮▮▮▮▮▮▮❺ 体内基因治疗 (In Vivo Gene Therapy):将基因治疗载体直接注射到患者体内,靶向病变组织或器官,实现基因导入和治疗。 体内基因治疗操作简便,但载体靶向性和安全性控制难度较大。
▮▮▮▮▮▮▮▮❻ 体外基因治疗 (Ex Vivo Gene Therapy)首先从患者体内取出靶细胞,在体外进行基因导入和基因修饰,然后将修饰后的细胞回输到患者体内体外基因治疗载体靶向性和安全性控制较好,但操作复杂,细胞体外培养和回输过程可能影响细胞活性。
▮▮▮▮ⓖ 基因治疗载体 (Gene Therapy Vectors)
▮▮▮▮▮▮▮▮❽ 病毒载体 (Viral Vectors):病毒载体是基因治疗中最常用的载体,利用病毒天然的感染细胞能力,高效地将外源基因导入靶细胞。常用的病毒载体包括:
逆转录病毒载体 (Retrovirus Vectors):可以将外源基因整合到宿主细胞基因组中,实现基因的长期稳定表达,但只能感染分裂细胞,且有插入突变风险。
腺病毒载体 (Adenovirus Vectors):感染细胞范围广,滴度高,感染效率高,但基因表达短暂,可能引起免疫反应。
腺相关病毒载体 (Adeno-associated Virus Vectors, AAV Vectors):安全性高,免疫原性低,基因表达持久稳定,是基因治疗中最有前景的病毒载体之一。
慢病毒载体 (Lentivirus Vectors):属于逆转录病毒,可以感染分裂和非分裂细胞,基因整合效率高,基因表达持久稳定。
▮▮▮▮▮▮▮▮❷ 非病毒载体 (Non-viral Vectors):非病毒载体主要包括裸DNA (naked DNA)脂质体 (liposomes)阳离子聚合物 (cationic polymers) 等。非病毒载体安全性高,免疫原性低,制备简便,但基因导入效率较低,基因表达短暂。
▮▮▮▮ⓓ 基因治疗的应用实例 (Examples of Gene Therapy Applications)
▮▮▮▮▮▮▮▮❸ 重症联合免疫缺陷症 (Severe Combined Immunodeficiency, SCID):SCID是一类严重的遗传性免疫缺陷病,由于基因突变导致免疫系统功能缺陷。基因治疗在SCID的治疗中取得了显著成功,如腺苷脱氨酶缺陷症 (Adenosine Deaminase Deficiency, ADA-SCID) 和X连锁重症联合免疫缺陷症 (X-linked SCID, SCID-X1) 的基因治疗。
▮▮▮▮▮▮▮▮❹ 遗传性视网膜疾病 (Inherited Retinal Diseases):如Leber先天性黑矇 (Leber Congenital Amaurosis, LCA),由于视网膜色素上皮细胞特异性基因 RPE65 突变导致视力丧失。AAV载体介导的 RPE65 基因基因治疗已获批上市,为LCA患者带来了光明。
▮▮▮▮▮▮▮▮❺ 肿瘤基因治疗 (Cancer Gene Therapy):肿瘤基因治疗是基因治疗的重要方向,包括:
自杀基因治疗 (Suicide Gene Therapy):将自杀基因 (如单纯疱疹病毒胸苷激酶基因 HSV-TK) 导入肿瘤细胞,使肿瘤细胞对特定药物敏感,药物激活自杀基因,杀死肿瘤细胞。
免疫基因治疗 (Immunogene Therapy):增强肿瘤细胞的免疫原性,或增强机体抗肿瘤免疫应答,如肿瘤疫苗、细胞因子基因治疗、溶瘤病毒治疗等。
抑癌基因治疗 (Tumor Suppressor Gene Therapy):将抑癌基因 (如 p53) 导入肿瘤细胞,恢复抑癌基因功能,抑制肿瘤生长。

药物开发 (Drug Development)

生物技术在药物开发中发挥着越来越重要的作用,尤其在生物制药 (biopharmaceuticals) 领域,利用重组DNA技术、细胞工程、酶工程等生物技术手段,开发新型药物,如重组蛋白药物、抗体药物、核酸药物、疫苗等。

▮▮▮▮ⓐ 重组蛋白药物 (Recombinant Protein Drugs):利用重组DNA技术,将治疗性蛋白基因克隆到表达载体中,导入宿主细胞 (如细菌、酵母菌、哺乳动物细胞) 中表达,大规模生产治疗性蛋白药物。
▮▮▮▮▮▮▮▮❷ 胰岛素 (Insulin):是最早成功商业化的重组蛋白药物,用于治疗糖尿病。通过重组DNA技术,将人胰岛素基因导入大肠杆菌或酵母菌中表达,替代了传统的动物胰岛素,提高了胰岛素的产量和纯度,降低了免疫原性。
▮▮▮▮▮▮▮▮❸ 人生长激素 (Human Growth Hormone, hGH):用于治疗儿童生长激素缺乏症、特纳综合征等疾病。重组人生长激素的生产克服了传统方法从人垂体提取生长激素的来源限制和安全性问题。
▮▮▮▮▮▮▮▮❹ 促红细胞生成素 (Erythropoietin, EPO):用于治疗肾性贫血、肿瘤化疗引起的贫血等。重组EPO的生产解决了传统方法从尿液中提取EPO的产量低、纯度差的问题。
▮▮▮▮ⓔ 抗体药物 (Antibody Drugs):抗体药物是生物制药领域的重要组成部分,主要包括单克隆抗体 (monoclonal antibodies)治疗性抗体 (therapeutic antibodies)
▮▮▮▮▮▮▮▮❻ 单克隆抗体 (Monoclonal Antibodies):利用杂交瘤技术 (hybridoma technology) 或噬菌体展示技术 (phage display technology) 等生物技术手段,制备具有高度特异性和均一性的单克隆抗体,用于疾病诊断、治疗和研究。
▮▮▮▮▮▮▮▮❼ 治疗性抗体 (Therapeutic Antibodies):单克隆抗体经过人源化 (humanization)、亲和力成熟 (affinity maturation) 等改造,降低免疫原性,提高治疗效果,成为重要的治疗性药物,如肿瘤靶向治疗抗体 (如曲妥珠单抗、贝伐珠单抗)、自身免疫病治疗抗体 (如英夫利昔单抗、阿达木单抗) 等。
▮▮▮▮ⓗ 疫苗 (Vaccines):生物技术在疫苗开发中发挥着重要作用,开发新型疫苗,如重组疫苗、DNA疫苗、RNA疫苗等。
▮▮▮▮▮▮▮▮❾ 重组疫苗 (Recombinant Vaccines):利用重组DNA技术,将病原体的抗原基因克隆到表达载体中,导入宿主细胞 (如酵母菌、细菌、病毒载体) 中表达,生产重组抗原蛋白,作为疫苗接种,诱导机体产生免疫应答。如重组乙肝疫苗、重组人乳头瘤病毒疫苗等。
▮▮▮▮▮▮▮▮❿ DNA疫苗 (DNA Vaccines):将编码病原体抗原蛋白的DNA序列克隆到质粒载体中,直接将质粒DNA注射到机体,通过宿主细胞表达抗原蛋白,诱导机体产生免疫应答。DNA疫苗具有制备简便、安全性高、免疫原性好等优点。
▮▮▮▮▮▮▮▮❸ RNA疫苗 (RNA Vaccines):将编码病原体抗原蛋白的mRNA序列包裹在脂质纳米颗粒 (lipid nanoparticles, LNPs) 中,注射到机体,mRNA进入细胞后翻译成抗原蛋白,诱导机体产生免疫应答。RNA疫苗具有研发周期短、生产速度快、免疫原性强等优点,在新冠疫苗开发中发挥了重要作用。

8.3.2 生物技术在农业中的应用:转基因作物与动物育种 (Biotechnology in Agriculture: Transgenic Crops and Animal Breeding)

生物技术在农业领域有着广泛的应用,尤其在转基因作物 (transgenic crops) 开发和 动物育种 (animal breeding) 方面取得了重要进展。

转基因作物 (Transgenic Crops)

转基因作物,也称为基因修饰作物 (Genetically Modified Crops, GM Crops) 或基因工程作物 (Genetically Engineered Crops),是指利用基因工程技术,将外源基因导入作物基因组,使其获得新的优良性状的作物。转基因作物的开发和应用,提高了作物产量、改善了作物品质、增强了作物抗逆性,为农业生产带来了革命性变革。

▮▮▮▮ⓐ 转基因作物的类型 (Types of Transgenic Crops)
▮▮▮▮▮▮▮▮❷ 抗虫转基因作物 (Insect-resistant Transgenic Crops):将苏云金芽孢杆菌 ( Bacillus thuringiensis, Bt)Bt毒素基因 (Bt toxin gene) 导入作物,使作物自身产生Bt毒素,抵抗鳞翅目、鞘翅目等害虫的危害,减少农药使用,如Bt棉花、Bt玉米等。
▮▮▮▮▮▮▮▮❸ 抗除草剂转基因作物 (Herbicide-tolerant Transgenic Crops):将抗除草剂基因 (herbicide-tolerant gene) 导入作物,使作物对特定除草剂具有抗性,方便田间除草管理,如抗草甘膦转基因大豆、抗草铵膦转基因玉米等。
▮▮▮▮▮▮▮▮❹ 抗病转基因作物 (Disease-resistant Transgenic Crops):将抗病基因 (disease-resistant gene) 导入作物,增强作物对病毒、细菌、真菌等病原菌的抗性,减少病害损失,如抗病毒转基因番木瓜、抗真菌转基因马铃薯等。
▮▮▮▮▮▮▮▮❺ 品质改良转基因作物 (Quality-improved Transgenic Crops):通过基因工程手段,改善作物的营养品质、加工品质、储藏品质等,如高油酸转基因大豆、富含β-胡萝卜素转基因水稻 (金稻米, Golden Rice) 等。
▮▮▮▮▮▮▮▮❻ 抗逆转基因作物 (Stress-resistant Transgenic Crops):增强作物对干旱、盐碱、低温、高温等逆境胁迫的抗性,提高作物在不良环境条件下的产量和适应性,如耐旱转基因玉米、耐盐转基因水稻等。
▮▮▮▮ⓖ 转基因作物的开发与应用 (Development and Application of Transgenic Crops)
▮▮▮▮▮▮▮▮❽ 基因导入方法 (Gene Transfer Methods):将外源基因导入植物细胞,常用的方法包括:
农杆菌介导转化法 ( Agrobacterium-mediated Transformation):利用农杆菌 ( Agrobacterium tumefaciens) 的T-DNA转移系统,将外源基因整合到植物细胞基因组中。农杆菌介导转化法是植物基因转化中最常用的方法,适用于多种双子叶植物和部分单子叶植物。
基因枪法 (Gene Gun):将DNA包裹在金或钨微粒上,用高压气体将微粒射入植物细胞,使DNA进入细胞并整合到基因组中。基因枪法适用于多种植物细胞,特别是难以用农杆菌转化的植物。
原生质体转化法 (Protoplast Transformation):去除植物细胞壁,获得原生质体 (protoplasts),利用PEG介导或电穿孔等方法将DNA导入原生质体,然后诱导原生质体再生为完整植株。原生质体转化法转化效率高,但操作复杂,植物再生能力受限。
▮▮▮▮▮▮▮▮❷ 转基因作物的应用 (Applications of Transgenic Crops):转基因作物在全球范围内得到广泛种植和应用,主要种植的转基因作物包括大豆、玉米、棉花、油菜等。转基因作物的应用带来了显著的经济、环境和社会效益,但也引发了一些争议和关注,如食品安全、环境影响、生物多样性等问题。

动物育种 (Animal Breeding)

生物技术在动物育种中也发挥着重要作用,利用基因工程、基因编辑、辅助生殖等生物技术手段,改良家畜品种,提高动物生产性能、抗病能力和产品品质。

▮▮▮▮ⓐ 基因编辑动物 (Gene-edited Animals):利用基因编辑技术 (gene editing technologies),如 CRISPR-Cas9、TALENs、ZFNs 等,精确修饰动物基因组,实现动物品种改良。基因编辑技术具有高效、精确、多靶点等优点,为动物育种提供了新的工具。
▮▮▮▮▮▮▮▮❷ 提高动物抗病性 (Improving Disease Resistance):利用基因编辑技术敲除或修饰动物的疾病易感基因,增强动物对疾病的抗性,减少动物疾病发生,提高养殖效益。如基因编辑抗猪繁殖与呼吸综合征病毒 (PRRSV) 猪、抗禽流感病毒鸡等。
▮▮▮▮▮▮▮▮❸ 提高动物生产性能 (Improving Production Performance):利用基因编辑技术修饰动物的生长、繁殖、代谢等相关基因,提高动物的生长速度、产肉率、产奶量、产蛋量等生产性能。如肌生长抑制素 (MSTN) 基因敲除肉牛、脂肪酸去饱和酶 (FADS2) 基因修饰奶牛等。
▮▮▮▮▮▮▮▮❹ 改善动物产品品质 (Improving Product Quality):利用基因编辑技术修饰动物产品品质相关基因,改善动物产品的营养成分、风味、加工特性等。如ω-3脂肪酸合成酶基因修饰猪、酪蛋白基因修饰奶牛等。
▮▮▮▮ⓔ 转基因动物 (Transgenic Animals):利用转基因技术,将外源基因导入动物基因组,使其获得新的优良性状。转基因动物主要应用于生物制药 (biopharming)疾病模型 (disease models) 研究。
▮▮▮▮▮▮▮▮❻ 生物制药 (Biopharming):利用转基因动物生产药物蛋白,如在转基因动物的乳汁、血液、尿液等中表达治疗性蛋白药物,实现药物蛋白的大规模、低成本生产。如转基因羊生产人凝血因子IX、转基因奶牛生产人乳铁蛋白等。
▮▮▮▮▮▮▮▮❼ 疾病模型 (Disease Models):构建人类疾病的转基因动物模型,用于研究疾病发生机制、药物筛选和治疗方法开发。如肿瘤转基因小鼠模型、阿尔茨海默病转基因小鼠模型等。
▮▮▮▮ⓗ 辅助生殖技术 (Assisted Reproductive Technologies, ART):辅助生殖技术在动物育种中也发挥着重要作用,如人工授精 (artificial insemination, AI)体外受精 (in vitro fertilization, IVF)胚胎移植 (embryo transfer, ET)克隆 (cloning) 等,可以提高优良种畜的繁殖效率,加速良种繁育进程。

8.3.3 生物技术在工业中的应用:酶工程与生物制药 (Biotechnology in Industry: Enzyme Engineering and Biopharmaceuticals)

生物技术在工业领域有着广泛的应用,尤其在酶工程 (enzyme engineering)生物制药 (biopharmaceuticals) 方面发挥着重要作用。

酶工程 (Enzyme Engineering)

酶工程是指利用基因工程、蛋白质工程、酶固定化等生物技术手段,对酶进行改造、优化和利用,以提高酶的催化效率、稳定性、特异性、适应性等,满足工业生产的需求。酶工程是生物化工 (biochemical engineering) 的重要组成部分,广泛应用于食品工业、洗涤剂工业、纺织工业、造纸工业、医药工业、环保工业等领域。

▮▮▮▮ⓐ 酶工程的方法 (Methods of Enzyme Engineering)
▮▮▮▮▮▮▮▮❷ 定向进化 (Directed Evolution):模拟自然进化过程,通过随机突变 (random mutagenesis)高通量筛选 (high-throughput screening),获得具有所需性状的酶。定向进化不需要预先了解酶的结构和功能信息,是一种强大的酶改造方法。
▮▮▮▮▮▮▮▮❸ 理性设计 (Rational Design):基于对酶的结构和功能的深入了解,通过定点突变 (site-directed mutagenesis) 等方法,有目的地改造酶的特定位点,改善酶的性能。理性设计需要预先了解酶的结构和功能信息,针对性强,效率高。
▮▮▮▮▮▮▮▮❹ 酶固定化 (Enzyme Immobilization):将酶固定在固相载体上,形成固定化酶 (immobilized enzyme)。固定化酶具有重复使用、易于分离、稳定性提高等优点,便于工业化应用。常用的酶固定化方法包括吸附法、包埋法、交联法、共价结合法等。
▮▮▮▮ⓔ 酶工程的应用 (Applications of Enzyme Engineering)
▮▮▮▮▮▮▮▮❻ 洗涤剂工业 (Detergent Industry):酶制剂是洗涤剂的重要成分,常用的酶制剂包括蛋白酶 (proteases)脂肪酶 (lipases)淀粉酶 (amylases)纤维素酶 (cellulases) 等,可以有效去除衣物上的蛋白质污渍、脂肪污渍、淀粉污渍、纤维素污渍等,提高洗涤效果,降低环境污染。
▮▮▮▮▮▮▮▮❼ 食品工业 (Food Industry):酶制剂在食品工业中应用广泛,如淀粉酶用于淀粉糖化、蛋白酶用于肉类嫩化、脂肪酶用于乳制品加工、果胶酶 (pectinases) 用于果汁澄清、异构酶 (isomerases) 用于高果糖浆生产等,改善食品品质,提高食品加工效率。
▮▮▮▮▮▮▮▮❽ 纺织工业 (Textile Industry):酶制剂在纺织工业中用于纤维素纤维的生物酶处理,如生物抛光、生物酶退浆、生物酶染色等,改善织物手感、光泽、染色性能,减少化学试剂使用,降低环境污染。
▮▮▮▮▮▮▮▮❾ 造纸工业 (Paper Industry):酶制剂在造纸工业中用于生物酶制浆、生物酶漂白、生物酶脱墨等,降低化学试剂使用,减少环境污染,提高纸张质量。
▮▮▮▮▮▮▮▮❿ 生物能源 (Bioenergy):酶制剂在生物能源领域用于生物质能源转化,如纤维素酶半纤维素酶 (hemicellulases) 用于纤维素乙醇生产、脂肪酶用于生物柴油生产、淀粉酶用于生物乙醇生产等,将生物质转化为可再生能源。

生物制药 (Biopharmaceuticals)

生物制药是指利用生物技术手段生产的药物,主要包括重组蛋白药物、抗体药物、核酸药物、疫苗、细胞治疗药物、基因治疗药物等。生物制药是现代医药产业的重要组成部分,具有高活性、高特异性、低毒副作用等优点,为治疗重大疾病提供了新的选择。

▮▮▮▮ⓐ 生物制药的生产方式 (Production Methods of Biopharmaceuticals)
▮▮▮▮▮▮▮▮❷ 微生物发酵 (Microbial Fermentation):利用细菌、酵母菌等微生物作为宿主细胞,通过发酵工程技术,大规模生产重组蛋白药物、抗体药物、疫苗等。微生物发酵具有生产周期短、成本低、易于规模化生产等优点,是生物制药的主要生产方式。
▮▮▮▮▮▮▮▮❸ 细胞培养 (Cell Culture):利用哺乳动物细胞、昆虫细胞等作为宿主细胞,通过细胞培养技术,生产结构复杂、糖基化修饰 (glycosylation modification) 重要的重组蛋白药物、抗体药物、疫苗、细胞治疗药物等。细胞培养生产的生物药物糖基化修饰更接近人体天然蛋白,免疫原性低,生物活性高。
▮▮▮▮▮▮▮▮❹ 转基因动物和植物 (Transgenic Animals and Plants):利用转基因动物和植物作为生物反应器 (bioreactors),生产生物药物,如在转基因动物乳汁中生产重组蛋白药物、在转基因植物中生产疫苗等。转基因动植物生物制药具有生产成本低、易于规模化生产等优点,但生产周期长,监管复杂。
▮▮▮▮ⓔ 生物制药的应用领域 (Application Fields of Biopharmaceuticals)
▮▮▮▮▮▮▮▮❻ 肿瘤治疗 (Cancer Therapy):抗体药物 (如单克隆抗体、抗体偶联药物)、细胞治疗药物 (如CAR-T细胞治疗)、基因治疗药物 (如溶瘤病毒治疗) 等生物制药在肿瘤靶向治疗、免疫治疗、基因治疗等方面发挥着重要作用。
▮▮▮▮▮▮▮▮❼ 自身免疫病治疗 (Autoimmune Disease Therapy):抗体药物 (如TNF-α抑制剂、IL-6受体抑制剂)、细胞因子药物 (如干扰素、白细胞介素) 等生物制药在类风湿关节炎、系统性红斑狼疮、炎症性肠病等自身免疫病治疗中应用广泛。
▮▮▮▮▮▮▮▮❽ 感染性疾病防治 (Infectious Disease Prevention and Treatment):疫苗 (如重组疫苗、DNA疫苗、RNA疫苗)、抗病毒药物 (如干扰素、单克隆抗体) 等生物制药在病毒性肝炎、艾滋病、流感、新冠肺炎等感染性疾病的预防和治疗中发挥着重要作用。
▮▮▮▮▮▮▮▮❾ 遗传性疾病治疗 (Genetic Disease Therapy):基因治疗药物 (如AAV载体基因治疗药物)、酶替代疗法药物 (如重组酶制剂) 等生物制药为遗传性疾病的治疗提供了新的希望。
▮▮▮▮▮▮▮▮❿ 其他疾病治疗 (Therapy of Other Diseases):生物制药还在糖尿病、心血管疾病、神经退行性疾病、罕见病等多种疾病的治疗中发挥着重要作用。

生物技术在医学、农业和工业领域的广泛应用,极大地推动了人类社会的发展和进步,为解决人类面临的健康、粮食、能源、环境等重大挑战提供了新的思路和方法。随着生物技术的不断发展和创新,其应用前景将更加广阔。

9. 基因组学与蛋白质组学 (Genomics and Proteomics)

本章介绍基因组学的概念、研究方法和应用,以及蛋白质组学的基本概念和研究进展。

9.1 基因组学的概念与研究方法 (Concepts and Research Methods of Genomics)

本节定义基因组学,介绍基因组测序、基因组注释、比较基因组学等研究方法。

9.1.1 基因组测序技术 (Genome Sequencing Technologies)

基因组测序技术 (Genome Sequencing Technologies) 是基因组学研究的基石,它旨在确定生物体基因组 (genome) DNA 的完整序列。随着技术的进步,基因组测序技术经历了从Sanger 测序 (Sanger sequencing)新一代测序 (Next-Generation Sequencing, NGS) 的革命性发展。

Sanger 测序 (Sanger sequencing)
▮▮▮▮ⓑ 原理:Sanger 测序,也称为双脱氧链终止法测序 (dideoxy chain termination method),由 Frederick Sanger 及其团队于 1977 年开发。其原理是利用 DNA 聚合酶在体外进行 DNA 复制时,掺入双脱氧核苷三磷酸 (dideoxynucleotide triphosphate, ddNTP)。ddNTP 缺乏 3'-OH 基团,一旦掺入 DNA 链,就会导致链延伸终止。通过在四个平行的反应中分别加入少量不同类型的 ddNTP(ddATP、ddGTP、ddCTP、ddTTP),可以产生一系列长度不同的 DNA 片段,这些片段的末端分别终止于 A、G、C 或 T。
▮▮▮▮ⓒ 方法
▮▮▮▮▮▮▮▮❹ PCR 扩增:首先,需要扩增待测序的 DNA 片段。
▮▮▮▮▮▮▮▮❺ 测序反应:将扩增的 DNA 作为模板,分别在四个反应体系中进行 DNA 复制。每个反应体系包含:
⚝▮▮▮▮▮▮▮▮▮▮▮- DNA 聚合酶 (DNA polymerase)
⚝▮▮▮▮▮▮▮▮▮▮▮- 引物 (primer)
⚝▮▮▮▮▮▮▮▮▮▮▮- 脱氧核苷三磷酸 (deoxynucleotide triphosphate, dNTPs) (dATP, dGTP, dCTP, dTTP)
⚝▮▮▮▮▮▮▮▮▮▮▮- 少量双脱氧核苷三磷酸 (ddNTPs) (ddATP, ddGTP, ddCTP, ddTTP),每种反应体系加入一种 ddNTP,且 ddNTPs 被荧光标记上不同的颜色。
▮▮▮▮▮▮▮▮❸ 片段分离:通过毛细管电泳 (capillary electrophoresis)凝胶电泳 (gel electrophoresis) 分离不同长度的 DNA 片段。由于每个片段的末端都标记了特定的荧光颜色,因此可以根据荧光信号的顺序读取 DNA 序列。
▮▮▮▮ⓒ 特点
▮▮▮▮▮▮▮▮❸ 优点:准确性高,读长较长(可达 800-1000 bp),是早期基因组测序和验证的金标准。
▮▮▮▮▮▮▮▮❹ 缺点:通量低,成本高,测序速度慢,难以满足大规模基因组测序的需求。

新一代测序 (Next-Generation Sequencing, NGS)
▮▮▮▮ⓑ 定义:新一代测序 (NGS),也称为高通量测序 (high-throughput sequencing),是指在 Sanger 测序基础上发展起来的大规模、高通量 DNA 测序技术。NGS 技术显著提高了测序速度和降低了测序成本,使得全基因组测序变得更加普及和经济。
▮▮▮▮ⓒ 主要技术平台:目前主流的 NGS 技术平台包括:
▮▮▮▮▮▮▮▮❹ Illumina 测序 (Illumina sequencing)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:基于可逆终止的荧光标记核苷酸 (reversible terminator chemistry) 的边合成边测序 (Sequencing-by-Synthesis, SBS) 技术。
⚝▮▮▮▮▮▮▮▮▮▮▮- 方法
⚝▮▮▮▮▮▮▮▮▮▮▮▮▮▮▮- 文库构建 (library construction):将 DNA 片段化,并在片段两端连接接头 (adapter)。
⚝▮▮▮▮▮▮▮▮▮▮▮▮▮▮▮- 簇生成 (cluster generation):将文库 DNA 片段固定在测序芯片 (flow cell) 上,通过桥式 PCR (bridge PCR) 扩增形成 DNA 簇。
⚝▮▮▮▮▮▮▮▮▮▮▮▮▮▮▮- 测序反应:循环加入带有可逆终止基团和荧光标记的核苷酸,每次循环掺入一个核苷酸,并记录荧光信号。之后,去除荧光标记和终止基团,进行下一轮测序。
⚝▮▮▮▮▮▮▮▮▮▮▮- 特点:准确性高,通量高,成本相对较低,读长中等(通常为 150-300 bp),广泛应用于基因组重测序、外显子组测序、转录组测序等。
▮▮▮▮▮▮▮▮❷ Ion Torrent 测序 (Ion Torrent sequencing)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:基于半导体测序 (semiconductor sequencing) 技术,检测 DNA 聚合酶合成 DNA 时释放的氢离子 (H+) 引起的 pH 变化。
⚝▮▮▮▮▮▮▮▮▮▮▮- 方法:与 Illumina 类似,也需要文库构建和扩增。测序时,循环加入四种 dNTP,当掺入与模板碱基互补的 dNTP 时,会释放 H+,引起 pH 变化,被传感器检测到。
⚝▮▮▮▮▮▮▮▮▮▮▮- 特点:测序速度快,成本较低,操作简便,但准确性略低于 Illumina,读长较短。
▮▮▮▮▮▮▮▮❸ PacBio 测序 (PacBio sequencing)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理单分子实时测序 (Single Molecule Real Time, SMRT) 技术,直接对单个 DNA 分子进行测序。
⚝▮▮▮▮▮▮▮▮▮▮▮- 方法:将 DNA 聚合酶固定在零模波导孔 (Zero-Mode Waveguide, ZMW) 的底部,ZMW 能够极大地缩小检测体积,使得只有 ZMW 底部的荧光信号能够被检测到。带有荧光标记的 dNTPs 进入 ZMW,DNA 聚合酶在 ZMW 中进行 DNA 合成,实时检测掺入的核苷酸类型。
⚝▮▮▮▮▮▮▮▮▮▮▮- 特点:读长超长(可达数万 bp),能够跨越复杂的基因组区域,如重复序列,但成本较高,准确性相对较低(但可以通过环形一致性测序 (Circular Consensus Sequencing, CCS) 技术提高准确性)。
▮▮▮▮▮▮▮▮❹ Oxford Nanopore 测序 (Oxford Nanopore sequencing)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理纳米孔测序 (nanopore sequencing) 技术,利用蛋白质纳米孔或固态纳米孔。
⚝▮▮▮▮▮▮▮▮▮▮▮- 方法:DNA 分子通过纳米孔时,不同的碱基会引起不同的离子电流变化,通过检测离子电流变化来识别碱基序列。
⚝▮▮▮▮▮▮▮▮▮▮▮- 特点:读长超长(理论上无限读长),便携性好,可以进行实时测序,但准确性相对较低,原始错误率较高。
▮▮▮▮ⓒ NGS 的应用:NGS 技术极大地推动了基因组学的发展,广泛应用于:
▮▮▮▮▮▮▮▮❷ 全基因组测序 (Whole Genome Sequencing, WGS):从头测序 (de novo sequencing) 新物种基因组,或对已知物种进行基因组重测序 (re-sequencing)。
▮▮▮▮▮▮▮▮❸ 外显子组测序 (Whole Exome Sequencing, WES):只对基因组中所有的外显子 (exon) 区域进行测序,用于发现蛋白质编码基因的变异。
▮▮▮▮▮▮▮▮❹ 转录组测序 (RNA-Sequencing, RNA-Seq):对细胞或组织中的总 RNA 或 mRNA 进行测序,用于研究基因表达水平、发现新的转录本、可变剪接等。
▮▮▮▮▮▮▮▮❺ 宏基因组测序 (Metagenomic Sequencing):直接对环境样品中的总 DNA 进行测序,用于研究微生物群落的组成和功能。
▮▮▮▮▮▮▮▮❻ 靶向测序 (Targeted Sequencing):只对基因组中特定的区域或基因进行测序,例如,扩增子测序 (Amplicon Sequencing)目标区域捕获测序 (Targeted Region Capture Sequencing)

9.1.2 基因组注释与数据库 (Genome Annotation and Databases)

基因组注释 (Genome Annotation) 是指在基因组测序完成后,对基因组序列进行解读和功能分析的过程。基因组注释的主要目标是识别基因组中的各种功能元件,包括基因 (gene)调控序列 (regulatory sequence)非编码 RNA (non-coding RNA)重复序列 (repetitive sequence) 等,并预测它们的功能。

基因组注释的内容
▮▮▮▮ⓑ 结构注释 (Structural Annotation)
▮▮▮▮▮▮▮▮❸ 基因预测 (Gene Prediction):识别基因组中的蛋白质编码基因的位置和结构,包括外显子、内含子 (intron)、启动子 (promoter)、终止子 (terminator) 等。常用的基因预测方法包括:
⚝▮▮▮▮▮▮▮▮▮▮▮- 从头预测 (Ab initio prediction):基于基因的统计学特征,如密码子偏好性 (codon usage bias)、外显子/内含子边界的剪接位点 (splice site) 信号等。
⚝▮▮▮▮▮▮▮▮▮▮▮- 同源预测 (Homology-based prediction):利用已知的基因序列或蛋白质序列,在待注释基因组中寻找同源序列。
▮▮▮▮▮▮▮▮❷ RNA 基因预测 (RNA Gene Prediction):识别基因组中的 RNA 基因,如 rRNA、tRNA、miRNA 等。
▮▮▮▮▮▮▮▮❸ 重复序列注释 (Repeat Annotation):识别基因组中的重复序列,如转座元件 (transposable element)串联重复序列 (tandem repeat) 等。
▮▮▮▮ⓒ 功能注释 (Functional Annotation)
▮▮▮▮▮▮▮▮❹ 基因功能预测 (Gene Function Prediction):根据基因的序列特征、结构域 (domain)、同源性等信息,预测基因的功能。常用的方法包括:
⚝▮▮▮▮▮▮▮▮▮▮▮- 序列比对 (Sequence Alignment):将基因序列与已知功能的基因序列数据库进行比对,推断基因的功能。
⚝▮▮▮▮▮▮▮▮▮▮▮- 结构域分析 (Domain Analysis):分析基因编码蛋白质的结构域,根据结构域的功能推断基因的功能。
⚝▮▮▮▮▮▮▮▮▮▮▮- 基因本体论 (Gene Ontology, GO) 注释:将基因的功能归类到 GO 数据库中的不同类别,如生物过程 (biological process)、分子功能 (molecular function)、细胞组分 (cellular component)。
▮▮▮▮▮▮▮▮❷ 代谢通路注释 (Pathway Annotation):将基因的功能与已知的代谢通路或信号通路进行关联,分析基因在细胞代谢或信号传导中的作用。常用的数据库包括 KEGG (Kyoto Encyclopedia of Genes and Genomes)Reactome 等。

常用的基因组数据库
▮▮▮▮ⓑ NCBI (National Center for Biotechnology Information)
⚝▮▮▮▮▮▮▮- GenBank:核酸序列数据库,收录了大量的基因组序列、mRNA 序列、EST 序列等。
⚝▮▮▮▮▮▮▮- RefSeq (Reference Sequence Database):高质量、注释全面的参考序列数据库,包括基因组、转录本、蛋白质等。
⚝▮▮▮▮▮▮▮- dbSNP (Single Nucleotide Polymorphism Database):单核苷酸多态性 (SNP) 数据库,收录了大量的 SNP 位点信息。
⚝▮▮▮▮▮▮▮- Gene:基因信息数据库,提供基因的描述、功能、定位、参考文献等信息。
▮▮▮▮ⓑ Ensembl (European Molecular Biology Laboratory - European Bioinformatics Institute)
⚝▮▮▮▮▮▮▮- 基因组浏览器 (genome browser),提供多种物种的基因组注释信息,包括基因结构、变异、调控元件等。
▮▮▮▮ⓒ UCSC Genome Browser (University of California, Santa Cruz)
⚝▮▮▮▮▮▮▮- 基因组浏览器,提供多种物种的基因组序列和注释信息,用户可以自定义 tracks,进行基因组数据的可视化分析。
▮▮▮▮ⓓ KEGG (Kyoto Encyclopedia of Genes and Genomes)
⚝▮▮▮▮▮▮▮- 代谢通路数据库,提供基因、蛋白质、代谢物、化学反应等信息,以及它们之间的关系。
▮▮▮▮ⓔ GO (Gene Ontology) 数据库 (Gene Ontology Consortium)
⚝▮▮▮▮▮▮▮- 基因本体论数据库,提供基因功能的标准化分类体系,包括生物过程、分子功能、细胞组分三个方面。

9.1.3 比较基因组学 (Comparative Genomics)

比较基因组学 (Comparative Genomics) 是指通过比较不同物种或同一物种不同个体之间的基因组序列,研究基因组结构、功能、进化和变异的学科。比较基因组学可以帮助我们理解物种之间的进化关系、基因的功能、复杂性状的遗传基础等。

比较基因组学的概念
▮▮▮▮ⓑ 定义:比较基因组学利用基因组测序和生物信息学分析方法,对不同基因组进行比较研究,揭示基因组的异同,从而获得关于基因组结构、功能和进化的信息。
▮▮▮▮ⓒ 研究内容
▮▮▮▮▮▮▮▮❹ 基因组结构比较:比较不同基因组的大小、基因密度、重复序列含量、染色体结构等。
▮▮▮▮▮▮▮▮❺ 基因组进化分析:构建系统发育树 (phylogenetic tree),研究物种的进化关系;分析基因组的共线性 (synteny),研究基因组的重排和进化。
▮▮▮▮▮▮▮▮❻ 基因功能预测:通过比较基因组,预测未知基因的功能;研究直系同源基因 (ortholog)旁系同源基因 (paralog),推断基因的功能演化。
▮▮▮▮▮▮▮▮❼ 复杂性状的遗传基础研究:通过比较不同表型 (phenotype) 个体的基因组,寻找与复杂性状相关的基因或调控区域 (regulatory region)

比较基因组学的应用
▮▮▮▮ⓑ 物种进化关系研究
⚝▮▮▮▮▮▮▮- 通过比较不同物种基因组的序列,构建系统发育树,揭示物种之间的进化关系。例如,通过比较不同灵长类动物的基因组,可以研究人类的进化历程。
▮▮▮▮ⓑ 基因功能预测
⚝▮▮▮▮▮▮▮- 通过比较基因组,可以预测未知基因的功能。如果一个基因在多个物种中都保守存在,并且在不同物种中都与相似的基因共定位,那么可以推测这个基因在这些物种中可能具有相似的功能。
▮▮▮▮ⓒ 基因组进化机制研究
⚝▮▮▮▮▮▮▮- 比较基因组学可以帮助我们理解基因组进化的机制,例如,基因组的复制 (duplication)缺失 (deletion)重排 (rearrangement)水平基因转移 (horizontal gene transfer) 等。
▮▮▮▮ⓓ 复杂性状的遗传基础研究
⚝▮▮▮▮▮▮▮- 通过比较具有不同表型的个体的基因组,可以寻找与复杂性状相关的基因或调控区域。例如,通过比较高产奶牛和低产奶牛的基因组,可以寻找与产奶量相关的基因。
▮▮▮▮ⓔ 医学研究
⚝▮▮▮▮▮▮▮- 比较人类基因组与其他物种的基因组,可以寻找与人类疾病相关的基因或调控元件 (regulatory element)。例如,通过比较人类基因组与模式生物 (model organism) 的基因组,可以研究疾病的发生机制,开发新的治疗方法。
▮▮▮▮ⓕ 农业研究
⚝▮▮▮▮▮▮▮- 比较不同品种的农作物或家畜的基因组,可以寻找与重要农艺性状相关的基因,用于分子育种 (molecular breeding),培育优良品种。
▮▮▮▮ⓖ 生物多样性保护
⚝▮▮▮▮▮▮▮- 比较不同种群或物种的基因组,可以评估遗传多样性 (genetic diversity),为生物多样性保护提供科学依据。

9.2 基因组学的应用 (Applications of Genomics)

本节介绍基因组学在医学、农业、生物多样性保护等领域的应用,如个性化医疗 (personalized medicine)基因组育种 (genomic breeding)物种鉴定 (species identification)

9.2.1 基因组学在医学中的应用:个性化医疗 (Genomics in Medicine: Personalized Medicine)

个性化医疗 (Personalized Medicine),也称为精准医疗 (Precision Medicine),是指根据个体的基因组信息、生活方式和环境因素等,为患者量身定制的医疗方案,以达到最佳的治疗效果和预防疾病的目的。基因组学在个性化医疗中发挥着核心作用,主要应用于疾病风险预测、药物反应预测、靶向治疗等方面。

疾病风险预测 (Disease Risk Prediction)
▮▮▮▮ⓑ 遗传风险评估 (Genetic Risk Assessment):通过基因组测序和基因分型 (genotyping),检测个体携带的疾病易感基因 (disease susceptibility gene)风险等位基因 (risk allele),评估个体患某种疾病的风险。例如:
▮▮▮▮▮▮▮▮❸ BRCA1/2 基因检测:用于评估女性患乳腺癌和卵巢癌的风险。携带 BRCA1/2 基因突变的女性患乳腺癌和卵巢癌的风险显著增加。
▮▮▮▮▮▮▮▮❹ APOE 基因检测:用于评估个体患阿尔茨海默病 (Alzheimer's disease) 的风险。APOE ε4 等位基因是阿尔茨海默病的主要风险因素。
▮▮▮▮ⓔ 生活方式指导和预防措施 (Lifestyle Guidance and Preventive Measures):根据基因风险评估结果,为个体提供个性化的生活方式指导和预防措施,降低疾病发生的风险。例如,对于 BRCA1/2 基因突变携带者,可以建议进行更频繁的乳腺癌筛查、预防性乳房切除术或卵巢切除术。

药物反应预测 (Pharmacogenomics)
▮▮▮▮ⓑ 药物基因组学 (Pharmacogenomics):研究个体基因变异对药物反应的影响,预测个体对特定药物的疗效和不良反应风险,从而选择最合适的药物和剂量,提高治疗效果,减少不良反应。
▮▮▮▮ⓒ 应用实例
▮▮▮▮▮▮▮▮❹ CYP2C19 基因检测:CYP2C19 基因编码的酶参与多种药物的代谢,包括氯吡格雷 (clopidogrel)(抗血小板药物)。CYP2C19 基因的功能变异会影响氯吡格雷的代谢和疗效。根据 CYP2C19 基因型,可以预测患者对氯吡格雷的反应,指导临床用药。
▮▮▮▮▮▮▮▮❺ TPMT 基因检测:TPMT 基因编码的酶参与硫嘌呤类药物(如硫唑嘌呤 (azathioprine)、巯嘌呤 (mercaptopurine))的代谢。TPMT 基因的功能缺失变异会导致硫嘌呤类药物代谢减慢,增加药物毒性风险。TPMT 基因检测可以指导硫嘌呤类药物的剂量调整,减少药物毒性。

靶向治疗 (Targeted Therapy)
▮▮▮▮ⓑ 肿瘤基因组测序 (Tumor Genome Sequencing):对肿瘤组织进行基因组测序,检测肿瘤细胞特有的基因突变,寻找药物靶点 (drug target)
▮▮▮▮ⓒ 靶向药物 (Targeted Drugs):针对肿瘤细胞特有的基因突变,开发靶向药物,精准打击肿瘤细胞,减少对正常细胞的损伤。
▮▮▮▮ⓓ 应用实例
▮▮▮▮▮▮▮▮❺ EGFR 基因突变与肺癌靶向治疗表皮生长因子受体 (Epidermal Growth Factor Receptor, EGFR) 基因突变在非小细胞肺癌 (Non-Small Cell Lung Cancer, NSCLC) 中常见。针对 EGFR 基因突变的靶向药物,如吉非替尼 (gefitinib)、厄洛替尼 (erlotinib)、奥希替尼 (osimertinib),显著提高了 EGFR 突变阳性肺癌患者的生存期。
▮▮▮▮▮▮▮▮❻ HER2 基因扩增与乳腺癌靶向治疗人表皮生长因子受体 2 (Human Epidermal Growth Factor Receptor 2, HER2) 基因扩增在乳腺癌中常见。针对 HER2 基因扩增的靶向药物,如曲妥珠单抗 (trastuzumab)、帕妥珠单抗 (pertuzumab),显著改善了 HER2 阳性乳腺癌患者的预后。
▮▮▮▮ⓖ 液体活检 (Liquid Biopsy)
⚝▮▮▮▮▮▮▮- 通过检测血液或其他体液中的循环肿瘤 DNA (circulating tumor DNA, ctDNA)循环肿瘤细胞 (circulating tumor cell, CTC),进行肿瘤基因组分析,用于肿瘤早期诊断、疗效监测、耐药性分析等。液体活检具有无创、便捷的优点,是肿瘤个性化医疗的重要发展方向。

9.2.2 基因组学在农业中的应用:基因组育种 (Genomics in Agriculture: Genomic Breeding)

基因组育种 (Genomic Breeding) 是指利用基因组学技术,加速农作物和家畜育种进程,提高育种效率和准确性的育种方法。基因组育种主要包括分子标记辅助选择 (Marker-Assisted Selection, MAS)全基因组选择 (Genomic Selection, GS)

分子标记辅助选择 (Marker-Assisted Selection, MAS)
▮▮▮▮ⓑ 原理:利用与目标性状紧密连锁的分子标记 (molecular marker),如 SNP (Single Nucleotide Polymorphism)SSR (Simple Sequence Repeat) 等,在早期选择具有优良基因型的个体,缩短育种周期,提高选择效率。
▮▮▮▮ⓒ 方法
▮▮▮▮▮▮▮▮❹ QTL 定位 (Quantitative Trait Loci mapping):通过数量性状基因座 (Quantitative Trait Loci, QTL) 定位,寻找与目标性状相关的基因或基因区域。
▮▮▮▮▮▮▮▮❺ 分子标记开发 (Molecular Marker Development):开发与 QTL 紧密连锁的分子标记。
▮▮▮▮▮▮▮▮❻ MAS 选择:在育种早期,利用分子标记对育种材料进行基因型鉴定,选择携带优良等位基因的个体进行杂交和选育。
▮▮▮▮ⓖ 应用实例
▮▮▮▮▮▮▮▮❽ 抗病育种:利用与抗病基因连锁的分子标记,选择抗病品种。例如,水稻抗稻瘟病育种、小麦抗条锈病育种。
▮▮▮▮▮▮▮▮❾ 品质育种:利用与品质性状相关的分子标记,选择品质优良的品种。例如,水稻优质米育种、玉米高油育种。

全基因组选择 (Genomic Selection, GS)
▮▮▮▮ⓑ 原理:基于全基因组范围的分子标记 (genome-wide molecular markers),构建基因组选择模型 (genomic selection model),预测育种个体的基因组育种值 (genomic estimated breeding value, GEBV),直接根据 GEBV 进行选择,无需事先进行 QTL 定位。
▮▮▮▮ⓒ 方法
▮▮▮▮▮▮▮▮❹ 训练群体构建 (Training Population Construction):构建包含表型和基因型数据的训练群体。
▮▮▮▮▮▮▮▮❺ 基因型数据获取 (Genotype Data Acquisition):利用基因组芯片 (genotyping chip) 或 NGS 技术,获取训练群体的全基因组 SNP 数据。
▮▮▮▮▮▮▮▮❻ 基因组选择模型构建 (Genomic Selection Model Construction):利用统计学方法,如 GBLUP (Genomic Best Linear Unbiased Prediction)Bayes 系列方法 (Bayesian methods) 等,构建基因组选择模型,预测 GEBV。
▮▮▮▮▮▮▮▮❼ GS 选择:在育种群体中,利用基因组选择模型预测个体的 GEBV,选择 GEBV 高的个体作为亲本进行杂交和选育。
▮▮▮▮ⓗ 特点
▮▮▮▮▮▮▮▮❾ 无需 QTL 定位:GS 无需事先进行 QTL 定位,可以直接利用全基因组标记进行选择。
▮▮▮▮▮▮▮▮❿ 预测准确性高:GS 可以利用全基因组范围的标记信息,更准确地预测育种值。
▮▮▮▮▮▮▮▮❸ 加速育种进程:GS 可以缩短育种周期,加速遗传进展。
▮▮▮▮ⓛ 应用实例
▮▮▮▮▮▮▮▮❶ 奶牛育种:GS 在奶牛育种中取得了显著成功,加速了奶牛产奶量、乳脂率等性状的遗传改良。
▮▮▮▮▮▮▮▮❷ 玉米育种:GS 在玉米育种中也得到广泛应用,提高了玉米产量、抗病性等性状的遗传改良效率。
▮▮▮▮ⓞ 基因编辑技术 (Genome Editing Technology)
⚝▮▮▮▮▮▮▮- CRISPR-Cas9 等基因编辑技术为基因组育种提供了新的工具。基因编辑技术可以精准地修改作物和家畜的基因组,实现基因的敲除 (knockout)、敲入 (knockin)、碱基编辑 (base editing)、启动子编辑 (promoter editing) 等,加速优良性状的改良。例如,利用 CRISPR-Cas9 技术可以培育抗病、抗虫、高产、优质的农作物品种,以及具有特定性状的家畜品种。

9.2.3 基因组学在生物多样性保护中的应用 (Genomics in Biodiversity Conservation)

基因组学在生物多样性保护中发挥着越来越重要的作用,主要应用于物种鉴定 (species identification)种群结构分析 (population structure analysis)濒危物种保护 (endangered species conservation) 等方面。

物种鉴定 (Species Identification)
▮▮▮▮ⓑ DNA 条形码 (DNA Barcoding):利用标准化的 DNA 片段 (DNA barcode),如细胞色素 c 氧化酶亚基 I (Cytochrome c Oxidase subunit I, COI) 基因(动物)、核糖体 RNA 基因间隔区 (Internal Transcribed Spacer, ITS) (真菌和植物)等,进行物种快速、准确的鉴定。
▮▮▮▮ⓒ 基因组水平的物种鉴定:利用全基因组数据进行物种鉴定,可以提高鉴定的准确性和分辨率,尤其对于隐存种 (cryptic species) 的鉴定具有重要意义。
▮▮▮▮ⓓ 环境 DNA (Environmental DNA, eDNA) 物种鉴定:从环境样品(如水、土壤、空气)中提取 DNA,进行高通量测序,鉴定环境中的物种组成,用于生物多样性监测和评估。

种群结构分析 (Population Structure Analysis)
▮▮▮▮ⓑ 遗传多样性评估 (Genetic Diversity Assessment):利用基因组数据,评估种群的遗传多样性水平,了解种群的遗传变异程度,为种群保护提供依据。遗传多样性是物种适应环境变化和长期生存能力的基础。
▮▮▮▮ⓒ 种群遗传结构分析 (Population Genetic Structure Analysis):利用基因组数据,分析种群的遗传结构,了解种群之间的遗传分化程度、基因流 (gene flow) 模式、历史种群动态 (historical population dynamics) 等,为种群管理和保护提供科学依据。
▮▮▮▮ⓓ 有效种群大小 (Effective Population Size, Ne) 估算:利用基因组数据,估算种群的有效种群大小,评估种群的濒危程度和未来生存能力。有效种群大小是衡量种群遗传健康和长期生存能力的重要指标。

濒危物种保护 (Endangered Species Conservation)
▮▮▮▮ⓑ 遗传瓶颈效应 (Genetic Bottleneck Effect) 检测:利用基因组数据,检测濒危物种是否经历过遗传瓶颈效应,评估遗传多样性损失程度,为保护措施的制定提供依据。遗传瓶颈效应是指种群数量急剧下降,导致遗传多样性显著降低的现象。
▮▮▮▮ⓒ 近交衰退 (Inbreeding Depression) 评估:利用基因组数据,评估濒危物种的近交程度和近交衰退风险,为种群管理和遗传管理 (genetic management) 提供指导。近交衰退是指近亲繁殖导致后代适应性降低的现象。
▮▮▮▮ⓓ 辅助生殖技术 (Assisted Reproductive Technology) 的遗传管理:利用基因组数据,指导濒危物种的辅助生殖技术,如人工授精 (artificial insemination)体外受精 (in vitro fertilization)胚胎移植 (embryo transfer) 等,提高繁殖成功率,增加种群数量,同时避免遗传多样性损失。
▮▮▮▮ⓔ 迁地保护 (Ex situ Conservation) 的遗传管理:利用基因组数据,指导濒危物种的迁地保护,如动物园、植物园、基因库等,维持迁地种群的遗传多样性,为重引入 (reintroduction) 提供遗传资源。
▮▮▮▮ⓕ 非法野生动物贸易 (Illegal Wildlife Trade) 溯源:利用基因组数据,进行非法野生动物贸易的溯源分析,打击非法贸易,保护濒危物种。

9.3 蛋白质组学 (Proteomics)

本节介绍蛋白质组学的基本概念、研究方法和应用,以及蛋白质组学与基因组学的关系。

9.3.1 蛋白质组学的基本概念与研究方法 (Basic Concepts and Research Methods of Proteomics)

蛋白质组学 (Proteomics) 是指在基因组学的基础上,系统地研究蛋白质组 (proteome) 的学科。蛋白质组是指一个细胞、组织或生物体在特定时间、特定条件下表达的所有蛋白质的总和。蛋白质组学旨在全面分析蛋白质的表达水平 (expression level)翻译后修饰 (post-translational modification, PTM)相互作用 (protein-protein interaction, PPI)结构 (structure)功能 (function),从而揭示生命活动的分子机制。

蛋白质组学的基本概念
▮▮▮▮ⓑ 蛋白质组 (Proteome)
⚝▮▮▮▮▮▮▮- 指一个细胞、组织或生物体在特定时间、特定条件下表达的所有蛋白质的总和。蛋白质组是动态变化的,受到基因组、转录组、环境因素等多种因素的影响。
▮▮▮▮ⓑ 蛋白质组学 (Proteomics)
⚝▮▮▮▮▮▮▮- 系统地研究蛋白质组的学科,旨在全面分析蛋白质的表达、修饰、相互作用、结构和功能。
▮▮▮▮ⓒ 蛋白质组学与基因组学的区别与联系
▮▮▮▮▮▮▮▮❷ 区别
⚝▮▮▮▮▮▮▮▮▮▮▮- 基因组学 (Genomics):研究基因组的结构、功能和进化,主要关注 DNA 水平的信息。基因组是静态的,相对稳定。
⚝▮▮▮▮▮▮▮▮▮▮▮- 蛋白质组学 (Proteomics):研究蛋白质组的组成、动态变化和功能,主要关注蛋白质水平的信息。蛋白质组是动态的,受到多种因素的调控。
▮▮▮▮▮▮▮▮❷ 联系
⚝▮▮▮▮▮▮▮▮▮▮▮- 蛋白质是基因功能的执行者,基因组信息最终通过蛋白质来实现其生物学功能。
⚝▮▮▮▮▮▮▮▮▮▮▮- 蛋白质组学是基因组学的延伸和补充,可以更直接地反映基因的表达和功能状态。
⚝▮▮▮▮▮▮▮▮▮▮▮- 整合基因组学和蛋白质组学研究,可以更全面、深入地理解生命活动的分子机制。

蛋白质组学研究方法
▮▮▮▮ⓑ 蛋白质分离 (Protein Separation)
▮▮▮▮▮▮▮▮❸ 双向凝胶电泳 (Two-Dimensional Gel Electrophoresis, 2-DE)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:根据蛋白质的等电点 (isoelectric point, pI)分子量 (molecular weight, MW) 两个维度分离蛋白质。第一向根据蛋白质的 pI 进行等电聚焦 (isoelectric focusing, IEF) 分离,第二向根据蛋白质的 MW 进行 SDS-PAGE (Sodium Dodecyl Sulfate-Polyacrylamide Gel Electrophoresis) 分离。
⚝▮▮▮▮▮▮▮▮▮▮▮- 特点:分辨率高,可以分离数千种蛋白质,但对于膜蛋白 (membrane protein)碱性蛋白 (basic protein)酸性蛋白 (acidic protein)低丰度蛋白 (low-abundance protein) 等分离效果较差。
▮▮▮▮▮▮▮▮❷ 液相色谱 (Liquid Chromatography, LC)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:根据蛋白质的理化性质差异,如疏水性 (hydrophobicity)离子性 (ionicity)分子大小 (molecular size) 等,利用不同的色谱柱 (chromatography column) 进行分离。常用的液相色谱方法包括:反相液相色谱 (Reversed-Phase Liquid Chromatography, RP-LC)离子交换色谱 (Ion-Exchange Chromatography, IEX)分子排阻色谱 (Size-Exclusion Chromatography, SEC)亲和色谱 (Affinity Chromatography, AC) 等。
⚝▮▮▮▮▮▮▮▮▮▮▮- 特点:分离效率高,自动化程度高,可以与质谱联用 (LC-MS),进行高通量蛋白质组分析。

▮▮▮▮ⓑ 蛋白质鉴定 (Protein Identification)
▮▮▮▮▮▮▮▮❷ 质谱分析 (Mass Spectrometry, MS)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:将蛋白质酶解成肽段 (peptide),通过质谱仪 (mass spectrometer) 测定肽段的质荷比 (mass-to-charge ratio, m/z),根据肽段的 m/z 值和碎片离子谱 (fragment ion spectrum),鉴定蛋白质序列。常用的质谱方法包括:基质辅助激光解吸电离质谱 (Matrix-Assisted Laser Desorption/Ionization-Time Of Flight Mass Spectrometry, MALDI-TOF MS)电喷雾电离质谱 (Electrospray Ionization Mass Spectrometry, ESI-MS)串联质谱 (Tandem Mass Spectrometry, MS/MS) 等。
⚝▮▮▮▮▮▮▮▮▮▮▮- 数据库搜索 (Database Searching):将质谱数据与蛋白质序列数据库进行比对,鉴定蛋白质。常用的数据库包括 UniProtNCBI Protein 等。

▮▮▮▮ⓒ 蛋白质定量分析 (Protein Quantification)
▮▮▮▮▮▮▮▮❷ Label-free 定量 (Label-free Quantification)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:不使用同位素标记 (isotope label),直接比较不同样品中蛋白质的质谱信号强度 (mass spectrometry signal intensity)肽段谱图计数 (peptide spectrum count),进行蛋白质相对定量分析。
⚝▮▮▮▮▮▮▮▮▮▮▮- 方法谱图计数 (Spectral Counting)强度基定量 (Intensity-Based Quantification)
▮▮▮▮▮▮▮▮❷ 同位素标记定量 (Isotope Labeling Quantification)
⚝▮▮▮▮▮▮▮▮▮▮▮- 原理:使用稳定同位素 (stable isotope) 标记不同样品中的蛋白质或肽段,混合后进行质谱分析,根据同位素标记的丰度比 (abundance ratio),进行蛋白质相对或绝对定量分析。
⚝▮▮▮▮▮▮▮▮▮▮▮- 方法同位素标记亲和标签 (Isotope-Coded Affinity Tags, ICAT)稳定同位素标记细胞培养 (Stable Isotope Labeling by Amino acids in Cell culture, SILAC)等量异位素标签 (Isobaric Tags for Relative and Absolute Quantification, iTRAQ)串联质量标签 (Tandem Mass Tags, TMT) 等。

9.3.2 蛋白质组学的应用 (Applications of Proteomics)

蛋白质组学在生物医学、药物研发、农业、环境科学等领域具有广泛的应用前景,主要应用于疾病诊断、药物靶点发现、生物标志物筛选等方面。

疾病诊断 (Disease Diagnosis)
▮▮▮▮ⓑ 疾病标志物 (Disease Biomarker) 发现
⚝▮▮▮▮▮▮▮- 通过比较健康个体和疾病患者的蛋白质组,寻找在疾病状态下表达水平显著变化的蛋白质,作为疾病诊断、预后判断、疗效监测的生物标志物。
▮▮▮▮ⓑ 诊断试剂盒 (Diagnostic Kit) 开发
⚝▮▮▮▮▮▮▮- 基于疾病标志物,开发体外诊断试剂盒 (In Vitro Diagnostic kit, IVD kit),用于疾病的早期诊断、精准分型、个体化治疗指导。
▮▮▮▮ⓒ 应用实例
▮▮▮▮▮▮▮▮❷ 肿瘤标志物前列腺特异性抗原 (Prostate-Specific Antigen, PSA) 用于前列腺癌诊断;癌胚抗原 (Carcinoembryonic Antigen, CEA) 用于结直肠癌、胃癌等多种肿瘤的辅助诊断和疗效监测;甲胎蛋白 (Alpha-Fetoprotein, AFP) 用于肝癌诊断。
▮▮▮▮▮▮▮▮❸ 心血管疾病标志物肌钙蛋白 (Troponin) 用于急性心肌梗死 (Acute Myocardial Infarction, AMI) 诊断;脑钠肽 (Brain Natriuretic Peptide, BNP) 用于心力衰竭 (Heart Failure, HF) 诊断。

药物靶点发现 (Drug Target Discovery)
▮▮▮▮ⓑ 疾病相关蛋白质鉴定
⚝▮▮▮▮▮▮▮- 通过蛋白质组学研究,鉴定与疾病发生发展密切相关的蛋白质,作为潜在的药物靶点。
▮▮▮▮ⓑ 药物作用机制研究
⚝▮▮▮▮▮▮▮- 利用蛋白质组学技术,研究药物与靶点蛋白的相互作用,揭示药物的作用机制,优化药物设计,提高药物疗效,减少药物毒副作用。
▮▮▮▮ⓒ 应用实例
▮▮▮▮▮▮▮▮❷ 激酶抑制剂 (Kinase Inhibitor) 药物开发蛋白激酶 (protein kinase) 在细胞信号传导、细胞生长、分化、凋亡等过程中发挥重要作用,是重要的药物靶点。蛋白质组学技术被广泛应用于激酶抑制剂药物的靶点发现和作用机制研究。例如,伊马替尼 (imatinib)(治疗慢性粒细胞白血病)、吉非替尼 (gefitinib)(治疗非小细胞肺癌)等激酶抑制剂药物的开发。
▮▮▮▮▮▮▮▮❸ 抗体药物 (Antibody Drug) 开发单克隆抗体 (monoclonal antibody) 药物具有靶向性强、疗效好、毒副作用小等优点,是生物制药的重要方向。蛋白质组学技术被应用于抗体药物的靶点发现、抗体筛选、抗体优化等方面。例如,曲妥珠单抗 (trastuzumab)(治疗 HER2 阳性乳腺癌)、贝伐珠单抗 (bevacizumab)(治疗多种肿瘤)等抗体药物的开发。

生物标志物筛选 (Biomarker Screening)
▮▮▮▮ⓑ 早期诊断标志物 (Early Diagnostic Biomarker)
⚝▮▮▮▮▮▮▮- 寻找在疾病早期阶段表达水平发生变化的蛋白质,用于疾病的早期诊断,提高治疗成功率。
▮▮▮▮ⓑ 预后标志物 (Prognostic Biomarker)
⚝▮▮▮▮▮▮▮- 寻找与疾病预后相关的蛋白质,用于评估疾病的预后风险,指导个体化治疗方案的制定。
▮▮▮▮ⓒ 疗效预测标志物 (Predictive Biomarker)
⚝▮▮▮▮▮▮▮- 寻找与药物疗效相关的蛋白质,用于预测患者对特定药物的反应,指导药物选择和剂量调整,提高治疗效果。
▮▮▮▮ⓓ 药物毒性标志物 (Drug Toxicity Biomarker)
⚝▮▮▮▮▮▮▮- 寻找与药物毒性相关的蛋白质,用于预测药物的毒副作用风险,指导药物安全使用,减少药物不良反应。

9.3.3 蛋白质组学与基因组学的关系 (Relationship between Proteomics and Genomics)

蛋白质组学和基因组学是生命科学研究中两个重要的分支学科,它们之间既有区别又有密切联系。基因组学主要研究基因组的结构、功能和进化,提供了生物体的遗传蓝图 (genetic blueprint);蛋白质组学则研究蛋白质组的组成、动态变化和功能,揭示了基因功能的执行和调控机制。

互补关系 (Complementary Relationship)
▮▮▮▮ⓑ 基因组是静态的,蛋白质组是动态的
⚝▮▮▮▮▮▮▮- 基因组序列相对稳定,在个体发育过程中变化较小。基因组学研究主要关注基因的遗传信息 (genetic information)
⚝▮▮▮▮▮▮▮- 蛋白质组是动态变化的,受到基因表达调控、翻译后修饰、环境因素等多种因素的影响。蛋白质组学研究更直接地反映细胞的功能状态 (functional state)
▮▮▮▮ⓑ 基因组信息需要通过蛋白质来实现功能
⚝▮▮▮▮▮▮▮- 基因组编码蛋白质,蛋白质是生命活动的主要执行者。基因组信息最终需要通过转录、翻译等过程,合成蛋白质,才能实现其生物学功能。
▮▮▮▮ⓒ 蛋白质组学可以揭示基因表达调控的最终结果
⚝▮▮▮▮▮▮▮- 基因表达调控是一个复杂的过程,受到转录、翻译、蛋白质修饰、蛋白质降解等多个层次的调控。蛋白质组学可以直接检测蛋白质的表达水平和修饰状态,揭示基因表达调控的最终结果。

整合研究的意义 (Significance of Integrated Research)
▮▮▮▮ⓑ 更全面地理解生命活动的分子机制
⚝▮▮▮▮▮▮▮- 整合基因组学和蛋白质组学研究,可以从 DNA、RNA、蛋白质多个层次全面分析生命活动的分子机制,揭示基因与蛋白质之间的相互作用关系,构建基因调控网络 (gene regulatory network)蛋白质相互作用网络 (protein-protein interaction network)
▮▮▮▮ⓑ 更有效地进行疾病诊断和治疗
⚝▮▮▮▮▮▮▮- 整合基因组学和蛋白质组学信息,可以更准确地进行疾病分型、疾病风险预测、药物靶点发现、生物标志物筛选,为个性化医疗提供更全面的分子信息,提高疾病诊断和治疗的有效性。
▮▮▮▮ⓒ 加速生物技术和生物医药发展
⚝▮▮▮▮▮▮▮- 整合基因组学和蛋白质组学研究,可以加速生物技术和生物医药的发展,例如,基因工程 (genetic engineering)、蛋白质工程 (protein engineering)、基因治疗 (gene therapy)、蛋白质药物 (protein drug) 等。
▮▮▮▮ⓓ 系统生物学 (Systems Biology) 的基础
⚝▮▮▮▮▮▮▮- 整合基因组学、蛋白质组学、转录组学 (transcriptomics)、代谢组学 (metabolomics) 等多组学数据,是系统生物学研究的基础。系统生物学旨在从整体水平研究生物系统的复杂性,揭示生命活动的系统规律。

总而言之,基因组学和蛋白质组学是现代遗传学和分子生物学的重要组成部分。基因组学为我们提供了遗传信息的蓝图,而蛋白质组学则揭示了生命活动的功能执行者和动态调控机制。整合基因组学和蛋白质组学研究,将有助于我们更深入地理解生命现象,解决人类健康、农业生产、环境保护等领域的重大挑战。

10. 群体遗传学与进化 (Population Genetics and Evolution)

摘要

本章旨在介绍群体遗传学的核心概念和原理,并探讨进化是如何在群体遗传变异的基础上发生的。我们将从群体遗传学的基本概念如群体、基因库、基因频率和基因型频率入手,深入解析哈迪-温伯格定律及其应用,最后讨论影响群体遗传结构进化的关键因素,包括突变、基因流、遗传漂变、自然选择和非随机交配。通过本章的学习,读者将能够理解群体遗传学在进化生物学中的重要地位,并掌握分析群体遗传结构和进化动态的基本方法。

10.1 群体遗传学的基本概念 (Basic Concepts of Population Genetics)

10.1.1 群体、基因库、基因频率与基因型频率 (Population, Gene Pool, Gene Frequency and Genotype Frequency)

群体遗传学 (Population genetics) 是遗传学的一个分支,它研究群体 (population) 内的遗传变异以及这些变异随时间推移而发生的变化。要理解群体遗传学,首先需要掌握几个核心概念:群体 (population)、基因库 (gene pool)、基因频率 (gene frequency) 和基因型频率 (genotype frequency)。

群体 (Population):在遗传学中,群体并非简单的指一群生物个体,而是指生活在同一区域,能够相互交配并产生后代的同种生物个体的集合。例如,一片森林中的所有灰松鼠,一个湖泊中的所有鲫鱼,或是一个地区的所有人类,都可以被视为一个群体。群体的边界可以是地理上的,也可以是人为划定的,关键在于群体内的个体之间存在潜在的生殖关系。

基因库 (Gene Pool):基因库是指一个群体中所有个体所携带的全部基因的总和。更精确地说,基因库包括了群体中每一个基因座 (locus) 上的所有等位基因 (allele)。可以将基因库想象成一个基因的“蓄水池”,它包含了群体世代相传的全部遗传信息。例如,如果在一个植物群体中,控制花色的基因座有两个等位基因,红色 (R) 和白色 (r),那么这个群体的基因库就包含了所有个体携带的 R 和 r 等位基因。

基因频率 (Gene Frequency):基因频率,也称为等位基因频率 (allele frequency),是指在基因库中,特定等位基因出现的相对频率。基因频率通常用 0 到 1 之间的数值或百分比来表示。例如,在一个群体中,如果控制某个性状的基因座有两个等位基因 A 和 a,我们可以计算出 A 等位基因的频率(通常用 \(p\) 表示)和 a 等位基因的频率(通常用 \(q\) 表示)。基因频率的计算方法通常是:

\[ 基因频率 = \frac{特定等位基因的数目}{该基因座所有等位基因的总数目} \]

例如,在一个包含 100 个个体的群体中,如果某个基因座上有两个等位基因 A 和 a。通过基因分型,我们发现有 40 个 AA 基因型个体,30 个 Aa 基因型个体,和 30 个 aa 基因型个体。那么:
⚝▮▮▮- A 等位基因的总数 = \( (40 \times 2) + 30 = 110 \)
⚝▮▮▮- a 等位基因的总数 = \( (30 \times 2) + 30 = 90 \)
⚝▮▮▮- 该基因座所有等位基因的总数目 = \( 100 \times 2 = 200 \) (因为每个个体是二倍体)
⚝▮▮▮- A 等位基因的频率 ( \(p\) ) = \( \frac{110}{200} = 0.55 \)
⚝▮▮▮- a 等位基因的频率 ( \(q\) ) = \( \frac{90}{200} = 0.45 \)

值得注意的是,所有等位基因的频率之和必须等于 1,即 \(p + q = 1\)。

基因型频率 (Genotype Frequency):基因型频率是指在一个群体中,特定基因型个体所占的比例。基因型频率也用 0 到 1 之间的数值或百分比来表示。以上述例子为例,基因型频率的计算方法是:

\[ 基因型频率 = \frac{特定基因型的个体数目}{群体总个体数目} \]

⚝▮▮▮- AA 基因型频率 = \( \frac{40}{100} = 0.40 \)
⚝▮▮▮- Aa 基因型频率 = \( \frac{30}{100} = 0.30 \)
⚝▮▮▮- aa 基因型频率 = \( \frac{30}{100} = 0.30 \)

同样地,所有基因型频率之和也必须等于 1,即 AA 基因型频率 + Aa 基因型频率 + aa 基因型频率 = 1。

基因频率与基因型频率的关系:基因频率和基因型频率是描述群体遗传结构的两个重要参数,它们之间存在密切联系,但又有所区别。基因频率描述的是基因库中等位基因的相对比例,而基因型频率描述的是群体中不同基因型个体的相对比例。在一定的条件下(如哈迪-温伯格平衡),基因频率可以预测基因型频率,反之亦然。理解这两个概念及其关系,是进行群体遗传学分析的基础。

10.2 哈迪-温伯格定律 (Hardy-Weinberg Law)

10.2.1 哈迪-温伯格定律的内容与假设条件 (Content and Assumptions of Hardy-Weinberg Law)

哈迪-温伯格定律 (Hardy-Weinberg Law),也称为哈迪-温伯格平衡 (Hardy-Weinberg equilibrium) 原理,是群体遗传学的基石。它描述了在一个理想状态的群体中,基因频率和基因型频率在世代传递中保持不变的理论模型。这个定律是由英国数学家戈弗雷·哈罗德·哈迪 (Godfrey Harold Hardy) 和德国医生威廉·温伯格 (Wilhelm Weinberg) 于 1908 年各自独立提出的。

哈迪-温伯格定律的内容 可以概括为以下两点:

等位基因频率的世代稳定性:在一个大型的、随机交配的、没有突变、没有基因流动、没有自然选择的群体中,等位基因频率在世代传递中保持不变。也就是说,如果在一个世代中,某个等位基因的频率是 \(p\),那么在下一个世代以及以后的世代中,该等位基因的频率仍然是 \(p\)。

基因型频率的预测性:在上述理想条件下,如果一个基因座只有两个等位基因,例如 A 和 a,它们的频率分别为 \(p\) 和 \(q\)(\(p + q = 1\)),那么在群体达到哈迪-温伯格平衡后,基因型 AA、Aa 和 aa 的频率可以用等位基因频率来预测,分别为 \(p^2\)、\(2pq\) 和 \(q^2\)。因此,哈迪-温伯格定律的数学表达式为:

\[ p^2 + 2pq + q^2 = 1 \]

其中,\(p^2\) 是 AA 基因型频率,\(2pq\) 是 Aa 基因型频率,\(q^2\) 是 aa 基因型频率。

哈迪-温伯格定律的假设条件:哈迪-温伯格定律成立的前提是群体必须满足以下五个理想化假设条件,在实际自然群体中,这些条件很难同时完全满足,因此哈迪-温伯格平衡更多的是一个理论模型,作为研究群体遗传结构变化的参照基准。

没有突变 (No Mutation):假设基因突变率极低,以至于新突变产生的等位基因对群体基因频率的影响可以忽略不计。实际上,突变是新遗传变异的最终来源,但突变率通常很低,在短期内对基因频率的影响较小。

没有基因流动 (No Gene Flow):也称为基因迁移 (gene migration),指群体之间个体的迁入和迁出。假设群体是封闭的,没有个体从其他群体迁入,也没有个体迁出到其他群体。基因流动会改变群体的基因库,从而影响基因频率。

随机交配 (Random Mating):也称为panmixia,指群体中的个体之间是随机交配的,即任何基因型的个体与任何其他基因型的个体交配的概率是相等的,交配选择与基因型无关。非随机交配,如近亲繁殖 (inbreeding) 或选择性交配 (assortative mating),会改变基因型频率,但不直接影响等位基因频率。

群体足够大,没有遗传漂变 (Large Population Size, No Genetic Drift):假设群体足够大,以至于遗传漂变 (genetic drift) 的影响可以忽略不计。遗传漂变是指由于随机抽样误差 (random sampling error) 导致的等位基因频率在世代间发生随机波动的现象。在小群体中,遗传漂变的影响尤为显著,可能导致某些等位基因频率的剧烈变化甚至消失。

没有自然选择 (No Natural Selection):假设所有基因型个体在生存和繁殖方面是均等的,没有自然选择作用于该基因座。自然选择是指不同基因型个体在生存和繁殖能力上的差异,自然选择会定向改变等位基因频率,是进化的主要驱动力。

理解假设条件的重要性:哈迪-温伯格定律的假设条件虽然在自然界中很难完全满足,但理解这些条件对于理解进化过程至关重要。当实际群体的遗传结构偏离哈迪-温伯格平衡时,通常意味着上述一个或多个假设条件没有得到满足,从而暗示着进化力量正在发挥作用。因此,哈迪-温伯格定律不仅是一个描述群体遗传平衡状态的理论模型,也是检测群体是否发生进化的重要工具。

10.2.2 哈迪-温伯格定律的应用 (Applications of Hardy-Weinberg Law)

哈迪-温伯格定律虽然基于理想化假设,但在群体遗传学研究中具有广泛的应用价值。主要体现在以下几个方面:

计算基因频率和基因型频率:在已知基因型频率的情况下,可以利用哈迪-温伯格定律计算等位基因频率;反之,在已知等位基因频率且群体处于哈迪-温伯格平衡状态时,可以预测基因型频率。

例1:计算等位基因频率。假设在一个人类群体中,常染色体隐性遗传病苯丙酮尿症 (phenylketonuria, PKU) 的发病率约为 1/10,000。PKU 由隐性等位基因 \(p\) 引起,正常等位基因用 \(P\) 表示。患病个体基因型为 \(pp\),正常个体基因型为 \(PP\) 或 \(Pp\)。假设群体处于哈迪-温伯格平衡,我们可以利用患病率(即 \(pp\) 基因型频率)来估算等位基因频率。

⚝▮▮▮- \(pp\) 基因型频率 = \(q^2 = \frac{1}{10000} = 0.0001\)
⚝▮▮▮- 隐性等位基因 \(p\) 的频率 \(q = \sqrt{0.0001} = 0.01\)
⚝▮▮▮- 显性等位基因 \(P\) 的频率 \(p = 1 - q = 1 - 0.01 = 0.99\)

因此,在该群体中,PKU 隐性等位基因的频率约为 0.01,正常等位基因的频率约为 0.99。

例2:预测基因型频率。在例1的基础上,我们可以预测携带者 (杂合子 \(Pp\)) 的频率:

⚝▮▮▮- 携带者基因型频率 \(2pq = 2 \times 0.99 \times 0.01 \approx 0.0198\) 或 1.98%

这意味着在该群体中,大约有 1.98% 的人是 PKU 基因的携带者。

检验群体是否处于遗传平衡状态:通过比较实际观测到的基因型频率与根据哈迪-温伯格定律预测的基因型频率,可以检验群体是否处于遗传平衡状态。如果观测值与预测值之间存在显著差异,则表明群体可能受到了某些进化力量的影响,偏离了哈迪-温伯格平衡。

例3:检验群体是否处于哈迪-温伯格平衡。假设在一个蝴蝶群体中,控制翅膀颜色的基因座有两个等位基因,黑色 (B) 和白色 (b)。我们调查了 500 只蝴蝶,得到以下基因型数据:

⚝▮▮▮- BB 基因型:245 只
⚝▮▮▮- Bb 基因型:210 只
⚝▮▮▮- bb 基因型:45 只

首先,计算等位基因频率:

⚝▮▮▮- B 等位基因频率 \(p = \frac{(245 \times 2) + 210}{500 \times 2} = \frac{700}{1000} = 0.7\)
⚝▮▮▮- b 等位基因频率 \(q = 1 - p = 1 - 0.7 = 0.3\)

然后,根据哈迪-温伯格定律预测基因型频率和期望个体数:

⚝▮▮▮- 期望 BB 基因型频率 = \(p^2 = 0.7^2 = 0.49\),期望个体数 = \(0.49 \times 500 = 245\)
⚝▮▮▮- 期望 Bb 基因型频率 = \(2pq = 2 \times 0.7 \times 0.3 = 0.42\),期望个体数 = \(0.42 \times 500 = 210\)
⚝▮▮▮- 期望 bb 基因型频率 = \(q^2 = 0.3^2 = 0.09\),期望个体数 = \(0.09 \times 500 = 45\)

比较观测值和期望值,我们发现观测值与期望值非常接近。为了更严谨地判断,可以进行卡方检验 (Chi-square test) 等统计学分析,以确定观测值与期望值之间的差异是否显著。如果差异不显著,则可以认为该群体在该基因座上处于哈迪-温伯格平衡状态。

群体遗传结构分析的基础:哈迪-温伯格定律是群体遗传学分析的基础。通过与哈迪-温伯格平衡的偏离程度,可以推断出影响群体遗传结构变化的进化力量,例如自然选择、基因流动、遗传漂变等。

医学遗传学应用:在医学遗传学中,哈迪-温伯格定律常用于估算隐性遗传病基因携带者的频率,为遗传咨询和疾病风险评估提供依据。例如,在例1中,我们估算了 PKU 基因携带者的频率,这对于了解疾病的遗传风险和制定预防策略具有重要意义。

局限性:需要强调的是,哈迪-温伯格定律是一个理想化的模型,实际群体很少能完全满足所有假设条件。因此,在应用哈迪-温伯格定律时,需要注意其局限性,并结合实际情况进行分析。例如,对于小群体,遗传漂变的影响不可忽略;对于某些性状,自然选择可能正在发挥作用;非随机交配在许多物种中也普遍存在。尽管如此,哈迪-温伯格定律仍然是群体遗传学研究的重要工具,为我们理解群体遗传变异和进化过程提供了重要的理论框架。

10.3 影响群体遗传结构进化的因素 (Factors Affecting Population Genetic Structure Evolution)

10.3.1 突变、基因流与遗传漂变 (Mutation, Gene Flow and Genetic Drift)

如果哈迪-温伯格定律的假设条件不成立,群体的基因频率和基因型频率就会发生改变,这意味着群体正在发生进化。影响群体遗传结构进化的主要因素包括突变 (mutation)基因流 (gene flow)遗传漂变 (genetic drift)自然选择 (natural selection)非随机交配 (non-random mating)。本节首先讨论突变、基因流和遗传漂变。

突变 (Mutation):突变是遗传物质 (DNA) 发生的任何可遗传的改变。突变是新等位基因产生的根本来源,为进化提供原始材料。突变可以是点突变 (point mutation)(单个碱基的改变)、染色体突变 (chromosome mutation)(染色体结构或数目的改变)等。突变可以是有害的 (deleterious)有利的 (beneficial)中性的 (neutral),取决于突变对生物体适应性的影响。

⚝▮▮▮- 突变对基因频率的影响:突变本身是一个缓慢的过程,单个基因座的突变率通常很低,因此在短期内,突变对基因频率的直接影响通常较小。然而,长期来看,突变是基因变异的最终来源。如果一个等位基因通过突变不断产生新的等位基因,而没有其他因素的制衡,那么该等位基因的频率可能会逐渐增加。例如,如果等位基因 A 以一定的突变率 \(μ\) 突变成等位基因 a,那么 A 的频率会缓慢下降,a 的频率会缓慢上升。

⚝▮▮▮- 突变与进化:虽然突变本身对基因频率的直接影响可能较小,但突变是进化的必要条件。没有突变,就不会有新的遗传变异,自然选择等进化力量也就失去了作用的基础。突变产生的新的有利变异,可以被自然选择保留下来并在群体中扩散,从而导致适应性进化。

基因流 (Gene Flow):基因流,也称为基因迁移 (gene migration),是指不同群体之间基因的交换。基因流通常发生在个体在群体之间的迁入和迁出时,携带的等位基因也随之在群体间流动。基因流可以引入新的等位基因,也可以改变原有等位基因的频率,从而影响群体的遗传结构。

⚝▮▮▮- 基因流对基因频率的影响:基因流可以使不同群体之间的基因库趋于同质化。如果两个群体之间持续发生基因流,那么它们之间的基因频率差异会逐渐减小,最终可能趋于一致。反之,如果群体之间基因流受阻,例如由于地理隔离,那么不同群体可能会沿着不同的进化轨迹发展,产生遗传分化。

⚝▮▮▮- 基因流与适应性:基因流有时可以促进适应性进化。例如,当一个群体缺乏某种有利的等位基因时,如果基因流从另一个拥有该等位基因的群体引入,那么这个群体就有可能获得适应性提升。然而,基因流也可能阻碍局部适应。例如,如果一个群体已经适应了当地的环境条件,而基因流不断从其他环境条件不同的群体引入基因,那么可能会破坏原有的适应性。

遗传漂变 (Genetic Drift):遗传漂变是指由于随机抽样误差导致的等位基因频率在世代间发生随机波动的现象。遗传漂变在小群体中尤为显著,因为小群体中的随机性更强抽样误差更大。遗传漂变可以导致等位基因频率的随机波动,甚至导致某些等位基因在群体中消失 (fixation) 或丢失 (loss),即使这些等位基因是中性的或甚至是稍微有利的。

⚝▮▮▮- 遗传漂变的机制:可以将遗传漂变想象成一个罐子里装满了两种颜色的弹珠(代表两种等位基因),每次随机抓取一定数量的弹珠(代表繁殖产生的后代)。如果罐子里的弹珠总数很少(小群体),那么每次抓取的弹珠中两种颜色的比例可能会与罐子中原有的比例有较大偏差,多次抓取后,甚至可能只剩下一种颜色的弹珠。反之,如果罐子里的弹珠总数很多(大群体),那么每次抓取的弹珠中两种颜色的比例会比较接近罐子中原有的比例,多次抓取后,罐子中两种颜色的比例变化不会太大。

⚝▮▮▮- 遗传漂变的影响:遗传漂变是一种随机的进化力量,它不依赖于适应性,而是纯粹由于偶然因素导致基因频率发生变化。遗传漂变可以降低群体内的遗传变异,因为某些等位基因可能会随机丢失。在极端情况下,遗传漂变可能导致有害等位基因在小群体中积累,从而降低群体的适应性。

⚝▮▮▮- 瓶颈效应 (Bottleneck effect) 和 奠基者效应 (Founder effect)瓶颈效应是指由于灾难性事件(如自然灾害、疾病爆发等)导致群体规模急剧缩小,幸存下来的个体只携带了原有群体基因库的一小部分,从而导致遗传变异严重丧失的现象。奠基者效应是指当少数个体从一个大群体中分离出来建立新的群体时,新建立的群体只携带了原有群体基因库的一部分,从而导致新群体的遗传变异降低,基因频率也可能与原有群体显著不同的现象。瓶颈效应和奠基者效应都是遗传漂变的特殊形式,它们可以对新建立的群体或经历过群体规模剧烈波动的群体的遗传结构产生深远影响。

10.3.2 自然选择与非随机交配 (Natural Selection and Non-random Mating)

除了突变、基因流和遗传漂变等随机因素外,自然选择 (natural selection)非随机交配 (non-random mating) 是影响群体遗传结构进化的非随机因素

自然选择 (Natural Selection):自然选择是进化的核心机制,也是适应性进化的唯一驱动力。自然选择是指在生存斗争中,具有某些有利性状的个体,比其他个体更易于生存和繁殖,从而将其有利性状传递给后代的过程。自然选择作用于表型 (phenotype),但最终导致基因频率的定向改变,使群体更好地适应环境

⚝▮▮▮- 自然选择的类型:自然选择可以分为多种类型,常见的包括:
▮▮▮▮ⓐ 定向选择 (Directional selection):选择一个极端表型,导致群体表型分布向一个方向移动。例如,工业黑化现象中,深色型蛾子在污染环境中更易于生存,导致深色等位基因频率增加。
▮▮▮▮ⓑ 稳定选择 (Stabilizing selection):选择中间型表型,淘汰极端表型,维持群体表型分布的稳定。例如,人类婴儿的出生体重,过轻或过重都不利于生存,中间体重的新生儿存活率最高。
▮▮▮▮ⓒ 分裂选择 (Disruptive selection):选择两个或多个极端表型,淘汰中间型表型,导致群体表型分布趋于多样化。例如,在某些环境中,体型大和小的个体都比中等体型的个体更具生存优势。
▮▮▮▮ⓓ 频率依赖性选择 (Frequency-dependent selection):个体的适应性取决于其表型在群体中的频率。例如,负频率依赖性选择 (negative frequency-dependent selection) 指的是,当某个表型在群体中变得稀有时,其适应性反而会提高,从而维持群体内的表型多样性。

⚝▮▮▮- 自然选择与适应性:自然选择是提高群体适应性的主要力量。通过自然选择,群体可以逐渐积累有利的遗传变异,淘汰不利的遗传变异,从而更好地适应不断变化的环境。自然选择是生物多样性的重要来源,也是生物进化和物种形成的关键驱动力

非随机交配 (Non-random Mating):非随机交配是指群体中的个体不是随机选择配偶,而是根据一定的偏好或规则进行交配。非随机交配本身不会直接改变等位基因频率,但会改变基因型频率,并可能间接影响进化。常见的非随机交配类型包括:

⚝▮▮▮- 选择性交配 (Assortative mating):指具有相似表型的个体之间更倾向于交配正选择性交配 (positive assortative mating) 指的是相似表型个体之间交配频率高于随机预期,例如,体型大的个体更倾向于与体型大的个体交配。负选择性交配 (negative assortative mating) 指的是不相似表型个体之间交配频率高于随机预期,例如,具有不同 MHC 基因型的个体之间更倾向于交配。选择性交配主要影响与交配选择相关的基因座的基因型频率,可能导致纯合子频率升高杂合子频率升高

⚝▮▮▮- 近亲繁殖 (Inbreeding):指有亲缘关系的个体之间交配。近亲繁殖是一种特殊的正选择性交配,它会导致群体中纯合子基因型频率显著升高杂合子基因型频率显著降低。近亲繁殖本身不改变等位基因频率,但会增加隐性有害基因纯合表达的概率,导致近交衰退 (inbreeding depression),降低后代的生存和繁殖能力。

⚝▮▮▮- 非随机交配与进化:非随机交配本身不是进化的直接驱动力,因为它不直接改变等位基因频率。然而,非随机交配可以改变基因型频率,从而影响自然选择的效率。例如,近亲繁殖导致的近交衰退,会降低群体的适应性,从而可能受到自然选择的进一步作用。此外,选择性交配也可能通过改变基因型频率,间接影响与交配选择相关的性状的进化。

总结:影响群体遗传结构进化的因素是复杂多样的,既有随机因素(突变、基因流、遗传漂变),也有非随机因素(自然选择、非随机交配)。这些因素共同作用,塑造了生物多样性和进化轨迹。理解这些因素的作用机制和相互关系,是深入理解进化过程的关键。

11. 数量遗传学与复杂性状 (Quantitative Genetics and Complex Traits)

本章旨在介绍数量遗传学 (Quantitative Genetics) 的基本原理,重点包括数量性状 (Quantitative Traits) 的遗传分析方法、遗传力 (Heritability) 的概念及其应用、以及数量性状基因座 (Quantitative Trait Loci, QTL) 定位的策略。通过本章的学习,读者将能够理解复杂性状的遗传基础,掌握分析和解析数量性状遗传变异的关键工具和方法。

11.1 数量性状的遗传分析 (Genetic Analysis of Quantitative Traits)

本节将介绍数量性状 (Quantitative Traits) 的基本特点,阐述数量性状表现出的连续变异 (Continuous Variation) 现象,并深入探讨数量性状的遗传效应 (Genetic Effects) 和环境效应 (Environmental Effects),以及二者之间的相互作用关系。

11.1.1 数量性状的特点与连续变异 (Characteristics of Quantitative Traits and Continuous Variation)

数量性状,也称为复合性状 (Complex Traits) 或多基因性状 (Polygenic Traits),是指那些表现出连续变异,且可以用数值来度量的性状。与孟德尔遗传学中研究的质量性状 (Qualitative Traits) 显著不同,质量性状通常表现出不连续的类别,例如豌豆的种子颜色(黄色或绿色)或形状(圆形或皱缩)。

数量性状的特点
▮▮▮▮ⓑ 连续变异 (Continuous Variation):数量性状在群体中表现为连续的、梯度式的变异,而非离散的类别。例如,人类的身高、体重、皮肤颜色,动植物的产量、生长速度等。这些性状的表型值可以在一个范围内连续变化,形成一个分布曲线,通常接近正态分布。
▮▮▮▮ⓒ 多基因控制 (Polygenic Control):数量性状通常由多个基因共同控制,每个基因对表型的贡献相对较小,且效应可能是累加的。这些基因称为数量性状基因座 (QTL)。
▮▮▮▮ⓓ 环境影响显著 (Significant Environmental Influence):数量性状的表型不仅受遗传因素影响,还受到环境因素的强烈影响。相同的基因型在不同的环境条件下可能表现出不同的表型。
▮▮▮▮ⓔ 统计学分析 (Statistical Analysis):由于数量性状的连续变异和多因素影响,对其进行遗传分析需要借助统计学方法,例如均值、方差、标准差、相关分析、回归分析等。

连续变异的例子
▮▮▮▮ⓑ 人类身高:人类的身高从矮到高呈现连续分布,而不是像孟德尔性状那样只有“高”和“矮”两种截然不同的类型。身高受到多个基因以及营养、健康状况等环境因素的共同影响。
▮▮▮▮ⓒ 农作物产量:小麦、水稻等农作物的产量是典型的数量性状,其产量高低受到多个基因(控制穗粒数、粒重、株高等)以及土壤肥力、气候条件、病虫害等环境因素的综合作用。
▮▮▮▮ⓓ 动物体重:动物的体重也表现出连续变异,受到生长相关基因和饲养条件、营养水平、运动量等环境因素的影响。

与质量性状的对比

特征数量性状 (Quantitative Traits)质量性状 (Qualitative Traits)
表型变异连续变异 (Continuous Variation)不连续变异 (Discontinuous Variation)
基因控制多基因控制 (Polygenic Control)少基因或单基因控制 (Oligogenic or Monogenic Control)
环境影响显著 (Significant)较小 (Less Significant)
分析方法统计学分析 (Statistical Analysis)孟德尔遗传分析 (Mendelian Genetic Analysis)
例子身高、体重、产量等种子颜色、血型等

理解数量性状的特点和连续变异是进行数量遗传分析的基础。与质量性状的简单分类不同,数量性状的研究需要关注表型的分布规律,并采用统计学方法来解析其遗传和环境基础。

11.1.2 数量性状的遗传与环境效应 (Genetic and Environmental Effects on Quantitative Traits)

数量性状的表型值 (Phenotypic Value, P) 是由遗传效应 (Genetic Effects, G) 和环境效应 (Environmental Effects, E) 共同决定的。可以用以下简单的线性模型来表示:

\[ P = G + E \]

这个模型表明,个体的表型值是其遗传潜力和环境影响的加和。然而,实际情况往往更为复杂,遗传效应和环境效应之间可能存在互作 (Interaction)。

遗传效应 (G)
▮▮▮▮ⓑ 加性效应 (Additive Effects, A):指每个等位基因对性状的贡献是独立的、累加的。例如,如果某个基因座上的一个等位基因增加性状值 \( a \),那么两个等位基因就增加 \( 2a \)。加性效应是数量性状遗传变异的主要组成部分,也是育种中选择和改良的基础。
▮▮▮▮ⓒ 显性效应 (Dominance Effects, D):指等位基因之间的相互作用,杂合子的表型值不等于两个纯合子表型值的中间值。显性效应使得杂合子可能表现出与纯合子不同的表型,影响性状的遗传模式。
▮▮▮▮ⓓ 上位性效应 (Epistatic Effects, I):指不同基因座之间的相互作用,一个基因座的等位基因会影响另一个基因座的效应表达。上位性效应增加了数量性状遗传的复杂性,使得基因之间的关系不仅仅是简单的加和。

因此,遗传效应 (G) 可以进一步分解为:

\[ G = A + D + I \]

其中,\( A \) 代表加性效应,\( D \) 代表显性效应,\( I \) 代表上位性效应。在某些情况下,还可能存在基因型与环境互作效应 (Genotype-by-Environment Interaction, G×E),即不同的基因型在不同的环境条件下表现出不同的相对表型。

环境效应 (E)
▮▮▮▮ⓑ 环境因素的种类:环境因素包括生物环境因素(如食物、疾病、竞争)和非生物环境因素(如温度、湿度、光照、土壤)。这些因素都可能对数量性状的表型产生影响。
▮▮▮▮ⓒ 环境变异的来源:环境变异可以是随机的,也可以是系统性的。随机环境变异是指无法预测和控制的微小环境差异,系统性环境变异是指可以预测和控制的环境差异,例如不同地区的土壤肥力差异。
▮▮▮▮ⓓ 环境效应的控制:在数量遗传研究和育种实践中,为了更准确地评估遗传效应,需要尽可能控制环境效应,例如通过标准化实验条件、重复实验、区组设计等方法来减少环境变异的影响。

遗传效应与环境效应的互作 (G×E)
▮▮▮▮ⓑ 互作的定义:基因型与环境互作是指不同基因型对环境变化的反应不同。例如,某个品种在肥沃土壤中产量很高,但在贫瘠土壤中产量很低;而另一个品种在两种土壤中产量都比较稳定。
▮▮▮▮ⓒ 互作的类型:互作可以是交叉互作 (Crossover Interaction) 或非交叉互作 (Non-crossover Interaction)。交叉互作是指不同基因型在不同环境中的相对排序发生改变,非交叉互作是指排序不变,但表型差异程度发生变化。
▮▮▮▮ⓓ 互作的意义:基因型与环境互作使得品种或品系的选育需要考虑特定的环境条件。在育种实践中,需要进行多环境试验 (Multi-environment Trials, MET) 来评估品种在不同环境下的表现,选择适应性广或特定环境适应性强的优良品种。

理解数量性状的遗传效应和环境效应及其互作,有助于我们更全面地认识复杂性状的遗传基础,为数量遗传分析、品种改良和遗传咨询提供理论指导。在实际研究中,需要采用适当的实验设计和统计分析方法,有效地分离和评估遗传效应和环境效应,从而更准确地解析数量性状的遗传规律。

11.2 遗传力 (Heritability)

本节将深入介绍遗传力 (Heritability) 的概念,区分广义遗传力 (Broad-sense Heritability) 和狭义遗传力 (Narrow-sense Heritability) 的类型,并阐述遗传力的估计方法及其在育种和遗传咨询中的重要应用。

11.2.1 遗传力的概念与类型:广义遗传力与狭义遗传力 (Concepts and Types of Heritability: Broad-sense and Narrow-sense Heritability)

遗传力 (Heritability) 是指在特定群体和特定环境下,表型变异 (Phenotypic Variance, \( V_P \)) 中由遗传变异 (Genetic Variance, \( V_G \)) 贡献的比例。遗传力是评估遗传因素在性状变异中作用大小的重要参数,但需要强调的是,遗传力并非指性状遗传的程度,而是指性状变异中可遗传变异所占的比例。

表型变异的分解
总表型变异 \( V_P \) 可以分解为遗传变异 \( V_G \) 和环境变异 \( V_E \) 两部分:

\[ V_P = V_G + V_E \]

在更精细的模型中,还需要考虑基因型与环境互作变异 \( V_{G \times E} \),以及表型测量误差 \( V_{error} \)。为了简化概念,这里主要关注 \( V_G \) 和 \( V_E \)。

广义遗传力 (Broad-sense Heritability, \( H^2 \))
广义遗传力 \( H^2 \) 定义为遗传变异 \( V_G \) 占总表型变异 \( V_P \) 的比例:

\[ H^2 = \frac{V_G}{V_P} = \frac{V_G}{V_G + V_E} \]

广义遗传力反映了总遗传变异在表型变异中所占的比例,表示群体中表型变异的可遗传程度。\( H^2 \) 的取值范围在 0 到 1 之间。\( H^2 \) 越高,表明遗传因素在表型变异中的作用越大,性状的遗传潜力越高。

遗传变异的分解
遗传变异 \( V_G \) 可以进一步分解为加性遗传变异 \( V_A \)、显性遗传变异 \( V_D \) 和上位性遗传变异 \( V_I \):

\[ V_G = V_A + V_D + V_I \]

其中,\( V_A \) 是由加性效应引起的变异,\( V_D \) 是由显性效应引起的变异,\( V_I \) 是由上位性效应引起的变异。

狭义遗传力 (Narrow-sense Heritability, \( h^2 \))
狭义遗传力 \( h^2 \) 定义为加性遗传变异 \( V_A \) 占总表型变异 \( V_P \) 的比例:

\[ h^2 = \frac{V_A}{V_P} = \frac{V_A}{V_G + V_E} = \frac{V_A}{V_A + V_D + V_I + V_E} \]

狭义遗传力反映了加性遗传变异在表型变异中所占的比例,是预测后代表型值和评估选择效果的关键参数。在育种实践中,狭义遗传力更为重要,因为它直接决定了选择的有效性。只有加性遗传效应才能稳定地遗传给后代,并对后代的表型产生可预测的影响。

广义遗传力与狭义遗传力的区别与联系

特征广义遗传力 \( H^2 \) (Broad-sense Heritability)狭义遗传力 \( h^2 \) (Narrow-sense Heritability)
定义总遗传变异 \( V_G \) 占表型变异 \( V_P \) 的比例加性遗传变异 \( V_A \) 占表型变异 \( V_P \) 的比例
遗传变异组成\( V_G = V_A + V_D + V_I \)\( V_A \)
育种应用评估性状的遗传潜力,初步筛选预测选择效果,指导育种策略
遗传进展预测粗略估计更准确可靠
取值范围0 ≤ \( H^2 \) ≤ 10 ≤ \( h^2 \) ≤ \( H^2 \) ≤ 1

狭义遗传力 \( h^2 \) 总是小于或等于广义遗传力 \( H^2 \),因为 \( V_A \) 是 \( V_G \) 的一部分。当显性效应和上位性效应很小时,\( h^2 \) 接近 \( H^2 \)。在育种和遗传研究中,需要根据具体目的选择合适的遗传力类型。广义遗传力可以初步评估性状的遗传潜力,而狭义遗传力则更直接地反映了选择的有效性和遗传进展。

11.2.2 遗传力的估计与应用 (Estimation and Application of Heritability)

遗传力的估计是数量遗传学研究中的重要内容。常用的遗传力估计方法包括方差组分分析 (Variance Components Analysis)、亲子回归 (Parent-offspring Regression)、同胞相关 (Sib Analysis) 等。遗传力在育种、遗传咨询和进化研究中具有广泛的应用价值。

遗传力的估计方法
▮▮▮▮ⓑ 方差组分分析 (Variance Components Analysis)
▮▮▮▮⚝ 基于实验设计(如完全随机设计、随机区组设计),将总表型变异分解为遗传方差、环境方差和误差方差。
▮▮▮▮⚝ 常用的方法包括 ANOVA (Analysis of Variance) 和 REML (Restricted Maximum Likelihood)。
▮▮▮▮⚝ 例如,在完全随机设计中,可以利用不同基因型(如不同品系、不同家系)的表型数据,通过方差分析估计基因型方差 \( V_G \) 和环境方差 \( V_E \),进而计算广义遗传力 \( H^2 = V_G / (V_G + V_E) \)。
▮▮▮▮⚝ 若要估计狭义遗传力 \( h^2 \),需要更复杂的实验设计,如 North Carolina Design I, II, III 等,以分离加性方差 \( V_A \)、显性方差 \( V_D \) 和上位性方差 \( V_I \)。

▮▮▮▮ⓑ 亲子回归 (Parent-offspring Regression)
▮▮▮▮⚝ 通过分析亲代和子代表型值之间的回归关系来估计遗传力。
▮▮▮▮⚝ 子代表型值对其亲代表型值的回归系数 \( b_{OP} \) 近似等于狭义遗传力 \( h^2 \)。
▮▮▮▮⚝ 例如,测量一批植物的亲代和子代的身高,计算子代身高对亲代身高的回归系数,该系数即可作为身高性状的狭义遗传力估计值。
▮▮▮▮⚝ 亲子回归法主要估计狭义遗传力,因为亲代和子代之间主要传递的是加性遗传效应。

▮▮▮▮ⓒ 同胞相关 (Sib Analysis)
▮▮▮▮⚝ 通过分析同胞(全同胞或半同胞)之间表型值的相关性来估计遗传力。
▮▮▮▮⚝ 全同胞相关系数 \( t_{FS} \) 与遗传力有关,但关系较为复杂,受到加性方差、显性方差和共有环境方差的影响。
▮▮▮▮⚝ 半同胞相关系数 \( t_{HS} \) 主要反映加性遗传效应,半同胞相关系数的 2 倍近似等于狭义遗传力 \( h^2 \)。
▮▮▮▮⚝ 同胞分析法需要构建同胞群体,例如通过杂交或人工授精获得全同胞或半同胞家系,然后测量其表型数据进行分析。

遗传力的应用
▮▮▮▮ⓑ 育种中的应用
▮▮▮▮⚝ 预测选择效果:狭义遗传力 \( h^2 \) 是预测选择效果的关键参数。预期遗传进展 \( R \) 可以用选择差 \( S \) 和狭义遗传力 \( h^2 \) 的乘积来估计:\( R = h^2 \times S \)。\( h^2 \) 越高,选择效果越好,遗传进展越快。
▮▮▮▮⚝ 选择育种策略:根据性状的遗传力高低,选择合适的育种策略。对于高遗传力性状,可以直接进行表型选择;对于低遗传力性状,需要结合分子标记辅助选择 (Marker-Assisted Selection, MAS) 或基因组选择 (Genomic Selection, GS) 等方法来提高选择效率。
▮▮▮▮⚝ 评估性状改良潜力:遗传力反映了性状的遗传变异潜力。高遗传力性状具有较大的改良潜力,通过育种手段更容易获得遗传改良。

▮▮▮▮ⓑ 遗传咨询中的应用
▮▮▮▮⚝ 风险评估:对于人类复杂疾病(如高血压、糖尿病、精神分裂症),遗传力可以帮助评估遗传因素在疾病发生中的作用大小。虽然遗传力不能预测个体患病风险,但可以提示疾病的遗传倾向。
▮▮▮▮⚝ 遗传咨询:了解疾病的遗传力有助于遗传咨询师向患者或家属解释疾病的遗传风险,提供合理的生育指导和预防建议。

▮▮▮▮ⓒ 进化研究中的应用
▮▮▮▮⚝ 性状进化速率:遗传力是决定性状进化速率的重要因素。在自然选择的作用下,高遗传力性状更容易发生进化改变,适应环境变化。
▮▮▮▮⚝ 适应性分析:通过研究不同环境下的遗传力变化,可以了解性状的适应性,以及遗传变异在适应环境中的作用。

需要注意的是,遗传力是一个群体参数,受到特定群体、特定环境和特定性状的限制。遗传力不是一个固定不变的常数,它会随着群体遗传结构和环境条件的变化而变化。因此,在使用遗传力时,必须明确其适用的范围和条件,避免过度解读和滥用。尽管如此,遗传力仍然是数量遗传学中一个非常重要的概念和工具,在理论研究和实践应用中都发挥着不可替代的作用。

11.3 数量性状基因座 (QTL) 定位 (Quantitative Trait Loci (QTL) Mapping)

本节将介绍数量性状基因座 (Quantitative Trait Loci, QTL) 定位的基本原理和常用方法,包括连锁分析 (Linkage Analysis) 和全基因组关联分析 (Genome-Wide Association Study, GWAS)。同时,阐述 QTL 定位在数量性状遗传研究、基因挖掘和分子育种中的重要应用。

11.3.1 QTL 定位的原理与方法 (Principles and Methods of QTL Mapping)

数量性状基因座 (QTL) 是指基因组上与数量性状变异显著相关的基因区域。QTL 定位旨在找到控制数量性状的基因座在染色体上的位置,并估计其遗传效应。常用的 QTL 定位方法主要分为两大类:连锁分析和全基因组关联分析。

连锁分析 (Linkage Analysis)
▮▮▮▮ⓑ 原理:连锁分析基于孟德尔遗传定律和连锁交换原理。如果某个基因座(如分子标记位点)与 QTL 连锁,即它们在染色体上物理距离较近,那么在遗传过程中,它们倾向于一起遗传给后代,发生重组的概率较低。通过分析分子标记与数量性状之间的共分离 (Co-segregation) 关系,可以推断 QTL 的位置。
▮▮▮▮ⓒ 实验群体:连锁分析通常需要构建分离群体,如 \( F_2 \) 群体、回交 (Backcross, BC) 群体、重组自交系 (Recombinant Inbred Lines, RILs) 群体、双单倍体 (Doubled Haploid, DH) 群体等。这些群体具有明确的家系关系和较高的遗传变异,适合进行遗传分析。
▮▮▮▮ⓓ 分子标记:需要选择覆盖基因组的分子标记,如限制性片段长度多态性 (Restriction Fragment Length Polymorphism, RFLP)、随机扩增多态性 DNA (Random Amplified Polymorphic DNA, RAPD)、扩增片段长度多态性 (Amplified Fragment Length Polymorphism, AFLP)、简单重复序列 (Simple Sequence Repeats, SSR) 或微卫星 DNA (Microsatellite DNA)、单核苷酸多态性 (Single Nucleotide Polymorphism, SNP) 等。
▮▮▮▮ⓔ 统计分析方法
▮▮▮▮⚝ 单标记分析 (Single Marker Analysis):逐个分析每个分子标记与数量性状之间的关联。常用的统计方法包括 t 检验、方差分析、回归分析等。如果某个标记位点在不同基因型组间,数量性状的表型值存在显著差异,则认为该标记位点可能与 QTL 连锁。
▮▮▮▮⚝ 区间作图法 (Interval Mapping, IM):在相邻标记位点之间构建遗传区间,然后在区间内进行扫描,计算每个位置的似然比统计量 (Likelihood Ratio Statistic, LR) 或 LOD 值 (Logarithm of Odds)。LOD 值越高,表明该位置存在 QTL 的可能性越大。
▮▮▮▮⚝ 复合区间作图法 (Composite Interval Mapping, CIM):在区间作图的基础上,引入控制标记 (Control Markers) 来控制背景 QTL 的效应,提高 QTL 定位的精度和效率。
▮▮▮▮⚝ 多 QTL 作图法 (Multiple QTL Mapping, MQM):同时检测多个 QTL,并考虑 QTL 之间的互作效应。

全基因组关联分析 (Genome-Wide Association Study, GWAS)
▮▮▮▮ⓑ 原理:GWAS 基于群体中自然发生的连锁不平衡 (Linkage Disequilibrium, LD)。LD 是指基因组上不同位点之间非随机关联的现象。如果某个 SNP 位点与 QTL 紧密连锁,那么该 SNP 位点与数量性状之间会存在显著的关联。通过在大规模自然群体或混合群体中进行全基因组 SNP 扫描,并分析 SNP 位点与数量性状之间的关联,可以定位 QTL。
▮▮▮▮ⓒ 实验群体:GWAS 通常使用自然群体或混合群体,如品种资源库、地方品种、野生近缘种等。这些群体具有丰富的遗传多样性和精细的重组历史,适合进行高分辨率的 QTL 定位。
▮▮▮▮ⓓ 分子标记:需要高密度的全基因组 SNP 标记,通常通过基因组重测序或 SNP 芯片技术获得。SNP 标记密度越高,GWAS 的分辨率越高。
▮▮▮▮ⓔ 统计分析方法
▮▮▮▮⚝ 单点关联分析 (Single-marker Association Analysis):逐个分析每个 SNP 位点与数量性状之间的关联。常用的统计方法包括线性回归模型、混合线性模型 (Mixed Linear Model, MLM) 等。混合线性模型可以有效控制群体结构 (Population Structure) 和家系关系 (Family Relatedness) 对关联分析的干扰,降低假阳性率。
▮▮▮▮⚝ 多位点关联分析 (Multi-marker Association Analysis):同时分析多个 SNP 位点与数量性状之间的关联,提高 QTL 定位的精度和效率。

连锁分析与 GWAS 的比较

特征连锁分析 (Linkage Analysis)全基因组关联分析 (GWAS)
实验群体分离群体 (Segregating Population)自然群体/混合群体 (Natural/Admixed Population)
分辨率较低 (Low)较高 (High)
标记类型各种分子标记 (Various Markers)SNP 标记 (SNP Markers)
LD 利用家系内连锁 (Linkage within Family)群体历史 LD (Population-wide LD)
基因型数量较少 (Fewer)较多 (More)
应用粗略定位,验证 QTL精细定位,挖掘候选基因

连锁分析和 GWAS 各有优缺点,在实际研究中可以根据具体情况选择合适的方法,或将两者结合使用。连锁分析适用于验证 QTL 的存在和初步定位,GWAS 适用于高分辨率的 QTL 定位和候选基因挖掘。

11.3.2 QTL 定位的应用 (Applications of QTL Mapping)

QTL 定位技术在数量性状遗传研究、基因挖掘和分子育种中具有广泛的应用价值,为解析复杂性状的遗传基础和加速品种改良提供了强有力的工具。

数量性状遗传研究
▮▮▮▮ⓑ 解析遗传结构:QTL 定位可以揭示控制数量性状的基因座数量、位置和效应大小,帮助我们理解数量性状的遗传结构和遗传复杂性。
▮▮▮▮ⓒ 基因互作分析:通过多 QTL 作图法,可以分析 QTL 之间的上位性互作,揭示基因之间的相互作用关系。
▮▮▮▮ⓓ 环境互作分析:结合多环境试验数据,可以进行 QTL × 环境互作分析,研究 QTL 在不同环境下的效应变化,了解基因型与环境互作的遗传基础。

基因挖掘与功能验证
▮▮▮▮ⓑ 候选基因预测:QTL 定位可以将 QTL 区间缩小到染色体上的特定区域。结合基因组注释信息,可以预测 QTL 区间内的候选基因。
▮▮▮▮ⓒ 基因功能验证:通过基因克隆、基因编辑 (如 CRISPR-Cas9)、转基因等技术,可以对候选基因进行功能验证,确定其是否为控制数量性状的真正基因。
▮▮▮▮ⓓ 分子机制解析:深入研究 QTL 区域内的基因,可以解析数量性状的分子调控机制,例如基因表达调控、蛋白质互作网络等。

分子育种中的应用
▮▮▮▮ⓑ 分子标记辅助选择 (MAS):将 QTL 定位获得的与目标性状紧密连锁的分子标记应用于育种选择。通过检测分子标记的基因型,可以间接选择优良的基因型,提高选择效率和育种精度。
▮▮▮▮ⓒ 基因组选择 (GS):基于全基因组 SNP 标记和统计模型,构建基因组育种值 (Genomic Estimated Breeding Value, GEBV) 预测模型。利用 GEBV 可以预测个体的育种价值,进行早期选择,缩短育种周期,加速遗传改良进程。
▮▮▮▮ⓓ 基因聚合与改良:通过 QTL 定位,可以鉴定多个控制同一性状或不同性状的 QTL。利用分子标记辅助选择或基因编辑技术,可以将多个优良 QTL 聚合到同一品种中,实现性状的协同改良。

总之,QTL 定位技术是数量遗传学研究的核心方法之一,它不仅在理论上帮助我们深入理解复杂性状的遗传基础,而且在实践上为分子育种提供了重要的技术支撑。随着基因组学、生物信息学和分子生物学技术的快速发展,QTL 定位技术将会在数量性状遗传研究和品种改良中发挥越来越重要的作用。

12. 人类遗传学与遗传疾病 (Human Genetics and Genetic Disorders)

摘要

介绍人类基因组的特点,以及常见的遗传疾病类型、遗传方式和诊断方法。

12.1 人类基因组概述 (Overview of Human Genome)

摘要

介绍人类基因组的结构、组成和特点,包括基因密度、重复序列、非编码RNA (non-coding RNA)等。

12.1.1 人类基因组的结构与组成 (Structure and Composition of Human Genome)

摘要

详细描述人类基因组的结构和组成,包括基因 (gene)、外显子 (exon)、内含子 (intron)、重复序列 (repetitive sequences)等。

人类基因组 (human genome) 是指人类细胞核内包含的全部遗传信息,以DNA形式存在。人类基因组是一个庞大而复杂的系统,包含了大约30亿个碱基对,分布在23对染色体 (chromosome) 上(22对常染色体 (autosome) 和1对性染色体 (sex chromosome),XX或XY)。了解人类基因组的结构和组成是理解遗传学和遗传疾病的基础。

基因 (Gene)
▮▮▮▮ⓑ 定义:基因是遗传的基本单位,是DNA分子上具有特定遗传信息的片段。基因编码蛋白质 (protein) 或RNA分子,并通过表达来控制生物体的性状。
▮▮▮▮ⓒ 结构:典型的真核生物基因包括:
▮▮▮▮▮▮▮▮❹ 外显子 (Exon):基因中编码蛋白质序列的DNA片段。外显子在转录 (transcription) 后会被剪接 (splicing) 在一起形成成熟的mRNA (messenger RNA)。
▮▮▮▮▮▮▮▮❺ 内含子 (Intron):基因中不编码蛋白质序列的DNA片段,位于外显子之间。内含子在转录后会被剪接掉,不包含在成熟的mRNA中。
▮▮▮▮▮▮▮▮❻ 启动子 (Promoter):位于基因起始位点上游的DNA序列,是RNA聚合酶 (RNA polymerase) 结合和启动转录的区域,调控基因的表达。
▮▮▮▮▮▮▮▮❼ 调控序列 (Regulatory sequences):基因周围的DNA序列,包括增强子 (enhancer)、沉默子 (silencer) 等,调控基因表达的水平和模式。

基因组DNA的组成成分
▮▮▮▮ⓑ 编码序列 (Coding sequences)
▮▮▮▮▮▮▮▮❸ 基因 (Gene):如上所述,基因是编码蛋白质或功能性RNA分子的DNA序列。人类基因组大约有2万到2.5万个蛋白质编码基因。
▮▮▮▮ⓓ 非编码序列 (Non-coding sequences):人类基因组的大部分DNA并不直接编码蛋白质,这些非编码序列在基因组结构、调控和功能中发挥着重要作用。
▮▮▮▮▮▮▮▮❺ 重复序列 (Repetitive sequences):在基因组中多次重复出现的DNA序列,占人类基因组的很大比例。重复序列可以分为:
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 散在重复序列 (Interspersed repeats):如转座子 (transposon) 及其残留序列,包括LINEs (long interspersed nuclear elements)、SINEs (short interspersed nuclear elements) 等。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 串联重复序列 (Tandem repeats):多个重复单位首尾相连排列,如卫星DNA (satellite DNA)、小卫星DNA (minisatellite DNA)、微卫星DNA (microsatellite DNA) 等,常位于着丝粒 (centromere) 和端粒 (telomere) 区域。
▮▮▮▮▮▮▮▮❷ 基因间区 (Intergenic regions):基因与基因之间的DNA序列,包含调控元件、非编码RNA基因等。
▮▮▮▮▮▮▮▮❸ 内含子 (Intron):基因内部的非编码序列,位于外显子之间。
▮▮▮▮▮▮▮▮❹ 非编码RNA基因 (Non-coding RNA genes):编码功能性RNA分子,但不编码蛋白质的基因,如tRNA (transfer RNA) 基因、rRNA (ribosomal RNA) 基因、miRNA (microRNA) 基因、lncRNA (long non-coding RNA) 基因等。

染色质 (Chromatin) 结构
▮▮▮▮ⓑ 核小体 (Nucleosome):DNA与组蛋白 (histone) 结合形成的基本结构单位。DNA缠绕在组蛋白八聚体 (histone octamer) 周围形成核小体。
▮▮▮▮ⓒ 染色质纤维 (Chromatin fiber):核小体进一步折叠和螺旋化形成染色质纤维,染色质纤维在细胞分裂时高度螺旋化形成染色体。
▮▮▮▮ⓓ 染色质的类型
▮▮▮▮▮▮▮▮❺ 常染色质 (Euchromatin):染色质结构相对疏松,基因活性较高,转录活跃。
▮▮▮▮▮▮▮▮❻ 异染色质 (Heterochromatin):染色质结构高度紧密,基因活性较低或沉默,转录不活跃。异染色质又可分为:
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 组成型异染色质 (Constitutive heterochromatin):结构始终高度紧密的异染色质,如着丝粒和端粒区域的染色质。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 兼性异染色质 (Facultative heterochromatin):在特定条件下形成异染色质,基因活性可逆性沉默,如X染色体失活 (X-chromosome inactivation) 形成的巴氏小体 (Barr body)。

理解人类基因组的结构和组成,有助于深入研究基因功能、基因表达调控以及遗传疾病的发生机制。

12.1.2 人类基因组的特点:基因密度、重复序列、非编码RNA (Characteristics of Human Genome: Gene Density, Repetitive Sequences, Non-coding RNA)

摘要

阐述人类基因组的特点,如基因密度较低、含有大量重复序列和非编码RNA (non-coding RNA)。

人类基因组相较于其他生物的基因组,具有一些独特的特点,这些特点对于理解人类生物学和疾病至关重要。

基因密度较低 (Low gene density)
▮▮▮▮ⓑ 定义:基因密度是指在一定长度的DNA序列中所包含的基因数量。人类基因组的基因密度相对较低。
▮▮▮▮ⓒ 特点:人类基因组约有30亿个碱基对,但蛋白质编码基因的数量仅占基因组总长度的1-2%。这意味着人类基因组的大部分区域是非编码序列。
▮▮▮▮ⓓ 意义:低基因密度表明人类基因组中存在大量的非编码DNA,这些非编码DNA并非“垃圾DNA (junk DNA)”,而是具有重要的调控功能,参与基因表达调控、染色体结构维持等。

含有大量重复序列 (Abundance of repetitive sequences)
▮▮▮▮ⓑ 定义:重复序列是指在基因组中多次重复出现的DNA序列。人类基因组中重复序列的比例非常高,约占基因组总长度的50%以上。
▮▮▮▮ⓒ 类型:人类基因组中主要的重复序列类型包括:
▮▮▮▮▮▮▮▮❹ 转座子 (Transposons):也称为转座元件 (transposable elements),是可以在基因组中移动的DNA序列。转座子分为:
▮▮▮▮▮▮▮▮▮▮▮▮⁃ DNA转座子 (DNA transposons):通过DNA复制和剪切机制进行转座。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 逆转录转座子 (Retrotransposons):通过RNA中间体和逆转录酶 (reverse transcriptase) 进行转座,包括LINEs和SINEs。LINEs可以自主编码逆转录酶,而SINEs如Alu元件则依赖LINEs提供的酶进行转座。
▮▮▮▮▮▮▮▮❷ 串联重复序列 (Tandem repeats):多个重复单位首尾相连排列,包括卫星DNA、小卫星DNA和微卫星DNA。这些序列在染色体结构和功能中发挥作用,也常用于DNA指纹图谱 (DNA fingerprinting) 和群体遗传学研究。
▮▮▮▮ⓒ 意义:重复序列在基因组进化、染色体结构维持和基因表达调控中发挥重要作用。例如,转座子可以影响基因表达,甚至导致基因突变和疾病。串联重复序列在着丝粒和端粒的结构和功能中不可或缺。

丰富的非编码RNA (Abundance of non-coding RNA)
▮▮▮▮ⓑ 定义:非编码RNA是指转录后不翻译成蛋白质的RNA分子。人类基因组编码大量的非编码RNA,它们在基因表达调控、细胞功能和疾病发生中发挥着关键作用。
▮▮▮▮ⓒ 类型:主要的非编码RNA类型包括:
▮▮▮▮▮▮▮▮❹ tRNA (转移RNA)rRNA (核糖体RNA):参与蛋白质合成 (protein synthesis) 的基本RNA分子。
▮▮▮▮▮▮▮▮❺ miRNA (微小RNA):长度约为22个核苷酸的小RNA分子,通过与靶mRNA结合,调控基因表达,通常抑制基因表达。
▮▮▮▮▮▮▮▮❻ siRNA (小干扰RNA):长度约为20-25个核苷酸的双链RNA分子,参与RNA干扰 (RNA interference, RNAi) 途径,导致靶mRNA降解或翻译抑制,常用于基因沉默 (gene silencing) 研究。
▮▮▮▮▮▮▮▮❼ lncRNA (长非编码RNA):长度超过200个核苷酸的RNA分子,种类繁多,功能复杂,参与基因表达调控、染色质修饰、细胞核结构维持等多种生物学过程。
▮▮▮▮ⓗ 意义:非编码RNA是基因调控网络的重要组成部分,参与调控基因的转录、翻译和RNA稳定性。非编码RNA的异常表达与多种疾病,包括癌症、神经退行性疾病和心血管疾病等密切相关。

基因组的多态性 (Genome polymorphism)
▮▮▮▮ⓑ 定义:人类基因组在个体之间存在广泛的遗传变异,称为基因组多态性。这些变异包括单核苷酸多态性 (single nucleotide polymorphism, SNP)、插入缺失 (insertion/deletion, indel)、拷贝数变异 (copy number variation, CNV) 和结构变异 (structural variation, SV) 等。
▮▮▮▮ⓒ SNP (单核苷酸多态性):基因组中最常见的变异类型,指单个核苷酸的变异。SNP是研究人类遗传变异和疾病关联的重要标记。
▮▮▮▮ⓓ CNV (拷贝数变异):基因组中大片段DNA序列的拷贝数发生变异,导致某些基因或DNA片段的拷贝数增加或减少。CNV与多种疾病和性状相关。
▮▮▮▮ⓔ 意义:基因组多态性是人类个体差异的遗传基础,也是遗传学研究的重要内容。基因组多态性与疾病易感性、药物反应和个体特征等密切相关。

理解人类基因组的这些特点,有助于我们更深入地认识人类的遗传机制,揭示遗传疾病的本质,并为疾病的诊断、治疗和预防提供理论基础。

12.2 人类遗传疾病的类型与遗传方式 (Types and Inheritance Patterns of Human Genetic Disorders)

摘要

介绍常见的遗传疾病类型,如单基因遗传病 (single-gene disorder)、多基因遗传病 (multifactorial disorder)、染色体病 (chromosomal disorder) 和线粒体病 (mitochondrial disorder),以及它们的遗传方式。

遗传疾病 (genetic disorder) 是由基因突变 (gene mutation) 或染色体异常引起的疾病。根据遗传基础和遗传方式的不同,人类遗传疾病可以分为多种类型。

12.2.1 单基因遗传病:常染色体显性遗传、常染色体隐性遗传、X连锁遗传 (Single-gene Disorders: Autosomal Dominant, Autosomal Recessive, X-linked Inheritance)

摘要

介绍单基因遗传病 (single-gene disorder) 的遗传方式,包括常染色体显性遗传 (autosomal dominant inheritance)、常染色体隐性遗传 (autosomal recessive inheritance) 和X连锁遗传 (X-linked inheritance),并举例说明。

单基因遗传病是由单个基因突变引起的遗传疾病。根据突变基因所在染色体的位置和致病基因的显隐性关系,单基因遗传病可以分为以下几种主要的遗传方式:

常染色体显性遗传 (Autosomal dominant inheritance)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 致病基因位于常染色体上。
▮▮▮▮▮▮▮▮❹ 杂合子 (heterozygote) 携带一个突变等位基因 (allele) 即可发病,即突变基因相对于正常基因呈显性。
▮▮▮▮▮▮▮▮❺ 患者的父母中至少有一方患病,除非是新发突变 (de novo mutation)。
▮▮▮▮▮▮▮▮❻ 男女患病概率均等。
▮▮▮▮ⓖ 遗传规律
▮▮▮▮▮▮▮▮❽ 患病个体与正常个体婚配,后代每次妊娠有50%的概率患病。
▮▮▮▮▮▮▮▮❾ 双亲都患病且为杂合子时,后代每次妊娠有75%的概率患病,25%的概率正常。
▮▮▮▮ⓙ 典型疾病举例
▮▮▮▮▮▮▮▮❶ 马凡综合征 (Marfan syndrome):由 FBN1 基因突变引起,影响结缔组织,主要累及骨骼、心血管和眼部。
▮▮▮▮▮▮▮▮❷ 亨廷顿舞蹈症 (Huntington's disease):由 HTT 基因突变引起,导致神经退行性病变,表现为舞蹈样动作、认知功能障碍和精神症状。
▮▮▮▮▮▮▮▮❸ 软骨发育不全 (Achondroplasia):由 FGFR3 基因突变引起,影响软骨骨化,导致身材矮小,四肢短小。

常染色体隐性遗传 (Autosomal recessive inheritance)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 致病基因位于常染色体上。
▮▮▮▮▮▮▮▮❹ 纯合子 (homozygote) 携带两个突变等位基因才发病,杂合子通常为携带者 (carrier) 但不发病,即突变基因相对于正常基因呈隐性。
▮▮▮▮▮▮▮▮❺ 患者的父母通常不患病,但均为携带者。
▮▮▮▮▮▮▮▮❻ 男女患病概率均等。
▮▮▮▮ⓖ 遗传规律
▮▮▮▮▮▮▮▮❽ 双亲均为携带者时,后代每次妊娠有25%的概率患病,50%的概率为携带者,25%的概率正常。
▮▮▮▮▮▮▮▮❾ 患病个体与正常纯合子婚配,后代均不患病,但均为携带者。
▮▮▮▮ⓙ 典型疾病举例
▮▮▮▮▮▮▮▮❶ 囊性纤维化 (Cystic fibrosis, CF):由 CFTR 基因突变引起,影响外分泌腺功能,主要累及呼吸系统、消化系统和生殖系统。
▮▮▮▮▮▮▮▮❷ 苯丙酮尿症 (Phenylketonuria, PKU):由 PAH 基因突变引起,导致苯丙氨酸代谢障碍,引起智力障碍等。
▮▮▮▮▮▮▮▮❸ 脊髓性肌萎缩症 (Spinal muscular atrophy, SMA):由 SMN1 基因突变引起,导致运动神经元退行性病变,引起肌肉萎缩和无力。
▮▮▮▮▮▮▮▮❹ 地中海贫血 (Thalassemia):由珠蛋白基因突变引起,导致血红蛋白合成障碍,引起贫血。

X连锁显性遗传 (X-linked dominant inheritance)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 致病基因位于X染色体上。
▮▮▮▮▮▮▮▮❹ 女性杂合子和一个突变X染色体即可发病,男性由于只有一条X染色体,携带突变基因也发病,且病情通常更重。
▮▮▮▮▮▮▮▮❺ 患病女性的后代,每次妊娠有50%的概率患病,无论男女。患病男性的女儿必患病,儿子必正常。
▮▮▮▮ⓕ 遗传规律
▮▮▮▮▮▮▮▮❼ 患病母亲与正常父亲婚配,后代每次妊娠,女儿和儿子均有50%的概率患病。
▮▮▮▮▮▮▮▮❽ 患病父亲与正常母亲婚配,女儿必患病,儿子必正常。
▮▮▮▮ⓘ 典型疾病举例
▮▮▮▮▮▮▮▮❿ 抗维生素D佝偻病 (Vitamin D-resistant rickets):也称X连锁低磷酸盐血症性佝偻病,由 PHEX 基因突变引起,影响磷酸盐代谢,导致骨骼畸形。
▮▮▮▮▮▮▮▮❷ Rett综合征 (Rett syndrome):由 MECP2 基因突变引起,主要发生于女性,导致神经发育障碍,表现为智力障碍、语言障碍和刻板动作。

X连锁隐性遗传 (X-linked recessive inheritance)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 致病基因位于X染色体上。
▮▮▮▮▮▮▮▮❹ 女性纯合子或男性携带一个突变X染色体即可发病。女性杂合子通常为携带者,一般不发病或症状轻微。
▮▮▮▮▮▮▮▮❺ 男性患者多于女性患者。
▮▮▮▮▮▮▮▮❻ 患病男性的母亲通常为携带者,女儿必为携带者,儿子必正常。
▮▮▮▮ⓖ 遗传规律
▮▮▮▮▮▮▮▮❽ 携带者母亲与正常父亲婚配,后代每次妊娠,儿子有50%的概率患病,女儿有50%的概率为携带者。
▮▮▮▮▮▮▮▮❾ 患病父亲与正常母亲婚配,女儿必为携带者,儿子必正常。
▮▮▮▮ⓙ 典型疾病举例
▮▮▮▮▮▮▮▮❶ 血友病 (Hemophilia):由凝血因子基因突变引起,导致凝血功能障碍,易出血。血友病A由 F8 基因突变引起,血友病B由 F9 基因突变引起。
▮▮▮▮▮▮▮▮❷ 红绿色盲 (Red-green color blindness):由视锥细胞色素基因突变引起,导致辨色能力障碍。
▮▮▮▮▮▮▮▮❸ 杜氏肌营养不良症 (Duchenne muscular dystrophy, DMD):由 DMD 基因突变引起,导致肌肉进行性萎缩和无力。

Y连锁遗传 (Y-linked inheritance)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 致病基因位于Y染色体上。
▮▮▮▮▮▮▮▮❹ 只在男性中发病,女性不发病。
▮▮▮▮▮▮▮▮❺ 父传子,子传孙,世代相传。
▮▮▮▮ⓕ 遗传规律
▮▮▮▮▮▮▮▮❼ 患病父亲的所有儿子都患病,女儿均正常。
▮▮▮▮ⓗ 典型疾病举例
▮▮▮▮▮▮▮▮❾ Y染色体不育症 (Y chromosome infertility):由Y染色体上基因突变引起,导致男性不育。
▮▮▮▮▮▮▮▮❿ 多毛症 (Hypertrichosis):某些类型的多毛症可能与Y连锁基因有关。

了解单基因遗传病的遗传方式,有助于进行遗传风险评估、遗传咨询和产前诊断 (prenatal diagnosis)。

12.2.2 多基因遗传病与染色体病 (Multifactorial Disorders and Chromosomal Disorders)

摘要

介绍多基因遗传病 (multifactorial disorder) 和染色体病 (chromosomal disorder) 的特点和遗传方式,并举例说明。

除了单基因遗传病,人类遗传疾病还包括多基因遗传病和染色体病,它们的遗传机制更为复杂。

多基因遗传病 (Multifactorial disorders)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 由多个基因的微效累加作用和环境因素共同作用引起的疾病。
▮▮▮▮▮▮▮▮❹ 遗传方式复杂,不符合孟德尔遗传规律 (Mendelian inheritance)。
▮▮▮▮▮▮▮▮❺ 具有家族聚集性,但同一家族成员的患病程度和表现可能差异很大。
▮▮▮▮▮▮▮▮❻ 环境因素在疾病的发生发展中起重要作用。
▮▮▮▮ⓖ 遗传规律
▮▮▮▮▮▮▮▮❽ 亲属患病风险高于一般人群,一级亲属(父母、子女、兄弟姐妹)的患病风险最高。
▮▮▮▮▮▮▮▮❾ 患病风险随亲属级别降低而降低。
▮▮▮▮▮▮▮▮❿ 同卵双生子 (monozygotic twins) 的同病率高于异卵双生子 (dizygotic twins),但同病率通常低于100%,表明环境因素的作用。
▮▮▮▮ⓚ 典型疾病举例
▮▮▮▮▮▮▮▮❶ 高血压 (Hypertension):多种基因和环境因素共同作用,如饮食、生活方式等。
▮▮▮▮▮▮▮▮❷ 糖尿病 (Diabetes mellitus):包括1型糖尿病和2型糖尿病,均受多个基因和环境因素影响。
▮▮▮▮▮▮▮▮❸ 冠心病 (Coronary heart disease):受遗传易感性和环境因素(如高血脂、吸烟、肥胖)共同影响。
▮▮▮▮▮▮▮▮❹ 神经管缺陷 (Neural tube defects):如脊柱裂 (spina bifida) 和无脑儿 (anencephaly),受多个基因和叶酸 (folic acid) 等环境因素影响。
▮▮▮▮▮▮▮▮❺ 精神分裂症 (Schizophrenia)双相情感障碍 (Bipolar disorder):复杂的精神疾病,遗传和环境因素均起作用。
▮▮▮▮▮▮▮▮❻ 自身免疫性疾病 (Autoimmune diseases):如类风湿性关节炎 (rheumatoid arthritis)、系统性红斑狼疮 (systemic lupus erythematosus)、多发性硬化症 (multiple sclerosis) 等,受多个基因和免疫系统调控因素影响。

染色体病 (Chromosomal disorders)
▮▮▮▮ⓑ 特点
▮▮▮▮▮▮▮▮❸ 由染色体数目异常或结构异常引起的疾病。
▮▮▮▮▮▮▮▮❹ 染色体异常通常是新发突变,遗传风险较低,但某些染色体结构异常可能具有遗传性。
▮▮▮▮▮▮▮▮❺ 临床表现复杂多样,常累及多个器官系统,导致发育迟缓、智力障碍、畸形等。
▮▮▮▮ⓕ 类型
▮▮▮▮▮▮▮▮❼ 染色体数目异常 (Numerical chromosomal abnormalities)
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 非整倍体 (Aneuploidy):染色体数目不是整倍数,如三体综合征 (trisomy,多一条染色体) 和单体综合征 (monosomy,少一条染色体)。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 整倍体 (Polyploidy):染色体组数增加,如三倍体 (triploidy,3套染色体组) 和四倍体 (tetraploidy,4套染色体组),在人类中极少见,通常导致流产 (miscarriage)。
▮▮▮▮▮▮▮▮❷ 染色体结构异常 (Structural chromosomal abnormalities)
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 缺失 (Deletion):染色体某片段丢失。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 重复 (Duplication):染色体某片段重复出现。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 倒位 (Inversion):染色体某片段颠倒180°后重新连接。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 易位 (Translocation):染色体某片段转移到另一条非同源染色体上。易位又分为相互易位 (reciprocal translocation) 和罗伯逊易位 (Robertsonian translocation)。
▮▮▮▮ⓒ 典型疾病举例
▮▮▮▮▮▮▮▮❷ 唐氏综合征 (Down syndrome):也称21三体综合征,由21号染色体三体引起,表现为智力障碍、特殊面容、先天性心脏病等。
▮▮▮▮▮▮▮▮❸ 爱德华氏综合征 (Edwards syndrome):也称18三体综合征,由18号染色体三体引起,预后不良,多数患儿在出生后数月内死亡。
▮▮▮▮▮▮▮▮❹ 帕陶氏综合征 (Patau syndrome):也称13三体综合征,由13号染色体三体引起,预后极差,多数患儿在出生后数周内死亡。
▮▮▮▮▮▮▮▮❺ 特纳综合征 (Turner syndrome):也称XO综合征,女性少一条X染色体 (45,X),表现为身材矮小、卵巢发育不全、不育等。
▮▮▮▮▮▮▮▮❻ 克莱因费尔特综合征 (Klinefelter syndrome):男性多一条X染色体 (47,XXY),表现为睾丸发育不全、不育、男性乳房发育等。
▮▮▮▮▮▮▮▮❼ 猫叫综合征 (Cri-du-chat syndrome):由5号染色体短臂缺失引起,患儿哭声似猫叫,伴有智力障碍和特殊面容。
▮▮▮▮▮▮▮▮❽ 慢性粒细胞白血病 (Chronic myelogenous leukemia, CML):约95%的CML患者存在费城染色体 (Philadelphia chromosome),是9号染色体和22号染色体之间相互易位形成的异常染色体。

多基因遗传病和染色体病的遗传机制复杂,诊断和遗传咨询难度较大。

12.2.3 线粒体遗传病 (Mitochondrial Disorders)

摘要

介绍线粒体遗传病 (mitochondrial disorder) 的特点和遗传方式。

线粒体 (mitochondria) 是细胞的能量工厂,具有独立的遗传物质——线粒体DNA (mitochondrial DNA, mtDNA)。线粒体遗传病是由mtDNA突变引起的疾病。

特点
▮▮▮▮ⓑ 遗传物质:线粒体遗传病由mtDNA突变引起。mtDNA是环状双链DNA分子,位于线粒体基质中,编码线粒体呼吸链 (respiratory chain) 和氧化磷酸化 (oxidative phosphorylation) 相关的重要蛋白质和RNA。
▮▮▮▮ⓒ 母系遗传 (Maternal inheritance):线粒体主要通过卵细胞 (oocyte) 传递给后代,精子 (sperm) 几乎不贡献线粒体。因此,线粒体遗传病表现为母系遗传,患病母亲的所有子女都可能患病,患病父亲的子女均不患病。
▮▮▮▮ⓓ 异质性 (Heteroplasmy)同质性 (Homoplasmy)
▮▮▮▮▮▮▮▮❺ 同质性 (Homoplasmy):一个细胞或个体中,所有线粒体DNA分子均为同一类型(要么全为突变型,要么全为野生型)。
▮▮▮▮▮▮▮▮❻ 异质性 (Heteroplasmy):一个细胞或个体中,同时存在突变型和野生型两种线粒体DNA分子。线粒体遗传病的临床表现严重程度与突变mtDNA的比例有关,突变比例越高,症状越重。
▮▮▮▮ⓖ 能量代谢障碍:线粒体功能障碍导致能量代谢障碍,影响高能量需求的组织和器官,如神经系统、肌肉、心脏、内分泌系统等。
▮▮▮▮ⓗ 临床表现多样性:线粒体遗传病的临床表现多样,可累及多个器官系统,表现为神经系统症状(如肌无力、共济失调、癫痫、智力障碍)、肌肉病变、心脏病、内分泌功能障碍等。

遗传规律
▮▮▮▮ⓑ 母系遗传:患病母亲的所有子女都可能患病,但患病程度可能因mtDNA异质性比例不同而异。
▮▮▮▮ⓒ 患病父亲不遗传:患病父亲的子女均不患病,也不携带突变mtDNA。

典型疾病举例
▮▮▮▮ⓑ Leber遗传性视神经病变 (Leber hereditary optic neuropathy, LHON):mtDNA突变导致视神经萎缩,引起进行性视力丧失。
▮▮▮▮ⓒ 线粒体脑肌病伴乳酸酸中毒和卒中样发作 (Mitochondrial encephalomyopathy, lactic acidosis, and stroke-like episodes, MELAS):mtDNA突变引起神经系统和肌肉病变,表现为卒中样发作、癫痫、肌无力、乳酸酸中毒等。
▮▮▮▮ⓓ 肌阵挛性癫痫伴破碎红纤维 (Myoclonic epilepsy with ragged-red fibers, MERRF):mtDNA突变引起肌阵挛性癫痫、共济失调、肌无力等,肌肉活检可见破碎红纤维。
▮▮▮▮ⓔ 慢性进行性眼外肌麻痹 (Chronic progressive external ophthalmoplegia, CPEO):mtDNA突变引起眼外肌麻痹、眼睑下垂等。

线粒体遗传病的遗传方式和临床表现特殊,诊断和治疗具有挑战性。

12.3 人类遗传疾病的诊断与遗传咨询 (Diagnosis and Genetic Counseling of Human Genetic Disorders)

摘要

介绍人类遗传疾病的诊断方法,包括分子诊断 (molecular diagnosis)、染色体诊断 (chromosomal diagnosis) 和生化诊断 (biochemical diagnosis),以及遗传咨询 (genetic counseling) 的意义和内容。

遗传疾病的诊断和遗传咨询对于患者及其家庭至关重要,有助于明确诊断、评估遗传风险、制定治疗方案和预防措施。

12.3.1 人类遗传疾病的诊断方法:分子诊断、染色体诊断、生化诊断 (Diagnostic Methods for Human Genetic Disorders: Molecular Diagnosis, Chromosomal Diagnosis, Biochemical Diagnosis)

摘要

介绍常用的遗传疾病诊断方法,包括分子诊断 (molecular diagnosis)、染色体诊断 (chromosomal diagnosis) 和生化诊断 (biochemical diagnosis)。

遗传疾病的诊断方法多样,根据疾病的遗传基础和临床特点,可以选择不同的诊断技术。主要的诊断方法包括分子诊断、染色体诊断和生化诊断。

分子诊断 (Molecular diagnosis)
▮▮▮▮ⓑ 原理:通过检测DNA、RNA或蛋白质水平的遗传物质变异,明确致病基因突变。
▮▮▮▮ⓒ 常用技术
▮▮▮▮▮▮▮▮❹ PCR (聚合酶链式反应, Polymerase Chain Reaction):用于扩增特定DNA片段,为后续分析提供充足的DNA样本。
▮▮▮▮▮▮▮▮❺ DNA测序 (DNA sequencing)
▮▮▮▮▮▮▮▮▮▮▮▮⁃ Sanger测序 (Sanger sequencing):传统的DNA测序方法,用于检测已知基因的突变,如单基因遗传病的基因诊断。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 新一代测序 (Next-generation sequencing, NGS):高通量测序技术,可以同时对大量基因或整个基因组进行测序,适用于复杂遗传病的基因诊断,如多基因遗传病、肿瘤基因检测等。NGS技术包括全外显子组测序 (whole-exome sequencing, WES)、全基因组测序 (whole-genome sequencing, WGS)、靶向基因panel测序 (targeted gene panel sequencing) 等。
▮▮▮▮▮▮▮▮❸ 基因芯片 (DNA microarray):用于检测基因组中特定区域的拷贝数变异 (CNV)、SNP等。
▮▮▮▮▮▮▮▮❹ 荧光原位杂交 (Fluorescence in situ hybridization, FISH):利用荧光标记的DNA探针与细胞或组织样本中的特定DNA序列杂交,检测染色体异常,如染色体缺失、重复、易位等。
▮▮▮▮▮▮▮▮❺ 实时荧光定量PCR (Real-time quantitative PCR, qPCR):用于检测基因表达水平,如RNA水平的定量分析。
▮▮▮▮ⓓ 应用
▮▮▮▮▮▮▮▮❺ 单基因遗传病诊断:如囊性纤维化、苯丙酮尿症、血友病、杜氏肌营养不良症等。
▮▮▮▮▮▮▮▮❻ 多基因遗传病风险评估:通过检测疾病相关易感基因的SNP位点,评估个体患病风险,如糖尿病、冠心病、阿尔茨海默病 (Alzheimer's disease) 等。
▮▮▮▮▮▮▮▮❼ 肿瘤基因检测:检测肿瘤组织中的基因突变,指导靶向治疗 (targeted therapy) 和预后评估。
▮▮▮▮▮▮▮▮❽ 药物基因组学 (Pharmacogenomics):检测个体基因变异,预测药物疗效和不良反应,实现个体化用药。
▮▮▮▮▮▮▮▮❾ 产前基因诊断 (Prenatal genetic diagnosis)植入前基因诊断 (Preimplantation genetic diagnosis, PGD):对胎儿或胚胎进行基因检测,筛查遗传疾病。

染色体诊断 (Chromosomal diagnosis)
▮▮▮▮ⓑ 原理:通过细胞遗传学技术,直接观察染色体的数目和结构,检测染色体异常。
▮▮▮▮ⓒ 常用技术
▮▮▮▮▮▮▮▮❹ 染色体核型分析 (Karyotyping):对细胞分裂中期 (metaphase) 的染色体进行显带处理,观察染色体的数目和结构,检测染色体数目异常和较大的结构异常,如三体综合征、染色体缺失、易位等。
▮▮▮▮▮▮▮▮❺ 高分辨率染色体核型分析 (High-resolution karyotyping):在染色体分裂前期 (prophase) 或中期早期 (prometaphase) 进行核型分析,染色体伸展程度更高,可以检测到更小的染色体结构异常。
▮▮▮▮▮▮▮▮❻ 荧光原位杂交 (FISH):如前所述,FISH技术可以检测染色体数目异常和微小缺失、重复、易位等。
▮▮▮▮▮▮▮▮❼ 染色体微阵列分析 (Chromosomal microarray analysis, CMA):高通量染色体分析技术,可以检测全基因组范围内的拷贝数变异 (CNV),包括微小缺失和微小重复。CMA比传统核型分析分辨率更高,可以检测到更小的染色体异常。
▮▮▮▮ⓗ 应用
▮▮▮▮▮▮▮▮❾ 染色体病诊断:如唐氏综合征、爱德华氏综合征、帕陶氏综合征、特纳综合征、克莱因费尔特综合征等。
▮▮▮▮▮▮▮▮❿ 不明原因的智力障碍、发育迟缓、多发畸形:染色体异常是这些疾病的重要病因之一,染色体诊断有助于明确诊断。
▮▮▮▮▮▮▮▮❸ 复发性流产、不孕不育:夫妇一方或双方染色体异常可能导致流产或不孕,染色体核型分析有助于评估生育风险。
▮▮▮▮▮▮▮▮❹ 肿瘤细胞遗传学分析:检测肿瘤细胞的染色体异常,如慢性粒细胞白血病的费城染色体、急性髓系白血病的染色体易位等,有助于肿瘤诊断、分型和预后评估。
▮▮▮▮▮▮▮▮❺ 产前染色体诊断:通过羊水穿刺 (amniocentesis)、绒毛膜取样 (chorionic villus sampling, CVS) 或脐带血穿刺 (cordocentesis) 获取胎儿细胞,进行染色体核型分析或CMA,筛查胎儿染色体异常。

生化诊断 (Biochemical diagnosis)
▮▮▮▮ⓑ 原理:通过检测患者体液或细胞中特定代谢产物、酶活性或蛋白质水平的异常,间接反映基因缺陷导致的代谢紊乱或蛋白质功能异常。
▮▮▮▮ⓒ 常用技术
▮▮▮▮▮▮▮▮❹ 代谢物检测
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 串联质谱 (Tandem mass spectrometry, MS/MS):高灵敏度和高通量的代谢物检测技术,用于新生儿筛查 (newborn screening) 和代谢性疾病诊断,如氨基酸代谢病、有机酸代谢病、脂肪酸氧化障碍等。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 气相色谱-质谱联用 (Gas chromatography-mass spectrometry, GC-MS)液相色谱-质谱联用 (Liquid chromatography-mass spectrometry, LC-MS):用于复杂代谢物分析,如尿有机酸分析、血浆氨基酸分析等。
▮▮▮▮▮▮▮▮❷ 酶活性检测:检测特定酶的活性,如溶酶体酶活性检测,用于诊断溶酶体贮积症 (lysosomal storage diseases)。
▮▮▮▮▮▮▮▮❸ 蛋白质免疫学检测
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 免疫印迹 (Western blot):检测特定蛋白质的表达水平和分子量。
▮▮▮▮▮▮▮▮▮▮▮▮⁃ 酶联免疫吸附试验 (Enzyme-linked immunosorbent assay, ELISA):定量检测特定蛋白质的浓度。
▮▮▮▮ⓒ 应用
▮▮▮▮▮▮▮▮❷ 先天性代谢缺陷病 (Inborn errors of metabolism):如苯丙酮尿症、半乳糖血症 (galactosemia)、枫糖尿症 (maple syrup urine disease) 等。
▮▮▮▮▮▮▮▮❸ 溶酶体贮积症:如戈谢病 (Gaucher disease)、尼曼-匹克病 (Niemann-Pick disease)、庞贝病 (Pompe disease) 等。
▮▮▮▮▮▮▮▮❹ 某些单基因遗传病:如α-1-抗胰蛋白酶缺乏症 (alpha-1-antitrypsin deficiency),通过检测血清α-1-抗胰蛋白酶水平进行诊断。

选择合适的诊断方法需要综合考虑疾病的临床表现、遗传方式、技术可及性和成本效益等因素。在许多情况下,需要联合应用多种诊断技术,才能明确诊断。

12.3.2 遗传咨询的意义与内容 (Significance and Content of Genetic Counseling)

摘要

阐述遗传咨询 (genetic counseling) 的意义,介绍遗传咨询的内容和流程,以及遗传咨询在预防和控制遗传疾病中的作用。

遗传咨询是一个为个人和家庭提供关于遗传疾病的信息、风险评估、诊断、治疗和预防的专业过程。遗传咨询旨在帮助患者及其家庭充分了解遗传疾病,做出明智的决策,并适应疾病带来的影响。

遗传咨询的意义
▮▮▮▮ⓑ 提供准确的遗传信息:帮助患者和家属了解遗传疾病的病因、遗传方式、临床表现、预后和治疗选择。
▮▮▮▮ⓒ 评估遗传风险:根据家族史、遗传检测结果等,评估个体或家庭成员患遗传疾病或生育患儿的风险。
▮▮▮▮ⓓ 协助选择合适的遗传检测:根据临床情况和遗传风险,推荐合适的遗传检测项目,并解释检测结果的意义。
▮▮▮▮ⓔ 支持患者和家庭:提供心理支持、情感疏导和社会资源信息,帮助患者和家庭应对遗传疾病带来的挑战。
▮▮▮▮ⓕ 促进知情选择:帮助患者和家庭在充分了解信息的基础上,自主做出关于生育、治疗和预防的决策。
▮▮▮▮ⓖ 预防遗传疾病:通过遗传咨询和产前诊断等措施,预防遗传疾病的发生和再发。

遗传咨询的内容
▮▮▮▮ⓑ 病史采集和家系分析 (Family history taking and pedigree analysis):详细询问患者的个人病史、家族史,绘制家系图 (pedigree),分析疾病的遗传模式。
▮▮▮▮ⓒ 风险评估 (Risk assessment):根据家系史、遗传检测结果、疾病的遗传方式和外显率 (penetrance) 等因素,评估个体或家庭成员患病或生育患儿的风险。
▮▮▮▮ⓓ 遗传检测咨询 (Genetic testing counseling)
▮▮▮▮▮▮▮▮❺ 检测前咨询 (Pre-test counseling):解释遗传检测的目的、方法、局限性、可能的检测结果及其意义,告知患者检测的风险和益处,获得患者的知情同意 (informed consent)。
▮▮▮▮▮▮▮▮❻ 检测后咨询 (Post-test counseling):解释遗传检测结果,包括阳性结果、阴性结果和不确定结果的意义,告知患者及其家属下一步的措施,如临床管理、生育指导、遗传咨询等。
▮▮▮▮ⓖ 生育指导 (Reproductive counseling)
▮▮▮▮▮▮▮▮❽ 自然生育指导:对于有遗传风险的夫妇,告知其生育患儿的风险,提供自然生育的风险评估和指导。
▮▮▮▮▮▮▮▮❾ 辅助生殖技术 (Assisted reproductive technology, ART) 选择:介绍可选择的辅助生殖技术,如植入前基因诊断 (PGD)、供卵 (oocyte donation)、供精 (sperm donation) 等,帮助夫妇选择合适的生育方式。
▮▮▮▮▮▮▮▮❿ 产前诊断咨询:对于孕期妇女,介绍可选择的产前诊断方法,如绒毛膜取样、羊水穿刺、无创产前检测 (non-invasive prenatal testing, NIPT) 等,告知其适应证、风险、准确性和局限性,帮助孕妇选择合适的产前诊断方式。
▮▮▮▮ⓚ 心理支持和情感疏导 (Psychological support and emotional counseling):遗传疾病的诊断和遗传风险评估可能给患者和家庭带来心理压力和情感困扰,遗传咨询师需要提供心理支持和情感疏导,帮助他们应对疾病带来的心理和社会影响。
▮▮▮▮ⓛ 社会资源信息提供 (Social resources information):提供相关的患者组织、支持团体、医疗资源、社会福利等信息,帮助患者和家庭获得必要的社会支持。

遗传咨询的流程
▮▮▮▮ⓑ 初诊咨询:患者或家属首次就诊,遗传咨询师收集病史、家系史,进行初步风险评估,确定咨询目标。
▮▮▮▮ⓒ 遗传检测:根据需要,为患者或家属提供遗传检测,并进行检测前咨询。
▮▮▮▮ⓓ 复诊咨询:遗传咨询师解释遗传检测结果,进行详细的风险评估,提供生育指导、治疗建议和预防措施。
▮▮▮▮ⓔ 随访咨询:定期随访患者和家属,解答疑问,提供持续的心理支持和信息更新。

遗传咨询的专业人员
▮▮▮▮ⓑ 遗传咨询师 (Genetic counselor):经过专业培训,具有遗传学、咨询学和心理学知识的专业人员,负责提供遗传咨询服务。
▮▮▮▮ⓒ 临床遗传学家 (Clinical geneticist):具有医学背景,专门从事遗传疾病诊断、治疗和管理的医生,也参与遗传咨询工作。
▮▮▮▮ⓓ 其他专业人员:如遗传护士 (genetic nurse)、心理学家 (psychologist)、社会工作者 (social worker) 等,共同组成遗传咨询团队,为患者和家庭提供全面的服务。

遗传咨询在遗传疾病的预防和控制中发挥着重要作用,有助于提高出生人口素质,改善遗传病患者的生活质量。随着遗传学和基因组学技术的快速发展,遗传咨询在临床医学中的应用越来越广泛,需求也越来越大。

13. 癌症遗传学 (Cancer Genetics)

13.0 章节概要

本章旨在介绍癌症的遗传基础,深入探讨癌症作为一种基因疾病的本质。我们将从癌基因 (oncogenes) 和抑癌基因 (tumor suppressor genes) 这两个关键概念入手,阐述它们在肿瘤发生中的作用机制。随后,我们将详细解析肿瘤发生的多步骤模型 (multi-step model of tumorigenesis),理解癌症发展是一个渐进的、多基因突变积累的过程。最后,我们将探讨癌症的遗传易感性 (genetic susceptibility to cancer),包括遗传性癌症综合征 (hereditary cancer syndromes) 和癌症易感基因 (cancer susceptibility genes),并介绍癌症的遗传咨询 (genetic counseling) 与预防策略,为读者提供关于癌症遗传学 (cancer genetics) 的全面认识。

13.1 癌症的遗传基础 (Genetic Basis of Cancer)

癌症,从根本上来说,是一种基因疾病。这意味着癌症的发生和发展与基因的异常改变密切相关。这些基因改变可以影响细胞的生长、分化、凋亡等关键生命过程,最终导致细胞的恶性转化和肿瘤的形成。在癌症遗传学 (cancer genetics) 中,癌基因 (oncogenes) 和抑癌基因 (tumor suppressor genes) 是两个核心概念,它们分别代表了促进肿瘤发生和抑制肿瘤发生的两类基因。

13.1.1 癌基因 (Oncogenes)

癌基因 (oncogenes) 是起源于 正常细胞中的原癌基因 (proto-oncogenes)。原癌基因 (proto-oncogenes) 在细胞的正常生长和调控中发挥着重要作用,它们编码的蛋白质参与细胞信号传导、细胞周期调控、细胞生长和分化等过程。当原癌基因 (proto-oncogenes) 发生激活突变 (activating mutations) 时,它们就转变为癌基因 (oncogenes)。这些突变通常是显性的,即只需要一个等位基因发生突变,就足以导致细胞的癌变。

癌基因的起源 (Origin of Oncogenes)

癌基因 (oncogenes) 的前身是原癌基因 (proto-oncogenes),它们是细胞正常功能所必需的基因。原癌基因 (proto-oncogenes) 编码的蛋白质种类繁多,包括:

▮▮▮▮ⓐ 生长因子 (growth factors):例如,血小板衍生生长因子 (Platelet-derived growth factor, PDGF)、表皮生长因子 (Epidermal growth factor, EGF) 等,它们刺激细胞生长和分裂。
▮▮▮▮ⓑ 生长因子受体 (growth factor receptors):例如,表皮生长因子受体 (Epidermal Growth Factor Receptor, EGFR)、人表皮生长因子受体 2 (Human Epidermal growth factor Receptor 2, HER2) 等,它们接收细胞外的生长信号并传递到细胞内。
▮▮▮▮ⓒ 信号转导分子 (signal transduction molecules):例如,RAS 蛋白、MAP 激酶 (Mitogen-activated protein kinases, MAPKs)、PI3K (Phosphoinositide 3-kinases) 等,它们在细胞内传递生长信号。
▮▮▮▮ⓓ 转录因子 (transcription factors):例如,MYC、FOS、JUN 等,它们调控基因的表达,影响细胞生长和分化。
▮▮▮▮ⓔ 细胞周期调控蛋白 (cell cycle regulators):例如,细胞周期蛋白 (cyclins)、细胞周期蛋白依赖性激酶 (cyclin-dependent kinases, CDKs) 等,它们控制细胞周期的进程。

癌基因的激活机制 (Activation Mechanisms of Oncogenes)

原癌基因 (proto-oncogenes) 转化为癌基因 (oncogenes) 的激活机制多种多样,主要包括以下几种:

▮▮▮▮ⓐ 点突变 (point mutations):基因序列中单个碱基的改变,可能导致编码的蛋白质结构或功能发生改变。例如,RAS 基因的点突变可以使其持续激活,导致细胞生长失控。
▮▮▮▮ⓑ 基因扩增 (gene amplification):原癌基因 (proto-oncogenes) 的拷贝数增加,导致其表达水平异常升高。例如,MYC 基因的扩增在多种肿瘤中常见,HER2 基因的扩增与乳腺癌的发生发展密切相关。
▮▮▮▮ⓒ 染色体易位 (chromosomal translocation):染色体片段发生位置转移,可能导致原癌基因 (proto-oncogenes) 受到新的调控元件的影响,或者与另一个基因融合形成新的融合基因。例如,慢性粒细胞白血病 (chronic myelogenous leukemia, CML) 中常见的 Philadelphia 染色体就是由于 9 号染色体和 22 号染色体之间发生易位,导致 BCR 基因和 ABL 基因融合形成 BCR-ABL 融合基因,该融合基因具有持续的酪氨酸激酶活性,促进细胞增殖。
▮▮▮▮ⓓ 病毒插入 (viral insertion):某些病毒 (如逆转录病毒) 整合到宿主细胞基因组时,可能插入到原癌基因 (proto-oncogenes) 附近,增强其表达,或者病毒本身携带癌基因 (oncogenes) 并将其引入宿主细胞。

癌基因的功能 (Functions of Oncogenes)

癌基因 (oncogenes) 的激活导致其编码的蛋白质功能异常增强,主要表现在以下几个方面:

▮▮▮▮ⓐ 促进细胞过度增殖 (promoting excessive cell proliferation):癌基因 (oncogenes) 可以解除细胞生长调控的限制,使细胞无节制地增殖,形成肿瘤。
▮▮▮▮ⓑ 抑制细胞凋亡 (inhibiting apoptosis):癌基因 (oncogenes) 可以干扰细胞的程序性死亡 (apoptosis) 机制,使异常细胞无法被清除,从而积累并发展成肿瘤。
▮▮▮▮ⓒ 促进血管生成 (promoting angiogenesis):肿瘤生长需要充足的血液供应,癌基因 (oncogenes) 可以促进肿瘤血管的生成,为肿瘤提供营养和氧气。
▮▮▮▮ⓓ 促进肿瘤转移 (promoting tumor metastasis):癌基因 (oncogenes) 可以增强肿瘤细胞的侵袭能力和转移能力,使肿瘤细胞扩散到身体其他部位。

常见的癌基因例子 (Examples of Common Oncogenes)

▮▮▮▮ⓐ RAS 基因家族 (RAS gene family):包括 HRAS、KRAS、NRAS 等,是最常见的癌基因之一,在多种肿瘤中发生突变,如肺癌、结直肠癌、胰腺癌等。RAS 蛋白是信号转导通路中的关键分子,RAS 基因突变导致 RAS 蛋白持续激活,下游信号通路持续活化,促进细胞增殖和存活。
▮▮▮▮ⓑ MYC 基因 (MYC gene):编码 MYC 转录因子,参与细胞生长、增殖、分化和凋亡的调控。MYC 基因扩增或过表达在多种肿瘤中常见,如 Burkitt 淋巴瘤、神经母细胞瘤、肺癌等。
▮▮▮▮ⓒ ERBB 基因家族 (ERBB gene family):包括 EGFR (ERBB1)、HER2 (ERBB2)、ERBB3、ERBB4 等,编码表皮生长因子受体 (EGFR) 家族成员。EGFR 和 HER2 的过表达或激活突变在多种肿瘤中常见,如肺癌、乳腺癌、胃癌等。HER2 基因扩增是乳腺癌的重要分子标志物和治疗靶点。
▮▮▮▮ⓓ PIK3CA 基因 (PIK3CA gene):编码磷脂酰肌醇-3-激酶催化亚基 p110α (PI3K p110α),是 PI3K/AKT/mTOR 信号通路中的关键分子。PIK3CA 基因突变在多种肿瘤中常见,如乳腺癌、卵巢癌、子宫内膜癌等。
▮▮▮▮ⓔ ABL1 基因 (ABL1 gene):编码酪氨酸激酶 ABL1。BCR-ABL1 融合基因是慢性粒细胞白血病 (CML) 的标志性癌基因。ABL1 基因突变也可见于其他类型的白血病和实体瘤。

13.1.2 抑癌基因 (Tumor Suppressor Genes)

抑癌基因 (tumor suppressor genes) 与癌基因 (oncogenes) 相反,它们的功能是抑制细胞生长和肿瘤形成。抑癌基因 (tumor suppressor genes) 编码的蛋白质参与细胞周期调控、DNA 修复、细胞凋亡、细胞分化等过程,维持细胞的正常生长和功能。抑癌基因 (tumor suppressor genes) 的失活突变 (inactivating mutations) 会导致其功能丧失,解除对细胞生长的抑制,从而促进肿瘤的发生。抑癌基因 (tumor suppressor genes) 的突变通常是隐性的,即需要两个等位基因都发生突变失活,才会导致明显的肿瘤抑制功能丧失。然而,在某些情况下,一个等位基因的失活突变也可能通过单倍体剂量不足 (haploinsufficiency) 或显性负性效应 (dominant negative effect) 影响抑癌功能。

抑癌基因的功能 (Functions of Tumor Suppressor Genes)

抑癌基因 (tumor suppressor genes) 通过多种机制抑制肿瘤的发生,主要功能包括:

▮▮▮▮ⓐ 细胞周期负调控 (negative regulation of cell cycle):抑癌基因 (tumor suppressor genes) 可以阻止细胞周期进程,防止细胞过度增殖。例如,RB 基因编码的 RB 蛋白可以抑制 E2F 转录因子的活性,阻碍细胞从 G1 期进入 S 期。
▮▮▮▮ⓑ DNA 修复 (DNA repair):抑癌基因 (tumor suppressor genes) 参与 DNA 损伤的修复,维持基因组的稳定性。例如,BRCA1 和 BRCA2 基因参与同源重组修复 (homologous recombination repair) 途径,TP53 基因参与多种 DNA 修复途径的调控。
▮▮▮▮ⓒ 细胞凋亡诱导 (induction of apoptosis):抑癌基因 (tumor suppressor genes) 可以启动细胞凋亡程序,清除异常或受损的细胞。例如,TP53 基因在 DNA 损伤或细胞应激时可以诱导细胞凋亡。
▮▮▮▮ⓓ 细胞分化促进 (promotion of cell differentiation):抑癌基因 (tumor suppressor genes) 可以促进细胞分化,使细胞停止增殖并执行特定的功能。例如,PTEN 基因可以抑制 PI3K/AKT 信号通路,促进细胞分化。
▮▮▮▮ⓔ 细胞黏附和细胞间通讯 (cell adhesion and intercellular communication):抑癌基因 (tumor suppressor genes) 可以维持细胞的正常黏附和细胞间通讯,防止细胞的异常增殖和扩散。例如,APC 基因参与细胞黏附和 Wnt 信号通路的调控。

抑癌基因的失活机制 (Inactivation Mechanisms of Tumor Suppressor Genes)

抑癌基因 (tumor suppressor genes) 的失活机制也多种多样,主要包括:

▮▮▮▮ⓐ 基因缺失 (gene deletion):抑癌基因 (tumor suppressor genes) 的整个基因或部分基因序列丢失,导致基因表达完全丧失。染色体区域的缺失 (loss of heterozygosity, LOH) 是抑癌基因 (tumor suppressor genes) 失活的常见机制。
▮▮▮▮ⓑ 点突变 (point mutations):基因序列中单个碱基的改变,可能导致编码的蛋白质功能丧失或异常。抑癌基因 (tumor suppressor genes) 的点突变通常是功能丧失型突变 (loss-of-function mutations),例如,移码突变 (frameshift mutations)、无义突变 (nonsense mutations)、错义突变 (missense mutations) 等。
▮▮▮▮ⓒ 表观遗传沉默 (epigenetic silencing):抑癌基因 (tumor suppressor genes) 的表达受到表观遗传修饰的抑制,例如,DNA 甲基化 (DNA methylation) 和组蛋白修饰 (histone modification)。启动子区域的 CpG 岛甲基化 (CpG island methylation) 是抑癌基因 (tumor suppressor genes) 表观遗传沉默的常见机制。
▮▮▮▮ⓓ 微小 RNA (miRNA) 调控 (microRNA (miRNA) regulation):某些 miRNA 可以靶向结合抑癌基因 (tumor suppressor genes) 的 mRNA,抑制其翻译或促进其降解,导致抑癌基因 (tumor suppressor genes) 表达水平降低。

常见的抑癌基因例子 (Examples of Common Tumor Suppressor Genes)

▮▮▮▮ⓐ TP53 基因 (TP53 gene):是最常见的抑癌基因 (tumor suppressor gene),在超过 50% 的人类肿瘤中发生突变。TP53 基因编码 p53 蛋白,被称为“基因组卫士” (guardian of the genome),在细胞应激、DNA 损伤、细胞周期阻滞、细胞凋亡和 DNA 修复等过程中发挥核心作用。TP53 基因突变导致 p53 蛋白功能丧失,细胞对 DNA 损伤的反应能力下降,异常细胞无法被清除,从而促进肿瘤的发生。
▮▮▮▮ⓑ RB1 基因 (RB1 gene):编码视网膜母细胞瘤蛋白 (retinoblastoma protein, pRB),是细胞周期调控的关键分子。RB1 基因突变与视网膜母细胞瘤 (retinoblastoma)、骨肉瘤 (osteosarcoma) 等多种肿瘤的发生相关。pRB 蛋白通过抑制 E2F 转录因子的活性,阻止细胞从 G1 期进入 S 期,从而抑制细胞增殖。
▮▮▮▮ⓒ PTEN 基因 (PTEN gene):编码磷酸酶和张力蛋白同源物 (phosphatase and tensin homolog deleted on chromosome ten, PTEN),是 PI3K/AKT/mTOR 信号通路的负调控因子。PTEN 基因突变在多种肿瘤中常见,如前列腺癌、乳腺癌、子宫内膜癌、胶质母细胞瘤等。PTEN 蛋白通过去磷酸化磷脂酰肌醇三磷酸 (phosphatidylinositol-3,4,5-trisphosphate, PIP3),抑制 PI3K/AKT 信号通路的活化,从而抑制细胞生长和存活。
▮▮▮▮ⓓ APC 基因 (APC gene):编码腺瘤性结肠息肉病蛋白 (adenomatous polyposis coli protein, APC),参与 Wnt 信号通路的负调控和细胞黏附。APC 基因突变是家族性腺瘤性息肉病 (familial adenomatous polyposis, FAP) 和散发性结直肠癌 (sporadic colorectal cancer) 发生的重要原因。APC 蛋白通过降解 β-catenin,抑制 Wnt 信号通路的活化,从而抑制细胞增殖。
▮▮▮▮ⓔ BRCA1 和 BRCA2 基因 (BRCA1 and BRCA2 genes):编码乳腺癌易感基因 1 和 2 蛋白 (breast cancer susceptibility gene 1 and 2 proteins, BRCA1 and BRCA2),参与同源重组修复 (homologous recombination repair) 途径。BRCA1 和 BRCA2 基因突变显著增加乳腺癌、卵巢癌、前列腺癌等多种肿瘤的风险。

13.2 肿瘤发生的多步骤模型 (Multi-step Model of Tumorigenesis)

肿瘤的发生和发展是一个复杂的多步骤过程,通常需要多个基因突变的积累。肿瘤发生的多步骤模型 (multi-step model of tumorigenesis) 强调癌症不是一蹴而就的,而是由一系列遗传和表观遗传改变逐步积累形成的。这个模型通常将肿瘤发生过程分为启动 (initiation)、促进 (promotion) 和 进展 (progression) 三个阶段。

13.2.1 肿瘤发生的启动、促进与进展 (Initiation, Promotion and Progression of Tumorigenesis)

启动阶段 (Initiation)

启动阶段是指正常细胞 受到启动因素 (initiating agents) 的作用,导致细胞 DNA 损伤,并产生不可逆的遗传改变,从而使细胞转化为启动细胞 (initiated cell)。启动因素通常是致癌物 (carcinogens),例如,化学致癌物 (如苯并芘、黄曲霉毒素)、物理致癌物 (如紫外线、X 射线) 和生物致癌物 (如某些病毒)。

▮▮▮▮ⓐ 启动因素的作用 (Effects of Initiating Agents):启动因素可以直接或间接地损伤细胞 DNA,导致基因突变、染色体畸变等遗传改变。这些遗传改变可以是癌基因 (oncogenes) 的激活突变,也可以是抑癌基因 (tumor suppressor genes) 的失活突变。
▮▮▮▮ⓑ 启动细胞的特点 (Characteristics of Initiated Cells):启动细胞与正常细胞相比,在遗传上发生了改变,但通常不表现出明显的恶性表型。启动细胞可能具有轻微的生长优势,但其增殖能力和存活能力仍然受到正常细胞调控机制的限制。启动细胞可以在体内长期潜伏,等待后续的促进因素的作用。
▮▮▮▮ⓒ 启动阶段的不可逆性 (Irreversibility of Initiation):启动阶段的遗传改变是不可逆的,一旦细胞被启动,即使去除启动因素,其遗传改变仍然存在。这意味着启动细胞具有发展成肿瘤的潜在风险。

促进阶段 (Promotion)

促进阶段是指启动细胞促进因素 (promoting agents) 的长期作用下,发生可逆的表观遗传改变,导致细胞选择性增殖,形成良性肿瘤 (benign tumor) 或癌前病变 (precancerous lesion)。促进因素本身通常不直接导致 DNA 损伤,但可以增强启动细胞的增殖能力,抑制细胞凋亡,改变细胞分化状态,从而促进肿瘤的发生。常见的促进因素包括,激素 (hormones)、生长因子 (growth factors)、炎症 (inflammation) 和某些化学物质 (如佛波酯)。

▮▮▮▮ⓐ 促进因素的作用 (Effects of Promoting Agents):促进因素主要通过表观遗传机制 影响细胞行为,例如,改变 DNA 甲基化模式、组蛋白修饰模式、miRNA 表达谱等。这些表观遗传改变可以增强启动细胞的增殖优势,使其在竞争中胜出,形成细胞克隆。
▮▮▮▮ⓑ 促进细胞的选择性增殖 (Selective Proliferation of Promoted Cells):促进因素可以刺激启动细胞的增殖,同时抑制正常细胞的增殖,导致启动细胞克隆性扩增。长期促进作用可以使启动细胞积累更多的遗传和表观遗传改变,逐渐向恶性转化方向发展。
▮▮▮▮ⓒ 促进阶段的可逆性 (Reversibility of Promotion):促进阶段的表观遗传改变在一定程度上是可逆的。如果在促进阶段早期去除促进因素,癌前病变可能消退,肿瘤发生风险降低。然而,长期持续的促进作用会导致表观遗传改变逐渐稳定化,并可能诱发新的遗传突变,最终导致不可逆的恶性转化。

进展阶段 (Progression)

进展阶段是指良性肿瘤癌前病变遗传不稳定性和选择压力的共同作用下,进一步积累新的遗传突变和表观遗传改变,导致肿瘤细胞恶性转化,获得侵袭和转移能力,最终发展成恶性肿瘤 (malignant tumor)。进展阶段是肿瘤发生过程中最关键和最复杂的阶段,也是决定肿瘤生物学行为和临床预后的重要因素。

▮▮▮▮ⓐ 遗传不稳定性的作用 (Role of Genetic Instability):肿瘤细胞在进展阶段表现出高度的遗传不稳定性,包括染色体不稳定 (chromosomal instability, CIN) 和微卫星不稳定 (microsatellite instability, MSI)。遗传不稳定性导致肿瘤细胞基因组突变率显著升高,加速了新的遗传突变的积累。
▮▮▮▮ⓑ 选择压力的作用 (Role of Selection Pressure):肿瘤微环境 (tumor microenvironment) 对肿瘤细胞施加选择压力,例如,营养和氧气供应不足、免疫监视、治疗药物等。在选择压力下,只有那些获得适应性突变 的肿瘤细胞才能存活和增殖,例如,获得血管生成能力、免疫逃逸能力、耐药性等。
▮▮▮▮ⓒ 恶性转化的发生 (Occurrence of Malignant Transformation):在遗传不稳定性和选择压力的共同作用下,肿瘤细胞逐步积累了驱动肿瘤恶性表型的关键突变,例如,激活癌基因 (oncogenes)、失活抑癌基因 (tumor suppressor genes)、获得转移相关基因突变等。这些突变使肿瘤细胞获得了无限增殖、侵袭转移、血管生成、免疫逃逸 等恶性生物学特征,最终发展成恶性肿瘤。
▮▮▮▮ⓓ 肿瘤异质性 (Tumor Heterogeneity):肿瘤进展过程中,肿瘤细胞不断增殖和进化,导致肿瘤内部出现高度的细胞异质性。肿瘤异质性表现在遗传学、表观遗传学、形态学、代谢和免疫学等多个方面。肿瘤异质性是肿瘤治疗失败和复发的重要原因。

总结:肿瘤发生的多步骤模型 (multi-step model of tumorigenesis) 揭示了癌症发生是一个渐进的、多因素参与的复杂过程。从正常细胞到恶性肿瘤,需要经历启动、促进和进展三个阶段,每个阶段都涉及遗传和表观遗传改变的积累。理解肿瘤发生的多步骤模型 (multi-step model of tumorigenesis) 对于癌症预防、早期诊断和治疗具有重要意义。

13.3 癌症的遗传易感性 (Genetic Susceptibility to Cancer)

癌症的发生既有环境因素的影响,也有遗传因素的作用。遗传易感性 (genetic susceptibility) 指的是个体由于遗传背景 的差异,在暴露于相同致癌因素时,发生癌症的风险不同。某些个体由于携带特定的遗传变异,更容易患上某些类型的癌症,这种现象称为癌症的遗传易感性 (genetic susceptibility to cancer)。癌症的遗传易感性主要体现在遗传性癌症综合征 (hereditary cancer syndromes) 和癌症易感基因 (cancer susceptibility genes) 两个方面。

13.3.1 遗传性癌症综合征与癌症易感基因 (Hereditary Cancer Syndromes and Cancer Susceptibility Genes)

遗传性癌症综合征 (Hereditary Cancer Syndromes)

遗传性癌症综合征 (hereditary cancer syndromes) 是一类由于 germline mutation (生殖细胞系突变) 遗传而导致的癌症高风险疾病。germline mutation (生殖细胞系突变) 存在于个体的所有细胞中,可以遗传给后代。遗传性癌症综合征通常具有以下特点:

▮▮▮▮ⓐ 家族聚集性 (family clustering):家族中多人患有相同或相关类型的癌症,呈现明显的家族聚集现象。
▮▮▮▮ⓑ 发病年龄早 (early age of onset):患者发病年龄较散发性癌症 (sporadic cancer) 患者年轻。
▮▮▮▮ⓒ 多原发肿瘤 (multiple primary tumors):患者可能同时或先后发生多个原发肿瘤,例如,双侧乳腺癌、结直肠癌合并子宫内膜癌等。
▮▮▮▮ⓓ 特定肿瘤类型 (specific tumor types):某些遗传性癌症综合征与特定类型的肿瘤高度相关,例如,家族性腺瘤性息肉病 (FAP) 与结直肠癌,Li-Fraumeni 综合征与多种儿童和成人肿瘤。
▮▮▮▮ⓔ 常染色体显性遗传 (autosomal dominant inheritance):大多数遗传性癌症综合征呈常染色体显性遗传模式,即携带一个突变等位基因即可发病。

癌症易感基因 (Cancer Susceptibility Genes)

癌症易感基因 (cancer susceptibility genes) 是指 germline mutation (生殖细胞系突变) 后会显著增加癌症风险的基因。大多数癌症易感基因是抑癌基因 (tumor suppressor genes),少数是DNA 修复基因 (DNA repair genes) 和癌基因 (oncogenes)。目前已发现数百个癌症易感基因,与多种遗传性癌症综合征相关。

常见的遗传性癌症综合征与癌症易感基因例子 (Examples of Common Hereditary Cancer Syndromes and Cancer Susceptibility Genes)

▮▮▮▮ⓐ 遗传性乳腺癌和卵巢癌综合征 (Hereditary Breast and Ovarian Cancer Syndrome, HBOC):是最常见的遗传性癌症综合征之一,主要与 BRCA1BRCA2 基因的 germline mutation (生殖细胞系突变) 相关。BRCA1/2 基因突变显著增加乳腺癌、卵巢癌、前列腺癌、胰腺癌等多种肿瘤的风险。
▮▮▮▮ⓑ 家族性腺瘤性息肉病 (Familial Adenomatous Polyposis, FAP):是一种常染色体显性遗传病,主要由 APC 基因的 germline mutation (生殖细胞系突变) 引起。FAP 患者在结直肠中形成数百至数千个腺瘤性息肉,几乎 100% 会发展为结直肠癌。
▮▮▮▮ⓒ Li-Fraumeni 综合征 (Li-Fraumeni Syndrome, LFS):是一种罕见的常染色体显性遗传病,主要由 TP53 基因的 germline mutation (生殖细胞系突变) 引起。LFS 患者具有极高的癌症风险,易患多种类型的肿瘤,包括肉瘤、乳腺癌、脑肿瘤、白血病、肾上腺皮质癌等。
▮▮▮▮ⓓ 林奇综合征 (Lynch Syndrome):又称遗传性非息肉病性结直肠癌 (Hereditary Nonpolyposis Colorectal Cancer, HNPCC),是一种常见的常染色体显性遗传病,主要与 MLH1、MSH2、MSH6、PMS2 等 DNA 错配修复基因 (mismatch repair genes, MMR genes) 的 germline mutation (生殖细胞系突变) 相关。林奇综合征患者结直肠癌、子宫内膜癌、卵巢癌、胃癌等多种肿瘤的风险显著增加。
▮▮▮▮ⓔ 多发性内分泌肿瘤综合征 (Multiple Endocrine Neoplasia, MEN):包括 MEN1、MEN2A、MEN2B 等亚型,分别与 MEN1、RET 等基因的 germline mutation (生殖细胞系突变) 相关。MEN 患者易患多种内分泌肿瘤,如甲状旁腺肿瘤、垂体肿瘤、胰腺神经内分泌肿瘤、甲状腺髓样癌、嗜铬细胞瘤等。

13.3.2 癌症的遗传咨询与预防 (Genetic Counseling and Prevention of Cancer)

癌症的遗传咨询 (Genetic Counseling for Cancer)

癌症的遗传咨询 (genetic counseling for cancer) 是一种为具有癌症家族史或怀疑患有遗传性癌症综合征的个体及其家庭成员提供的专业服务。遗传咨询旨在帮助个体了解癌症的遗传风险、遗传检测的选择、预防和筛查策略,以及心理支持。癌症遗传咨询的主要内容包括:

▮▮▮▮ⓐ 家族史评估 (family history assessment):详细询问患者及其家族成员的癌症病史,绘制家系图 (pedigree),评估家族性癌症的遗传风险。
▮▮▮▮ⓑ 遗传风险评估 (genetic risk assessment):根据家族史、肿瘤类型、发病年龄等信息,评估个体患遗传性癌症综合征的风险,以及携带癌症易感基因突变的概率。
▮▮▮▮ⓒ 遗传检测咨询 (genetic testing counseling):介绍可用的遗传检测项目,包括基因 panel 检测、全外显子组测序、全基因组测序等,解释检测的意义、局限性和潜在风险,帮助患者做出知情选择。
▮▮▮▮ⓓ 检测结果解读 (test result interpretation):解读遗传检测结果,解释阳性、阴性和不确定结果的意义,以及对个体和家庭成员的潜在影响。
▮▮▮▮ⓔ 预防和筛查建议 (prevention and screening recommendations):根据遗传风险和检测结果,制定个体化的癌症预防和筛查策略,例如,风险降低手术 (risk-reducing surgery)、药物预防 (chemoprevention)、早期筛查 (early screening) 等。
▮▮▮▮ⓕ 心理支持和情感疏导 (psychological support and emotional counseling):为患者及其家庭成员提供心理支持和情感疏导,帮助他们应对遗传风险带来的焦虑、恐惧和不确定性。

癌症的遗传预防 (Genetic Prevention of Cancer)

对于携带癌症易感基因突变的高风险个体,可以采取多种遗传预防策略,降低癌症的发生风险:

▮▮▮▮ⓐ 风险降低手术 (risk-reducing surgery):对于某些遗传性癌症综合征,可以考虑进行风险降低手术,例如,预防性乳房切除术 (prophylactic mastectomy) 和预防性卵巢切除术 (prophylactic oophorectomy) 可以显著降低 BRCA1/2 基因突变携带者乳腺癌和卵巢癌的风险。预防性结直肠切除术 (prophylactic colectomy) 可以预防 FAP 患者发生结直肠癌。
▮▮▮▮ⓑ 药物预防 (chemoprevention):某些药物可以降低癌症的发生风险。例如,他莫昔芬 (tamoxifen) 和雷洛昔芬 (raloxifene) 可以降低 BRCA2 基因突变携带者乳腺癌的风险。阿司匹林 (aspirin) 和非甾体抗炎药 (nonsteroidal anti-inflammatory drugs, NSAIDs) 可能降低林奇综合征患者结直肠癌的风险。
▮▮▮▮ⓒ 早期筛查 (early screening):对于高风险个体,应加强癌症早期筛查,争取早期发现、早期诊断、早期治疗。例如,BRCA1/2 基因突变携带者应定期进行乳腺钼靶检查、乳腺 MRI、卵巢癌筛查等。林奇综合征患者应定期进行结肠镜检查、子宫内膜癌筛查等。
▮▮▮▮ⓓ 生活方式干预 (lifestyle interventions):健康的生活方式,如戒烟限酒、均衡饮食、适度运动、控制体重等,可以降低多种癌症的风险,对于遗传易感个体同样重要。

总结:癌症的遗传易感性是癌症发生的重要因素之一。遗传性癌症综合征和癌症易感基因的发现,为癌症的遗传咨询、风险评估、预防和早期诊断提供了重要依据。通过遗传咨询和遗传预防策略,可以帮助高风险个体降低癌症的发生风险,改善预后。随着基因检测技术的进步和精准医学的发展,癌症的遗传学研究将在癌症防治领域发挥越来越重要的作用。

14. 表观遗传学 (Epigenetics)

14.1 表观遗传学的基本概念与机制 (Basic Concepts and Mechanisms of Epigenetics)

14.1.1 表观遗传修饰的类型:DNA甲基化、组蛋白修饰、非编码RNA (Types of Epigenetic Modifications: DNA Methylation, Histone Modification, Non-coding RNA)

表观遗传学 (Epigenetics) 研究的是在DNA序列不发生改变的情况下,基因表达和细胞表型发生可遗传的改变的现象。这些改变是由一系列表观遗传修饰 (epigenetic modifications) 介导的,它们能够影响染色质结构和基因的可及性,从而调控基因的表达。主要的表观遗传修饰类型包括 DNA甲基化 (DNA methylation)组蛋白修饰 (histone modification)非编码RNA (non-coding RNA) 调控。

DNA甲基化 (DNA Methylation)

DNA甲基化是指在DNA分子上特定的胞嘧啶 (cytosine, C) 碱基被添加一个甲基 (–CH\(_{3}\)) 基团的化学修饰过程。在哺乳动物细胞中,DNA甲基化主要发生在CpG二核苷酸序列中的胞嘧啶上,即胞嘧啶 (C) 紧邻鸟嘌呤 (guanine, G) 的序列。这种修饰通常由一类叫做 DNA甲基转移酶 (DNA methyltransferases, DNMTs) 的酶家族催化完成。哺乳动物主要有三种DNMTs:DNMT1、DNMT3A 和 DNMT3B。

DNMT1 (DNA Methyltransferase 1):主要负责维持甲基化模式 (maintenance methylation)。在DNA复制过程中,DNMT1能够识别半甲基化的CpG位点(即一条链甲基化,另一条链未甲基化),并将甲基化标记复制到新合成的子链上,从而将已有的甲基化模式传递到子代细胞。
DNMT3A 和 DNMT3B (DNA Methyltransferase 3A and 3B):主要负责建立从头甲基化模式 (de novo methylation)。它们可以在DNA的新的CpG位点上建立甲基化标记,在发育过程中建立新的甲基化模式起重要作用。

DNA甲基化通常与基因沉默 (gene silencing) 相关联。基因启动子区域的CpG岛 (CpG islands) 的高甲基化水平通常会抑制基因的转录,导致基因表达降低或沉默。机制可能包括:

直接阻碍转录因子结合 (blocking transcription factor binding):甲基化修饰可以直接干扰某些转录因子与DNA的结合,从而抑制转录起始。
招募甲基-CpG结合域蛋白 (methyl-CpG-binding domain proteins, MBDs):甲基化的CpG位点可以被MBDs家族蛋白识别和结合。MBDs蛋白进一步招募染色质重塑复合物和组蛋白去乙酰化酶 (histone deacetylases, HDACs),导致染色质结构变得更加紧密,抑制基因转录。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[DNA甲基化] --> B(DNMTs酶);
3 B --> C{CpG位点};
4 C --> D{基因启动子区域};
5 D --> E[高甲基化];
6 E --> F[基因沉默];
7 E --> G[招募MBDs蛋白];
8 G --> H[染色质紧密化];
9 H --> F;

组蛋白修饰 (Histone Modification)

真核生物的DNA不是裸露存在的,而是与组蛋白 (histones) 结合形成 核小体 (nucleosome),核小体进一步组装成更高级的染色质结构。组蛋白是染色质的基本结构单元,主要包括H2A、H2B、H3和H4四种核心组蛋白。组蛋白的N端尾巴 (histone tails) 可以发生多种类型的共价修饰,包括 乙酰化 (acetylation)甲基化 (methylation)磷酸化 (phosphorylation)泛素化 (ubiquitylation) 等。这些修饰能够改变组蛋白的电荷和结构,影响染色质的紧密度,从而调控基因的表达。

组蛋白乙酰化 (Histone Acetylation):通常与基因激活 (gene activation) 相关。组蛋白乙酰转移酶 (histone acetyltransferases, HATs) 催化组蛋白赖氨酸残基的乙酰化,中和赖氨酸残基的正电荷,减弱组蛋白与带负电荷的DNA之间的相互作用,使染色质结构变得松散,有利于转录因子和RNA聚合酶的结合,促进基因转录。相反,组蛋白去乙酰化酶 (histone deacetylases, HDACs) 移除乙酰基,使染色质结构变得紧密,抑制基因转录。
组蛋白甲基化 (Histone Methylation):与基因表达的调控关系较为复杂,取决于被甲基化的氨基酸残基和甲基化的程度。例如,H3K4me3(组蛋白H3第4位赖氨酸三甲基化)通常与基因激活相关,而H3K9me3(组蛋白H3第9位赖氨酸三甲基化)和H3K27me3(组蛋白H3第27位赖氨酸三甲基化)则通常与基因沉默相关。组蛋白甲基转移酶 (histone methyltransferases, HMTs) 催化组蛋白的甲基化,而 组蛋白去甲基化酶 (histone demethylases, HDMs) 移除甲基基团。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[组蛋白修饰] --> B{组蛋白尾巴};
3 B --> C[乙酰化];
4 B --> D[甲基化];
5 B --> E[磷酸化];
6 B --> F[泛素化];
7 C --> G[HATs酶];
8 G --> H{赖氨酸残基};
9 H --> I[中和正电荷];
10 I --> J[染色质松散];
11 J --> K[基因激活];
12 C --> L[HDACs酶];
13 L --> M[移除乙酰基];
14 M --> N[染色质紧密];
15 N --> O[基因沉默];

非编码RNA (Non-coding RNA)

非编码RNA (non-coding RNA, ncRNA) 是指不编码蛋白质的RNA分子。早期研究认为RNA的主要功能是作为蛋白质合成的中间分子,但随着研究的深入,人们发现细胞中存在大量的ncRNA,它们在基因表达调控、染色质结构维持等多种生物学过程中发挥着重要作用。在表观遗传调控中,一些重要的ncRNA包括 微小RNA (microRNA, miRNA)小干扰RNA (small interfering RNA, siRNA)长非编码RNA (long non-coding RNA, lncRNA) 等。

微小RNA (microRNA, miRNA):miRNA是一类长度约为21-25个核苷酸的小分子RNA,通过与靶mRNA的3'非翻译区 (3'UTR) 结合,介导mRNA的降解或抑制翻译,从而负调控基因表达。miRNA的生成过程复杂,通常由RNA聚合酶II转录产生较长的初级miRNA (pri-miRNA),pri-miRNA经过Drosha酶和Dicer酶等一系列酶的加工,最终成熟为miRNA。
小干扰RNA (small interfering RNA, siRNA):siRNA与miRNA类似,也是一类小分子双链RNA,但siRNA通常是外源性的,例如通过实验导入细胞。siRNA可以与 RNA诱导沉默复合体 (RNA-induced silencing complex, RISC) 结合,引导RISC靶向同源mRNA,导致mRNA的降解,实现基因沉默,这个过程称为 RNA干扰 (RNA interference, RNAi)
长非编码RNA (long non-coding RNA, lncRNA):lncRNA是一类长度超过200个核苷酸的ncRNA。lncRNA种类繁多,功能复杂多样,在表观遗传调控中发挥着重要作用。lncRNA可以通过多种机制调控基因表达,例如:
▮▮▮▮⚝ 作为支架 (scaffold):lncRNA可以同时结合DNA、RNA和蛋白质,作为支架将不同的调控分子组装在一起,形成复合体,调控基因表达。
▮▮▮▮⚝ 作为诱饵 (decoy):lncRNA可以结合转录因子或RNA结合蛋白,阻止它们与靶基因结合,从而调控基因表达。
▮▮▮▮⚝ 作为向导 (guide):lncRNA可以引导染色质修饰复合物靶向特定的基因位点,调控染色质修饰和基因表达。
▮▮▮▮⚝ 顺式作用 (cis-acting)反式作用 (trans-acting):一些lncRNA在转录位点附近发挥顺式作用,调控邻近基因的表达;另一些lncRNA则可以反式作用,调控远处基因的表达。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[非编码RNA (ncRNA)] --> B[微小RNA (miRNA)];
3 A --> C[小干扰RNA (siRNA)];
4 A --> D[长非编码RNA (lncRNA)];
5 B --> E{靶mRNA 3'UTR};
6 E --> F[mRNA降解/抑制翻译];
7 C --> G[RISC];
8 G --> H{同源mRNA};
9 H --> I[mRNA降解 (RNAi)];
10 D --> J[支架 (scaffold)];
11 D --> K[诱饵 (decoy)];
12 D --> L[向导 (guide)];
13 D --> M[顺式/反式作用];

14.1.2 表观遗传修饰的建立、维持与调控 (Establishment, Maintenance and Regulation of Epigenetic Modifications)

表观遗传修饰不是静态的,而是一个动态的过程,涉及到修饰的建立 (establishment)维持 (maintenance)调控 (regulation)。这些过程受到多种因素的影响,包括发育信号、环境因素等。

表观遗传修饰的建立 (Establishment of Epigenetic Modifications)

表观遗传修饰的建立是指在特定的基因位点或染色质区域,从头 (de novo) 建立起特定的表观遗传标记。例如,在细胞分化过程中,一些基因需要被沉默,这时就需要建立抑制性的表观遗传修饰,如DNA甲基化或组蛋白抑制性修饰。

DNA甲基化的建立:主要由 DNMT3ADNMT3B 介导。这些酶能够识别DNA序列中的CpG位点,并在这些位点上添加甲基基团,建立新的甲基化模式。信号通路和转录因子可以调控DNMT3A/3B的活性和靶向性,从而控制DNA甲基化建立的位点和程度。
组蛋白修饰的建立:由各种 组蛋白修饰酶 (histone modifying enzymes) 介导,包括HATs、HMTs、组蛋白磷酸化酶等。这些酶的活性和靶向性受到多种因素的调控,例如,转录因子可以招募特定的组蛋白修饰酶到靶基因位点,建立相应的组蛋白修饰模式。此外,一些ncRNA,如lncRNA,也可以作为向导,引导组蛋白修饰复合物靶向特定的染色质区域,建立表观遗传修饰。

表观遗传修饰的维持 (Maintenance of Epigenetic Modifications)

表观遗传修饰的维持是指在细胞分裂过程中,将已有的表观遗传标记准确地传递到子代细胞,保证细胞的表观遗传状态的稳定遗传。

DNA甲基化的维持:主要由 DNMT1 介导。DNMT1具有“半甲基化DNA”识别能力,在DNA复制过程中,DNMT1能够识别复制叉后新合成的DNA链上的半甲基化CpG位点,并将甲基化标记复制到新链上,从而维持已有的甲基化模式。
组蛋白修饰的维持:组蛋白修饰的维持机制相对复杂,可能涉及到多种机制,包括:
▮▮▮▮⚝ 组蛋白修饰酶的持续活性 (continuous activity of histone modifying enzymes):一些组蛋白修饰酶可能在细胞分裂过程中持续保持活性,不断地将修饰标记添加到新合成的组蛋白上。
▮▮▮▮⚝ “记忆”蛋白的传递 (transmission of "memory" proteins):一些与特定组蛋白修饰相关的蛋白,如染色质结合蛋白,可能在细胞分裂过程中被传递到子代细胞,并在子代细胞中继续引导组蛋白修饰的重建。
▮▮▮▮⚝ RNA介导的维持 (RNA-mediated maintenance):一些研究表明,ncRNA可能参与组蛋白修饰的维持,例如,一些lncRNA可以与染色质修饰复合物结合,并在细胞分裂过程中将这些复合物靶向到特定的染色质区域,维持组蛋白修饰模式。

表观遗传修饰的调控 (Regulation of Epigenetic Modifications)

表观遗传修饰的调控是指细胞能够根据内外环境信号,动态地改变表观遗传标记的状态,从而调控基因表达和细胞功能。这种调控可以是 可逆的 (reversible)

DNA甲基化的调控:DNA甲基化水平受到多种因素的调控,包括:
▮▮▮▮⚝ DNA去甲基化酶 (DNA demethylases)TET (ten-eleven translocation) 酶家族 是一类重要的DNA去甲基化酶,能够催化5-甲基胞嘧啶 (5mC) 氧化为5-羟甲基胞嘧啶 (5hmC),5hmC可以进一步被TET酶氧化为5-甲酰胞嘧啶 (5fC) 和5-羧基胞嘧啶 (5caC),这些氧化产物最终可以通过 胸腺嘧啶DNA糖基化酶 (thymine DNA glycosylase, TDG) 途径被移除,实现DNA去甲基化。
▮▮▮▮⚝ 环境因素:环境因素,如饮食、药物、毒素等,可以影响DNMTs和TET酶的活性,从而调控DNA甲基化水平。例如,一些膳食成分,如叶酸、维生素B12等,可以影响DNA甲基化。
组蛋白修饰的调控:组蛋白修饰的动态调控主要通过 组蛋白修饰酶 的活性调控来实现。细胞可以通过信号通路调控HATs、HDACs、HMTs、HDMs等酶的活性,从而改变组蛋白修饰模式。例如,细胞受到刺激后,可以激活信号通路,导致HATs活性增强,组蛋白乙酰化水平升高,促进基因转录。
非编码RNA的调控:ncRNA的表达和功能也受到多种因素的调控。例如,miRNA的转录和加工过程受到发育信号和环境因素的调控;lncRNA的表达受到转录因子和染色质状态的调控;一些lncRNA的稳定性可以被RNA结合蛋白调控。

表观遗传修饰的建立、维持和调控是一个复杂而精细的过程,它们共同构成了一个动态的表观遗传调控系统,在基因表达调控、细胞命运决定、发育和疾病发生等多种生物学过程中发挥着至关重要的作用。

14.2 表观遗传学在生物学过程中的作用 (Role of Epigenetics in Biological Processes)

14.2.1 表观遗传学与基因表达调控 (Epigenetics and Gene Expression Regulation)

表观遗传学最核心的功能之一就是 调控基因表达 (gene expression regulation)。表观遗传修饰,如DNA甲基化、组蛋白修饰和非编码RNA,可以直接或间接地影响基因的转录、RNA加工、翻译和RNA稳定性等各个环节,从而精细地调控基因的表达水平。

DNA甲基化与基因表达调控

如前所述,DNA甲基化,特别是基因启动子区域CpG岛的甲基化,通常与 基因沉默 (gene silencing) 相关联。

启动子甲基化与转录抑制 (promoter methylation and transcriptional repression):基因启动子区域的CpG岛富集区,是转录因子结合和转录起始的重要区域。当这些区域发生高甲基化时,可以:
▮▮▮▮⚝ 直接阻碍转录因子结合:甲基化修饰可以改变DNA的结构,干扰某些转录因子与DNA的特异性结合,阻止转录起始复合物的形成。
▮▮▮▮⚝ 招募MBDs蛋白:甲基化的CpG位点可以被MBDs蛋白识别和结合。MBDs蛋白进一步招募染色质重塑复合物和HDACs,导致染色质结构变得更加紧密,转录可及性降低,抑制基因转录。
基因体甲基化与转录调控 (gene body methylation and transcriptional regulation):基因体 (gene body) 是指基因的转录区域,包括外显子和内含子。基因体甲基化与基因表达的调控关系较为复杂,研究表明,基因体甲基化通常与 基因的稳定表达转录延伸效率 相关。一些研究发现,基因体甲基化可能参与抑制基因内部的隐蔽转录起始位点,防止产生异常的转录本。

组蛋白修饰与基因表达调控

不同的组蛋白修饰类型与基因表达的调控关系不同,它们可以 激活抑制 基因转录。

激活性组蛋白修饰 (activating histone modifications)
▮▮▮▮⚝ 组蛋白乙酰化 (histone acetylation):如H3K9ac、H3K27ac等,通常与基因激活相关。乙酰化修饰中和组蛋白的正电荷,减弱组蛋白与DNA的相互作用,使染色质结构松散,有利于转录因子和RNA聚合酶的结合,促进转录起始。
▮▮▮▮⚝ H3K4甲基化 (H3K4 methylation):如H3K4me3,通常富集在基因启动子区域,与基因激活相关。H3K4me3可以作为“停泊位点 (docking site)” 招募染色质重塑复合物,促进染色质开放和转录起始。
抑制性组蛋白修饰 (repressive histone modifications)
▮▮▮▮⚝ H3K9甲基化 (H3K9 methylation):如H3K9me3,通常与异染色质 (heterochromatin) 形成和基因沉默相关。H3K9me3可以招募 异染色质蛋白1 (Heterochromatin Protein 1, HP1),HP1蛋白进一步促进染色质的紧密化,抑制基因转录。
▮▮▮▮⚝ H3K27甲基化 (H3K27 methylation):如H3K27me3,由 Polycomb抑制复合体2 (Polycomb Repressive Complex 2, PRC2) 催化,与基因沉默和发育调控密切相关。PRC2复合物可以招募其他染色质修饰复合物,形成大范围的染色质抑制区域,抑制基因表达。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[组蛋白修饰] --> B{激活性修饰};
3 A --> C{抑制性修饰};
4 B --> D[乙酰化 (H3K9ac, H3K27ac)];
5 B --> E[H3K4甲基化 (H3K4me3)];
6 D --> F[染色质松散];
7 F --> G[转录激活];
8 E --> H[招募染色质重塑复合物];
9 H --> F;
10 C --> I[H3K9甲基化 (H3K9me3)];
11 C --> J[H3K27甲基化 (H3K27me3)];
12 I --> K[招募HP1蛋白];
13 K --> L[染色质紧密];
14 L --> M[转录抑制];
15 J --> N[PRC2复合物];
16 N --> L;

非编码RNA与基因表达调控

ncRNA可以通过多种机制调控基因表达,包括转录水平和转录后水平的调控。

miRNA与转录后基因沉默 (miRNA and post-transcriptional gene silencing):miRNA主要通过 转录后基因沉默 (post-transcriptional gene silencing, PTGS) 机制调控基因表达。miRNA与RISC结合后,可以识别并结合靶mRNA的3'UTR,根据互补程度,可以导致mRNA的降解或抑制翻译,从而降低靶基因的蛋白质表达水平。miRNA调控网络复杂,一个miRNA可以靶向多个mRNA,而一个mRNA也可以被多个miRNA靶向。
lncRNA与转录调控 (lncRNA and transcriptional regulation):lncRNA在转录调控中发挥着多样化的作用。
▮▮▮▮⚝ 顺式作用lncRNA (cis-acting lncRNA):一些lncRNA在转录位点附近发挥顺式作用,调控邻近基因的表达。例如,一些lncRNA可以招募染色质修饰复合物到邻近基因的启动子区域,调控染色质修饰和基因转录。
▮▮▮▮⚝ 反式作用lncRNA (trans-acting lncRNA):另一些lncRNA可以反式作用,调控远处基因的表达。例如,一些lncRNA可以作为支架,将转录因子和染色质修饰复合物组装在一起,靶向到远处的基因位点,调控基因表达。还有一些lncRNA可以作为诱饵,结合转录因子或RNA结合蛋白,阻止它们与靶基因结合,从而调控基因表达。

表观遗传修饰的协同作用 (synergistic effects of epigenetic modifications):在基因表达调控中,不同的表观遗传修饰类型往往不是孤立地发挥作用,而是相互协同,共同精细地调控基因的表达。例如,DNA甲基化和组蛋白修饰可以相互影响,共同调控染色质结构和基因转录;ncRNA可以引导染色质修饰复合物靶向特定的基因位点,建立或维持特定的表观遗传修饰模式。这种表观遗传修饰的协同作用使得基因表达调控更加精细和复杂。

14.2.2 表观遗传学与细胞分化和发育 (Epigenetics and Cell Differentiation and Development)

表观遗传学在 细胞分化 (cell differentiation)发育 (development) 过程中发挥着至关重要的作用。在多细胞生物的发育过程中,一个受精卵通过细胞分裂和分化,最终形成各种具有不同功能的细胞类型。细胞分化是一个基因表达程序重塑的过程,不同的细胞类型具有不同的基因表达谱。表观遗传修饰在细胞命运决定和维持细胞特性方面起着关键作用。

细胞命运决定 (cell fate determination)

在发育过程中,细胞需要经历一系列的细胞命运决定事件,从全能性 (totipotency) 到多能性 (pluripotency) 再到单能性 (unipotency)。表观遗传修饰在这些细胞命运决定过程中发挥着重要作用。

全能性与DNA去甲基化 (totipotency and DNA demethylation):受精卵是全能性的,可以发育成完整的个体。研究表明,受精卵的基因组经历大规模的 DNA去甲基化 (DNA demethylation) 过程,这可能与建立全能性状态有关。去甲基化使得基因组更加“开放”,为后续的发育过程做好准备。
多能性干细胞与表观遗传状态 (pluripotent stem cells and epigenetic state)胚胎干细胞 (embryonic stem cells, ESCs) 是多能性干细胞,具有自我更新和分化为各种细胞类型的能力。ESCs的表观遗传状态具有独特的特征,例如,基因启动子区域的CpG岛通常处于低甲基化状态,许多发育调控基因的启动子区域富集激活性组蛋白修饰(如H3K4me3)和抑制性组蛋白修饰(如H3K27me3),呈现 “双价 (bivalent)” 状态。这种双价状态被认为使得发育调控基因处于“准备就绪 (poised)” 状态,既可以快速激活,也可以被沉默,为ESCs的多向分化潜能提供表观遗传基础。
细胞分化与表观遗传重塑 (cell differentiation and epigenetic remodeling):细胞分化是一个表观遗传重塑的过程。当多能性干细胞分化为特定的细胞类型时,需要激活一些细胞类型特异性基因,同时沉默另一些基因。这个过程伴随着大规模的表观遗传修饰的改变。例如,在分化过程中,一些发育调控基因的启动子区域的H3K27me3修饰被移除,H3K4me3修饰增加,DNA甲基化水平降低,基因被激活;而另一些基因的启动子区域则发生DNA甲基化增加,组蛋白抑制性修饰增加,基因被沉默。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[受精卵] --> B[DNA去甲基化];
3 B --> C[全能性];
4 C --> D[胚胎干细胞 (ESCs)];
5 D --> E[双价状态 (H3K4me3/H3K27me3)];
6 E --> F[多能性];
7 F --> G[细胞分化];
8 G --> H[表观遗传重塑];
9 H --> I[细胞类型特异性基因表达];

组织特异性基因表达 (tissue-specific gene expression)

不同组织类型的细胞具有不同的功能,这主要是由于它们表达不同的基因集合,即 组织特异性基因表达 (tissue-specific gene expression)。表观遗传修饰在建立和维持组织特异性基因表达模式中发挥着重要作用。

组织特异性DNA甲基化模式 (tissue-specific DNA methylation patterns):不同组织类型的细胞具有不同的DNA甲基化模式。研究表明,组织特异性基因的启动子区域的DNA甲基化水平在不同组织中存在差异。在不表达这些基因的组织中,启动子区域通常处于高甲基化状态,抑制基因表达;而在表达这些基因的组织中,启动子区域则处于低甲基化状态,允许基因表达。
组织特异性组蛋白修饰模式 (tissue-specific histone modification patterns):不同组织类型的细胞也具有不同的组蛋白修饰模式。例如,组织特异性激活基因的启动子区域通常富集激活性组蛋白修饰(如H3K4me3、H3K27ac),而组织特异性沉默基因的染色质区域则富集抑制性组蛋白修饰(如H3K9me3、H3K27me3)。
组织特异性lncRNA表达 (tissue-specific lncRNA expression):许多lncRNA的表达具有组织特异性,它们在不同组织中发挥不同的调控功能,参与建立和维持组织特异性基因表达模式。

表观遗传修饰不仅在细胞分化和发育过程中发挥作用,而且在个体发育成熟后,仍然参与维持细胞的特性和功能。例如,细胞记忆 (cellular memory),即细胞能够记住其祖先细胞的特性,并将这些特性传递给子代细胞,就与表观遗传修饰的稳定遗传密切相关。

14.2.3 表观遗传学与疾病 (Epigenetics and Diseases)

表观遗传调控异常与多种疾病的发生发展密切相关,包括 癌症 (cancer)神经退行性疾病 (neurodegenerative diseases)代谢性疾病 (metabolic diseases)自身免疫性疾病 (autoimmune diseases)精神疾病 (psychiatric disorders) 等。表观遗传改变可以影响基因表达,导致细胞功能异常,最终导致疾病的发生。

癌症与表观遗传异常 (cancer and epigenetic aberrations)

癌症是一种基因病,但越来越多的证据表明,表观遗传异常在癌症的发生发展中也发挥着重要作用。癌症细胞中常见的表观遗传异常包括:

DNA甲基化模式异常 (aberrant DNA methylation patterns)
▮▮▮▮⚝ 全局性低甲基化 (global hypomethylation):在许多癌症类型中,基因组整体DNA甲基化水平降低,这可能导致基因组不稳定,染色体畸变,以及癌基因的激活。
▮▮▮▮⚝ 局部性高甲基化 (regional hypermethylation):在癌症细胞中,一些基因启动子区域发生异常高甲基化,特别是 抑癌基因 (tumor suppressor genes) 的启动子区域,导致抑癌基因沉默,失去对细胞生长的抑制作用,促进肿瘤发生。
组蛋白修饰模式异常 (aberrant histone modification patterns)
▮▮▮▮⚝ 组蛋白乙酰化水平异常 (aberrant histone acetylation levels):在癌症细胞中,组蛋白乙酰化水平可能发生全局性或局部性的异常改变。例如,一些癌基因的启动子区域可能富集激活性组蛋白乙酰化修饰,导致癌基因过度表达;而抑癌基因的启动子区域可能组蛋白去乙酰化水平升高,导致抑癌基因沉默。
▮▮▮▮⚝ 组蛋白甲基化模式异常 (aberrant histone methylation patterns):在癌症细胞中,H3K4me3、H3K9me3、H3K27me3等组蛋白甲基化修饰模式也可能发生异常改变,影响基因表达和染色质结构。
非编码RNA表达异常 (aberrant non-coding RNA expression)
▮▮▮▮⚝ miRNA表达失调 (dysregulation of miRNA expression):miRNA在癌症发生发展中发挥着重要作用,既可以作为 癌基因miRNA (onco-miRNAs) 促进肿瘤发生,也可以作为 抑癌miRNA (tumor suppressor miRNAs) 抑制肿瘤发生。在癌症细胞中,miRNA的表达谱常常发生异常改变,一些癌基因miRNA表达上调,而抑癌miRNA表达下调。
▮▮▮▮⚝ lncRNA表达失调 (dysregulation of lncRNA expression):lncRNA在癌症发生发展中也发挥着重要作用。一些lncRNA被发现与肿瘤的发生、转移、耐药等密切相关,可以作为癌基因lncRNA或抑癌lncRNA。在癌症细胞中,lncRNA的表达谱也常常发生异常改变。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[癌症] --> B[表观遗传异常];
3 B --> C[DNA甲基化异常];
4 B --> D[组蛋白修饰异常];
5 B --> E[ncRNA表达异常];
6 C --> F[全局性低甲基化];
7 C --> G[局部性高甲基化 (抑癌基因)];
8 D --> H[组蛋白乙酰化异常];
9 D --> I[组蛋白甲基化异常];
10 E --> J[miRNA表达失调];
11 E --> K[lncRNA表达失调];

神经退行性疾病与表观遗传 (neurodegenerative diseases and epigenetics)

神经退行性疾病,如 阿尔茨海默病 (Alzheimer's disease, AD)帕金森病 (Parkinson's disease, PD)亨廷顿病 (Huntington's disease, HD) 等,是一类以神经元进行性退化和功能丧失为特征的疾病。研究表明,表观遗传改变在神经退行性疾病的发生发展中也发挥着重要作用。

AD与表观遗传 (AD and epigenetics):在AD患者的脑组织中,DNA甲基化模式、组蛋白修饰模式和ncRNA表达谱都发生了异常改变。例如,与AD发病相关的基因,如 淀粉样前体蛋白 (amyloid precursor protein, APP)早老素 (presenilin) 基因,其启动子区域的DNA甲基化水平和组蛋白修饰模式发生改变,导致基因表达异常。miRNA和lncRNA也参与AD的发生发展过程。
PD与表观遗传 (PD and epigenetics):在PD患者的脑组织中,也发现了DNA甲基化、组蛋白修饰和ncRNA表达的异常改变。例如,与PD发病相关的基因,如 α-突触核蛋白 (α-synuclein)LRRK2 基因,其表观遗传修饰模式发生改变,影响基因表达。
HD与表观遗传 (HD and epigenetics):HD是一种由 亨廷顿蛋白 (huntingtin, HTT) 基因突变引起的神经退行性疾病。研究表明,HTT基因的突变不仅导致蛋白质功能异常,也影响HTT基因的表观遗传状态,导致基因表达异常,参与HD的发病过程。

代谢性疾病与表观遗传 (metabolic diseases and epigenetics)

代谢性疾病,如 糖尿病 (diabetes)肥胖症 (obesity)非酒精性脂肪性肝病 (non-alcoholic fatty liver disease, NAFLD) 等,是一类与代谢功能紊乱相关的疾病。表观遗传改变在代谢性疾病的发生发展中也发挥着重要作用。

糖尿病与表观遗传 (diabetes and epigenetics):在糖尿病患者的胰岛β细胞和靶组织中,DNA甲基化模式、组蛋白修饰模式和ncRNA表达谱都发生了异常改变。例如,与胰岛素分泌和葡萄糖代谢相关的基因,其表观遗传修饰模式发生改变,导致基因表达异常,参与糖尿病的发病过程。
肥胖症与表观遗传 (obesity and epigenetics):在肥胖症患者的脂肪组织和下丘脑等组织中,也发现了表观遗传改变。例如,与脂肪生成和能量代谢相关的基因,其表观遗传修饰模式发生改变,影响基因表达,参与肥胖症的发生发展。
NAFLD与表观遗传 (NAFLD and epigenetics):在NAFLD患者的肝脏组织中,表观遗传改变也参与疾病的发生发展。例如,与脂肪酸代谢和炎症反应相关的基因,其表观遗传修饰模式发生改变,导致基因表达异常,参与NAFLD的发病过程。

除了上述疾病,表观遗传异常还与自身免疫性疾病、精神疾病等多种疾病的发生发展相关。表观遗传学已经成为疾病研究和治疗的新兴领域。

14.3 表观遗传学研究方法与应用 (Research Methods and Applications of Epigenetics)

14.3.1 表观遗传学研究方法:DNA甲基化测序、ChIP-Seq (Research Methods in Epigenetics: DNA Methylation Sequencing, ChIP-Seq)

表观遗传学研究需要借助一系列实验技术来检测和分析各种表观遗传修饰。常用的表观遗传学研究方法包括 DNA甲基化测序 (DNA methylation sequencing)染色质免疫沉淀测序 (Chromatin Immunoprecipitation Sequencing, ChIP-Seq) 等。

DNA甲基化测序 (DNA Methylation Sequencing)

DNA甲基化测序技术用于 全基因组 (genome-wide)靶区域 (targeted region) 检测DNA甲基化水平和模式。常用的DNA甲基化测序技术包括 亚硫酸氢盐测序 (Bisulfite Sequencing, BS-Seq)甲基化DNA免疫沉淀测序 (Methylated DNA Immunoprecipitation Sequencing, MeDIP-Seq) 等。

亚硫酸氢盐测序 (Bisulfite Sequencing, BS-Seq):BS-Seq是DNA甲基化研究的 金标准 (gold standard) 技术。其基本原理是利用 亚硫酸氢盐 (bisulfite) 处理DNA,亚硫酸氢盐可以将未甲基化的胞嘧啶 (C) 转化为尿嘧啶 (U),而甲基化的胞嘧啶 (5mC) 则不受影响。经过亚硫酸氢盐处理后,再进行PCR扩增和测序。在测序结果中,原本未甲基化的胞嘧啶位点在序列中会显示为胸腺嘧啶 (T),而原本甲基化的胞嘧啶位点则仍然显示为胞嘧啶 (C)。通过比对亚硫酸氢盐处理前后DNA序列的差异,就可以确定DNA甲基化的位点和程度。BS-Seq可以实现单碱基分辨率的DNA甲基化检测,可以用于全基因组DNA甲基化谱分析 (Whole-Genome Bisulfite Sequencing, WGBS) 和靶区域DNA甲基化分析 (Targeted Bisulfite Sequencing)。
甲基化DNA免疫沉淀测序 (Methylated DNA Immunoprecipitation Sequencing, MeDIP-Seq):MeDIP-Seq是一种基于 抗体免疫沉淀 (antibody immunoprecipitation) 的DNA甲基化检测技术。其基本原理是利用 甲基胞嘧啶抗体 (anti-5mC antibody)甲基羟胞嘧啶抗体 (anti-5hmC antibody) 等特异性识别甲基化胞嘧啶的抗体,对基因组DNA片段进行免疫沉淀,富集甲基化DNA片段。然后对免疫沉淀得到的DNA片段进行高通量测序,并将测序结果比对到基因组上,就可以确定基因组上甲基化区域的分布。MeDIP-Seq的优点是操作相对简便,成本较低,但分辨率不如BS-Seq,通常只能检测甲基化区域,而不能达到单碱基分辨率。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[DNA甲基化测序] --> B[亚硫酸氢盐测序 (BS-Seq)];
3 A --> C[甲基化DNA免疫沉淀测序 (MeDIP-Seq)];
4 B --> D[亚硫酸氢盐处理];
5 D --> E[C -> U 转化];
6 D --> F[5mC 不受影响];
7 E & F --> G[PCR扩增];
8 G --> H[测序];
9 H --> I[单碱基分辨率];
10 C --> J[甲基胞嘧啶抗体];
11 J --> K[免疫沉淀];
12 K --> L[富集甲基化DNA];
13 L --> M[高通量测序];
14 M --> N[甲基化区域分布];

染色质免疫沉淀测序 (Chromatin Immunoprecipitation Sequencing, ChIP-Seq)

ChIP-Seq技术用于 全基因组 检测与特定DNA区域结合的 蛋白质 (proteins),例如转录因子、组蛋白修饰酶、组蛋白变体等。其基本原理是:

  1. 甲醛交联 (formaldehyde crosslinking):利用甲醛等交联剂将细胞内的DNA与蛋白质交联固定在一起,保持体内状态下DNA与蛋白质的结合关系。
  2. 染色质片段化 (chromatin fragmentation):将交联后的染色质进行片段化处理,通常采用 超声破碎 (sonication)酶消化 (enzyme digestion) 的方法,将染色质切割成一定大小的DNA片段。
  3. 免疫沉淀 (immunoprecipitation):利用 特异性抗体 (specific antibody) 识别目标蛋白质,对抗体进行免疫沉淀,将与目标蛋白质结合的DNA片段富集下来。
  4. DNA纯化与测序 (DNA purification and sequencing):将免疫沉淀得到的DNA片段纯化出来,去除蛋白质,然后进行高通量测序。
  5. 数据分析 (data analysis):将测序结果比对到基因组上,分析测序reads在基因组上的分布,就可以确定目标蛋白质在基因组上的结合位点。

ChIP-Seq可以用于研究:

转录因子结合位点 (transcription factor binding sites):利用转录因子抗体进行ChIP-Seq,可以确定转录因子在基因组上的结合位点,研究转录因子的调控网络。
组蛋白修饰图谱 (histone modification profiles):利用针对特定组蛋白修饰的抗体进行ChIP-Seq,可以绘制全基因组的组蛋白修饰图谱,研究组蛋白修饰与基因表达的关系。
染色质开放区域 (chromatin accessibility regions):结合 DNase-Seq (DNase I hypersensitive sites sequencing)ATAC-Seq (Assay for Transposase-Accessible Chromatin using sequencing) 等技术,可以研究染色质的开放程度,以及染色质开放区域与基因表达的关系。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[ChIP-Seq] --> B[甲醛交联];
3 B --> C[染色质片段化];
4 C --> D[免疫沉淀 (特异性抗体)];
5 D --> E[DNA纯化];
6 E --> F[高通量测序];
7 F --> G[数据分析];
8 G --> H[蛋白质结合位点];
9 G --> I[组蛋白修饰图谱];
10 G --> J[染色质开放区域];

除了BS-Seq和ChIP-Seq,常用的表观遗传学研究方法还包括 RNA测序 (RNA-Seq) 用于检测基因表达水平,ATAC-Seq 用于检测染色质开放区域,Hi-C (High-throughput Chromosome Conformation Capture) 用于研究染色质三维结构等。这些技术方法相互结合,可以从不同层面深入研究表观遗传调控机制。

14.3.2 表观遗传学在疾病诊断与治疗中的应用 (Applications of Epigenetics in Disease Diagnosis and Therapy)

随着对表观遗传学在疾病发生发展中作用认识的深入,表观遗传学在 疾病诊断 (disease diagnosis)治疗 (therapy) 方面展现出巨大的应用潜力。

表观遗传标志物与疾病诊断 (epigenetic biomarkers and disease diagnosis)

表观遗传修饰在疾病发生早期就可能发生改变,而且在疾病发展过程中具有动态变化,因此,表观遗传修饰可以作为 疾病诊断的标志物 (biomarkers)。与基因突变相比,表观遗传修饰具有 可逆性 (reversibility)组织特异性 (tissue specificity) 等特点,使得表观遗传标志物在疾病早期诊断、预后评估和疗效预测等方面具有独特的优势。

癌症诊断 (cancer diagnosis):DNA甲基化是癌症诊断中应用最广泛的表观遗传标志物。例如,一些癌症类型中,特定的基因启动子区域发生异常高甲基化,可以作为癌症早期诊断的标志物。液体活检 (liquid biopsy) 技术,例如检测血液循环肿瘤DNA (circulating tumor DNA, ctDNA) 中的DNA甲基化模式,可以实现无创的癌症早期诊断和动态监测。miRNA表达谱也可以作为癌症诊断和预后评估的标志物。
神经退行性疾病诊断 (neurodegenerative disease diagnosis):在神经退行性疾病中,表观遗传改变也可能发生在疾病早期。例如,AD患者的脑脊液和血液中,一些miRNA的表达水平发生异常改变,可以作为AD早期诊断的潜在标志物。DNA甲基化模式也可能作为神经退行性疾病的诊断标志物。
其他疾病诊断 (diagnosis of other diseases):表观遗传标志物在代谢性疾病、自身免疫性疾病、精神疾病等多种疾病的诊断中也具有应用潜力。例如,糖尿病患者的血液中,一些miRNA的表达水平与血糖控制和并发症风险相关,可以作为糖尿病管理的标志物。

表观遗传药物与疾病治疗 (epigenetic drugs and disease therapy)

由于表观遗传修饰具有 可逆性,因此,可以通过药物干预,逆转异常的表观遗传修饰,恢复正常的基因表达模式,从而达到治疗疾病的目的。表观遗传药物 (epigenetic drugs) 是一类靶向表观遗传修饰酶的药物,主要包括 DNA甲基转移酶抑制剂 (DNMT inhibitors)组蛋白去乙酰化酶抑制剂 (HDAC inhibitors) 等。

DNMT抑制剂 (DNMT inhibitors):DNMT抑制剂可以抑制DNMTs酶的活性,降低DNA甲基化水平,解除基因沉默。目前,已经有一些DNMT抑制剂被批准用于临床治疗,主要用于治疗 血液系统恶性肿瘤 (hematological malignancies),如 骨髓增生异常综合征 (myelodysplastic syndromes, MDS)急性髓系白血病 (acute myeloid leukemia, AML)。例如,阿扎胞苷 (azacitidine)地西他滨 (decitabine) 是常用的DNMT抑制剂。
HDAC抑制剂 (HDAC inhibitors):HDAC抑制剂可以抑制HDACs酶的活性,提高组蛋白乙酰化水平,促进基因转录。HDAC抑制剂也被批准用于临床治疗,主要用于治疗 皮肤T细胞淋巴瘤 (cutaneous T-cell lymphoma, CTCL)多发性骨髓瘤 (multiple myeloma, MM) 等。例如,伏立诺他 (vorinostat)罗米地辛 (romidepsin) 是常用的HDAC抑制剂。

1.双击鼠标左键复制此行;2.单击复制所有代码。
                                
                                    
1 graph LR
2 A[表观遗传学应用] --> B[疾病诊断];
3 A --> C[疾病治疗];
4 B --> D[表观遗传标志物];
5 D --> E[癌症诊断 (DNA甲基化, miRNA)];
6 D --> F[神经退行性疾病诊断 (miRNA, DNA甲基化)];
7 D --> G[其他疾病诊断 (代谢病, 免疫病)];
8 C --> H[表观遗传药物];
9 H --> I[DNMT抑制剂 (阿扎胞苷, 地西他滨)];
10 H --> J[HDAC抑制剂 (伏立诺他, 罗米地辛)];
11 I --> K[血液系统恶性肿瘤];
12 J --> L[皮肤T细胞淋巴瘤, 多发性骨髓瘤];

表观遗传药物的研发和应用是表观遗传学在疾病治疗领域的重要进展。目前,表观遗传药物主要用于治疗癌症,但随着研究的深入,表观遗传药物在神经退行性疾病、代谢性疾病等其他疾病的治疗中也展现出潜力。此外,表观遗传药物的联合用药、靶向表观遗传治疗、表观遗传编辑等也是未来表观遗传治疗的重要发展方向。

15. 高级遗传学专题 (Advanced Topics in Genetics)

本章将深入探讨遗传学研究的前沿领域和热点问题,旨在为读者展现遗传学发展的最新趋势和未来方向。我们将聚焦于基因编辑技术 (Gene Editing Technologies)、合成生物学 (Synthetic Biology) 和系统遗传学 (System Genetics) 这三大新兴领域,介绍它们的基本概念、核心技术、广泛应用以及所面临的伦理挑战,以期帮助读者把握遗传学发展的前沿动态,拓展学术视野。

15.1 基因编辑技术 (Gene Editing Technologies)

基因编辑技术 (Gene Editing Technologies) 是一类能够精确修改生物体基因组特定位点的技术的总称。这些技术利用核酸酶 (Nucleases) 靶向基因组特定序列,实现对DNA的切割,并利用细胞自身的DNA修复机制,实现基因的敲除、插入、替换或修饰。基因编辑技术的出现,彻底革新了遗传学研究和生物技术应用,为疾病治疗、农业改良和基础研究带来了前所未有的机遇。目前,最受瞩目和广泛应用的基因编辑技术是CRISPR-Cas9系统。

15.1.1 CRISPR-Cas9基因编辑技术 (CRISPR-Cas9 Gene Editing Technology)

CRISPR-Cas9 (Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR-associated protein 9) 基因编辑技术源于细菌和古菌的适应性免疫系统。该系统利用向导RNA (guide RNA, gRNA) 定位基因组上的特定DNA序列,并引导Cas9核酸酶 (Cas9 nuclease) 对靶位点进行精确切割,从而实现基因编辑。CRISPR-Cas9技术以其高效、简便、低成本和多靶点编辑能力,迅速成为基因编辑领域的革命性工具。

CRISPR-Cas9系统的组成 (Components of CRISPR-Cas9 System)

▮▮▮▮CRISPR-Cas9系统主要由两个核心组分构成:

▮▮▮▮ⓐ Cas9核酸酶 (Cas9 nuclease):Cas9是一种DNA内切酶,能够切割双链DNA。来源于不同细菌的Cas9蛋白具有不同的特性,常用的Cas9蛋白,如来自 Streptococcus pyogenes 的SpCas9,识别并切割含有NGG (N可以是任意核苷酸,G代表鸟嘌呤) PAM (Protospacer Adjacent Motif, 原间隔序列邻近基序) 序列上游20个核苷酸的DNA序列。Cas9蛋白的结构可以分为两个主要功能域:一是识别gRNA的RNA识别结构域 (REC domain),二是负责DNA切割的HNH和RuvC核酸酶结构域 (nuclease domain)。

▮▮▮▮ⓑ 向导RNA (guide RNA, gRNA):gRNA是由crRNA (CRISPR RNA) 和 tracrRNA (trans-activating crRNA) 融合而成的一条单链RNA分子。gRNA的核心功能是引导Cas9蛋白靶向基因组的特定DNA序列。gRNA中约20个核苷酸的序列与靶DNA序列互补配对,决定了基因编辑的靶位点特异性。通过设计和合成不同的gRNA序列,可以实现对基因组任意位置的精确编辑。

CRISPR-Cas9基因编辑技术的原理与操作流程 (Principle and Workflow of CRISPR-Cas9 Gene Editing Technology)

▮▮▮▮CRISPR-Cas9基因编辑技术的核心原理是利用gRNA的引导作用,将Cas9核酸酶精确靶向到基因组的特定位点,并利用Cas9酶的核酸酶活性切割双链DNA。细胞的DNA损伤修复机制随后被激活,主要通过以下两种途径修复DNA双链断裂 (Double-Strand Break, DSB):

▮▮▮▮ⓐ 非同源末端连接 (Non-Homologous End Joining, NHEJ):NHEJ是一种易于出错的修复途径,直接将DNA断裂末端连接起来,常常导致插入 (Insertion) 或缺失 (Deletion) (Indel) 突变,从而实现基因敲除 (Gene Knockout)。NHEJ修复是CRISPR-Cas9技术中最常用的基因敲除策略。

▮▮▮▮ⓑ 同源重组修复 (Homology-Directed Repair, HDR):HDR是一种精确的修复途径,需要同源模板DNA的存在。在CRISPR-Cas9切割DNA后,如果提供含有同源臂的供体DNA模板,细胞可以利用HDR机制,以供体DNA为模板修复DSB,实现基因的精确编辑,如基因敲入 (Gene Knock-in)、基因替换 (Gene Replacement) 或碱基编辑 (Base Editing)。HDR修复的效率通常低于NHEJ,但可以实现更精确的基因组修饰。

▮▮▮▮CRISPR-Cas9基因编辑技术的标准操作流程通常包括以下步骤:

▮▮▮▮▮▮▮▮❶ 靶位点选择与gRNA设计 (Target Site Selection and gRNA Design):根据基因编辑的目的,选择合适的基因组靶位点。通常需要选择靠近基因功能区域,且具有合适的PAM序列的位点。利用在线工具或软件设计gRNA序列,并评估gRNA的脱靶效应 (Off-target effect) 风险。

▮▮▮▮▮▮▮▮❷ CRISPR-Cas9系统构建 (CRISPR-Cas9 System Construction):将Cas9基因和gRNA基因克隆到表达载体中,构建CRISPR-Cas9表达载体。也可以直接合成Cas9蛋白和gRNA,形成核糖核蛋白 (Ribonucleoprotein, RNP) 复合物,用于后续的细胞或生物体转染。

▮▮▮▮▮▮▮▮❸ 细胞或生物体转染 (Cell or Organism Transfection):将CRISPR-Cas9表达载体或RNP复合物导入到目标细胞或生物体中。常用的转染方法包括转染试剂转染、电穿孔转染、病毒载体转染和显微注射等。

▮▮▮▮▮▮▮▮❹ 基因编辑效果评估与筛选 (Evaluation and Screening of Gene Editing Effects):在转染后的细胞或生物体中,评估基因编辑的效率和特异性。常用的评估方法包括PCR扩增靶区域DNA并进行Sanger测序或高通量测序,T7E1酶切分析,以及表型分析等。对于基因敲除实验,可以通过单克隆筛选或富集方法获得纯合突变细胞系或个体。对于基因敲入实验,需要进行更严格的筛选和验证。

15.1.2 基因编辑技术的应用与伦理问题 (Applications and Ethical Issues of Gene Editing Technologies)

基因编辑技术,特别是CRISPR-Cas9技术,以其强大的基因改造能力,在生物医学、农业和工业等领域展现出巨大的应用潜力,同时也引发了一系列伦理和社会问题。

基因编辑技术的应用 (Applications of Gene Editing Technologies)

▮▮▮▮ⓐ 基因治疗 (Gene Therapy):基因编辑技术为遗传疾病的治疗带来了革命性的突破。通过 体外 (ex vivo)体内 (in vivo) 基因编辑,可以精确修复患者体内的致病基因,从而根治遗传疾病。例如,利用CRISPR-Cas9技术在 体外 编辑患者的造血干细胞,修复β-地中海贫血症 (β-thalassemia) 或镰状细胞贫血症 (sickle cell anemia) 的致病基因,再将编辑后的细胞回输到患者体内,已在临床试验中取得积极进展。体内 基因编辑方面,利用腺相关病毒 (Adeno-Associated Virus, AAV) 等载体递送CRISPR-Cas9系统到特定组织或器官,治疗遗传性眼病、杜氏肌营养不良症 (Duchenne muscular dystrophy) 等疾病的研究也在快速推进。

▮▮▮▮ⓑ 疾病模型构建与药物研发 (Disease Model Construction and Drug Development):基因编辑技术可以快速、高效地构建各种疾病动物模型和细胞模型,用于研究疾病的发病机制和筛选药物。例如,利用CRISPR-Cas9技术在小鼠或细胞系中敲除或突变特定基因,模拟人类疾病的遗传缺陷,用于研究癌症、神经退行性疾病和代谢性疾病等复杂疾病。此外,基因编辑技术还可以用于高通量药物筛选,加速新药研发进程。

▮▮▮▮ⓒ 农业育种改良 (Agricultural Breeding and Improvement):基因编辑技术在农业领域具有广阔的应用前景。通过基因编辑,可以改良作物的农艺性状,如提高产量、改善品质、增强抗病虫害能力和抗逆性。例如,利用CRISPR-Cas9技术培育高产水稻、抗病小麦、耐除草剂玉米等新品种,提高农业生产效率和可持续性。基因编辑技术还可以用于家畜改良,培育抗病家禽、高产奶牛等优良品种。

▮▮▮▮ⓓ 基础生物学研究 (Basic Biological Research):基因编辑技术是研究基因功能和调控机制的强大工具。通过精确敲除、敲入或修饰特定基因,可以研究基因在细胞生长、发育、分化和代谢等生物学过程中的作用。基因编辑技术还被广泛应用于基因组编辑筛选 (Genome-wide CRISPR screening),高通量地鉴定与特定生物学功能相关的基因,加速生命科学研究的进展。

基因编辑技术的伦理问题 (Ethical Issues of Gene Editing Technologies)

▮▮▮▮基因编辑技术的快速发展和广泛应用,特别是CRISPR-Cas9技术,引发了深刻的伦理和社会关注,主要集中在以下几个方面:

▮▮▮▮ⓐ 人类生殖细胞基因编辑的伦理争议 (Ethical Concerns of Human Germline Gene Editing):对人类生殖细胞 (精子、卵子、受精卵和早期胚胎) 进行基因编辑,可能导致遗传修饰永久性地传递给后代,影响人类的基因库。这种“可遗传的基因编辑” (Heritable genome editing) 引发了广泛的伦理争议。一方面,支持者认为,生殖细胞基因编辑有望根除遗传疾病,造福后代;另一方面,反对者担忧,生殖细胞基因编辑可能被滥用,用于“设计婴儿” (Designer babies),加剧社会不平等,甚至对人类进化产生不可预测的长期影响。目前,国际学术界普遍呼吁,在充分评估风险和伦理影响之前,应谨慎对待人类生殖细胞基因编辑的临床应用。

▮▮▮▮ⓑ 基因编辑技术的脱靶效应与安全性 (Off-target Effects and Safety of Gene Editing Technologies):基因编辑技术,特别是CRISPR-Cas9技术,可能存在脱靶效应,即在非靶位点发生基因编辑,导致意外的基因突变和不良后果。脱靶效应是基因编辑技术安全性的重要考量。研究人员正在不断改进gRNA设计、Cas9蛋白改造和递送系统,以降低脱靶效应,提高基因编辑的精确性和安全性。

▮▮▮▮ⓒ 基因编辑技术的监管与社会责任 (Regulation and Social Responsibility of Gene Editing Technologies):基因编辑技术的强大能力,需要严格的监管和负责任的应用。各国政府和国际组织正在制定相关政策和指南,规范基因编辑技术的研发和应用,防止滥用和伦理风险。科学家、医生和生物技术公司也应承担社会责任,公开透明地进行研究,积极参与伦理讨论,确保基因编辑技术在伦理和法律框架内健康发展,真正造福人类。

15.2 合成生物学 (Synthetic Biology)

合成生物学 (Synthetic Biology) 是一门新兴的交叉学科,它融合了生物学、工程学和信息科学等领域的知识和技术,旨在像设计和建造工程系统一样,对生物系统进行设计、改造和合成,以实现特定的生物学功能或工程目标。合成生物学被认为是继DNA双螺旋发现和基因工程之后,生物学领域的又一次革命,具有巨大的科学价值和应用潜力。

15.2.1 合成生物学的概念与研究方法 (Concepts and Research Methods of Synthetic Biology)

合成生物学并非简单地改造已有的生物系统,而是从工程学的角度出发,将生物系统视为可以设计、构建和模块化的工程系统。其核心理念是“设计-构建-测试-学习” (Design-Build-Test-Learn, DBTL) 循环,通过工程化的方法,系统地改造或合成生物元件、生物通路和生物系统,以实现预期的生物学功能。

合成生物学的基本概念 (Basic Concepts of Synthetic Biology)

▮▮▮▮ⓐ 生物元件 (BioBricks/Biological Parts):生物元件是合成生物学的基本构建模块,是指具有明确生物学功能的标准化DNA序列,如启动子 (Promoter)、核糖体结合位点 (Ribosome Binding Site, RBS)、编码序列 (Coding Sequence, CDS)、终止子 (Terminator) 等。生物元件可以像电子工程中的标准元件一样,被模块化地组装和复用,构建复杂的生物系统。

▮▮▮▮ⓑ 生物通路 (Biological Pathway):生物通路是指细胞内一系列相互关联的生物化学反应,如代谢通路 (Metabolic Pathway)、信号通路 (Signaling Pathway) 等。合成生物学可以通过改造或合成新的生物通路,改变细胞的代谢流向、信号传递或调控网络,实现特定的生物学功能。

▮▮▮▮ⓒ 生物系统 (Biological System):生物系统是指由多个生物元件和生物通路相互作用构成的复杂生物学功能单元,如基因线路 (Genetic Circuit)、人工细胞 (Artificial Cell) 和合成微生物 (Synthetic Microorganism) 等。合成生物学的最终目标是设计和构建具有复杂功能的生物系统,解决生物医学、能源和环境等领域的重大挑战。

合成生物学的研究方法 (Research Methods of Synthetic Biology)

▮▮▮▮合成生物学研究方法的核心是“设计-构建-测试-学习” (DBTL) 循环,结合了多种工程学和生物学技术,主要包括以下几个方面:

▮▮▮▮ⓐ DNA合成 (DNA Synthesis):DNA合成技术是合成生物学的基础。随着DNA合成成本的降低和效率的提高,研究人员可以快速、经济地合成大量的生物元件、基因和基因组片段,为构建复杂的生物系统提供物质基础。DNA合成技术的发展,使得从头设计和构建生物系统成为可能。

▮▮▮▮ⓑ 基因组编辑 (Genome Editing):基因编辑技术,如CRISPR-Cas9,是合成生物学的重要工具。基因组编辑技术可以精确、高效地修改生物体的基因组,实现基因的敲除、插入、替换或修饰,用于改造已有的生物系统,或构建新的生物元件和生物通路。基因组编辑技术与DNA合成技术相结合,大大加速了合成生物学研究的进程。

▮▮▮▮ⓒ 代谢工程 (Metabolic Engineering):代谢工程是合成生物学的重要分支,旨在通过改造细胞的代谢通路,提高目标产物的合成效率,或合成新的化合物。代谢工程通常采用基因工程、酶工程和系统生物学等方法,优化代谢通路中的酶活性、调控基因表达和改变代谢流向,以实现高效的生物合成。

▮▮▮▮ⓓ 系统生物学 (Systems Biology):系统生物学是合成生物学的理论基础。系统生物学利用数学建模、网络分析和计算生物学等方法,研究生物系统的复杂性和动态性,揭示生物系统的内在规律。系统生物学的研究成果,为合成生物学的设计和优化提供理论指导。

▮▮▮▮ⓔ 高通量自动化 (High-throughput Automation):合成生物学研究通常需要进行大量的实验和数据分析。高通量自动化技术,如自动化液体处理工作站、高通量筛选平台和自动化数据分析系统,可以大大提高实验效率和数据质量,加速合成生物学研究的进程。

15.2.2 合成生物学的应用前景 (Application Prospects of Synthetic Biology)

合成生物学作为一门新兴的交叉学科,在生物制造、生物能源、生物医药和环境保护等领域展现出广阔的应用前景,有望解决人类社会面临的重大挑战。

生物制造 (Biomanufacturing):合成生物学为传统化学制造提供了可持续的替代方案。通过设计和改造微生物细胞,可以高效、绿色地合成各种化学品、材料和生物制品。例如:

▮▮▮▮ⓐ 生物基化学品 (Bio-based Chemicals):利用合成生物学技术,可以从可再生生物质原料 (如糖、淀粉、纤维素等) 合成各种生物基化学品,如生物塑料 (Bio-plastics)、生物燃料 (Biofuels)、生物基溶剂 (Bio-based solvents) 和生物基聚合物 (Bio-based polymers) 等,替代传统的石油基化学品,减少对化石资源的依赖,降低环境污染。

▮▮▮▮ⓑ 生物材料 (Biomaterials):合成生物学可以用于设计和合成具有特殊功能的生物材料,如生物传感器 (Biosensors)、生物支架 (Bioscaffolds)、生物墨水 (Bio-inks) 和自组装纳米材料 (Self-assembling nanomaterials) 等,应用于生物医学、组织工程和纳米技术等领域。

▮▮▮▮ⓒ 食品与营养品 (Food and Nutraceuticals):合成生物学可以用于生产新型食品成分、食品添加剂和营养保健品。例如,利用合成生物学技术生产人造肉 (Cultured meat)、新型甜味剂 (Novel sweeteners)、功能性食品成分 (Functional food ingredients) 和维生素 (Vitamins) 等,改善食品的营养价值和风味,满足人们对健康食品的需求。

生物能源 (Bioenergy):合成生物学为解决能源危机和应对气候变化提供了新的途径。通过设计和改造微生物细胞或植物,可以高效地生产生物燃料,如生物乙醇 (Bioethanol)、生物柴油 (Biodiesel) 和生物氢气 (Biohydrogen) 等,替代传统的化石燃料,减少温室气体排放,实现能源的可持续发展。

▮▮▮▮ⓐ 生物燃料 (Biofuels):利用合成生物学技术,可以提高生物燃料的生产效率和降低生产成本。例如,改造酵母菌或藻类,提高其对纤维素、半纤维素和木质素等生物质原料的利用效率,或提高其对二氧化碳的固定和转化效率,从而高效生产生物乙醇、生物柴油和生物航空燃料 (Biojet fuel) 等。

▮▮▮▮ⓑ 生物氢气 (Biohydrogen):氢气是一种清洁、高效的能源载体。利用合成生物学技术,可以改造微生物或藻类,提高其生物制氢效率,或开发新型的生物制氢途径,实现可持续的生物制氢。

生物医药 (Biomedicine):合成生物学在生物医药领域具有巨大的应用潜力,可以用于药物研发、疾病诊断和治疗。

▮▮▮▮ⓐ 药物研发与生产 (Drug Discovery and Production):合成生物学可以加速新药研发进程,并提高药物生产效率和降低生产成本。例如,利用合成生物学技术,可以构建高产药物合成途径的微生物细胞工厂,生产抗生素 (Antibiotics)、抗癌药物 (Anticancer drugs)、疫苗 (Vaccines) 和生物制药 (Biopharmaceuticals) 等。合成生物学还可以用于开发新型药物靶点和药物递送系统。

▮▮▮▮ⓑ 疾病诊断与治疗 (Disease Diagnosis and Therapy):合成生物学可以用于开发新型疾病诊断工具和治疗方法。例如,利用合成生物学技术,可以构建生物传感器,用于疾病的早期诊断和个性化治疗;开发基因治疗载体和细胞治疗策略,用于遗传疾病和癌症的治疗;构建合成免疫系统 (Synthetic immune system),用于免疫治疗和疫苗开发。

环境保护 (Environmental Protection):合成生物学可以用于解决环境污染和生态破坏等问题。

▮▮▮▮ⓐ 生物修复 (Bioremediation):利用合成生物学技术,可以改造微生物,使其具有降解污染物、富集重金属或固定二氧化碳等功能,用于修复受污染的土壤、水体和空气。例如,改造微生物,使其能够高效降解塑料、农药、重金属和持久性有机污染物 (Persistent Organic Pollutants, POPs) 等。

▮▮▮▮ⓑ 生物监测 (Biomonitoring):利用合成生物学技术,可以构建生物传感器,用于监测环境中的污染物、有害物质和病原体,实现环境的快速、灵敏和实时的监测。

15.3 系统遗传学 (System Genetics)

系统遗传学 (System Genetics) 是一门新兴的遗传学分支,它整合了系统生物学 (Systems Biology) 和遗传学的研究方法和理念,旨在从系统水平上研究基因与复杂性状之间的关系,揭示复杂性状的遗传基础和调控机制。系统遗传学强调从整体和动态的角度理解基因的作用,关注基因之间的相互作用、基因与环境的互作,以及基因在不同层面的调控网络。

15.3.1 系统遗传学的概念与研究方法 (Concepts and Research Methods of System Genetics)

系统遗传学超越了传统的“一个基因,一个性状” (One gene, one trait) 的线性思维模式,强调基因与基因之间、基因与环境之间复杂的相互作用网络,以及这些网络如何共同决定生物体的复杂性状。系统遗传学研究方法的核心是整合高通量实验技术、计算生物学和数学建模等手段,从系统水平上解析复杂性状的遗传结构和调控机制。

系统遗传学的基本概念 (Basic Concepts of System Genetics)

▮▮▮▮ⓐ 复杂性状 (Complex Traits):复杂性状,也称为数量性状 (Quantitative Traits),是指受多个基因和环境因素共同影响的性状,如身高、体重、血压、疾病易感性、作物产量和抗逆性等。复杂性状的遗传模式通常是非孟德尔遗传 (Non-Mendelian Inheritance),表现为连续变异 (Continuous Variation),难以用传统的孟德尔遗传定律解释。

▮▮▮▮ⓑ 基因网络 (Gene Network):基因网络是指细胞内基因之间相互作用形成的复杂调控网络,包括基因调控网络 (Gene Regulatory Network, GRN)、代谢网络 (Metabolic Network) 和信号转导网络 (Signal Transduction Network) 等。基因网络中的基因相互关联、相互影响,共同调控细胞的生理功能和生物学性状。系统遗传学关注基因网络结构和动态变化,以及基因网络与复杂性状之间的关系。

▮▮▮▮ⓒ 系统水平 (System Level):系统水平是指从整体和动态的角度理解生物系统的功能和行为。系统遗传学强调从系统水平上研究基因的作用,关注基因在不同层面的调控网络,以及基因网络与环境的互作,共同决定生物体的复杂性状。系统水平的研究方法包括高通量实验技术、计算生物学和数学建模等。

系统遗传学的研究方法 (Research Methods of System Genetics)

▮▮▮▮系统遗传学研究方法的核心是整合高通量实验技术、计算生物学和数学建模等手段,从系统水平上解析复杂性状的遗传结构和调控机制。主要研究方法包括:

▮▮▮▮ⓐ 高通量筛选 (High-throughput Screening):高通量筛选技术,如基因组范围关联研究 (Genome-Wide Association Study, GWAS)、全基因组编辑筛选 (Genome-wide CRISPR screening) 和转录组测序 (RNA-Seq),可以大规模、高通量地分析基因与性状之间的关联,鉴定与复杂性状相关的基因和基因变异。高通量筛选技术为系统遗传学研究提供了海量的数据资源。

▮▮▮▮ⓑ 网络分析 (Network Analysis):网络分析是系统遗传学的核心方法之一。利用网络分析方法,可以构建基因调控网络、代谢网络和信号转导网络等生物网络,研究基因之间的相互作用和调控关系。常用的网络分析方法包括共表达网络分析 (Co-expression Network Analysis)、蛋白质互作网络分析 (Protein-Protein Interaction Network Analysis) 和代谢网络分析 (Metabolic Network Analysis) 等。

▮▮▮▮ⓒ 计算建模 (Computational Modeling):计算建模是系统遗传学的重要工具。利用数学建模和计算生物学方法,可以构建生物系统的数学模型,模拟生物系统的动态行为,预测基因扰动或环境变化对生物系统的影响。常用的计算建模方法包括常微分方程模型 (Ordinary Differential Equation Model)、布尔网络模型 (Boolean Network Model) 和基于代理的模型 (Agent-Based Model) 等。

▮▮▮▮ⓓ 多组学整合分析 (Multi-omics Integration Analysis):多组学整合分析是系统遗传学的重要趋势。整合基因组学 (Genomics)、转录组学 (Transcriptomics)、蛋白质组学 (Proteomics)、代谢组学 (Metabolomics) 和表观遗传组学 (Epigenomics) 等多组学数据,可以从不同层面全面解析生物系统的复杂性,揭示基因与性状之间更深层次的关联。多组学整合分析有助于构建更全面、更精确的生物系统模型。

15.3.2 系统遗传学的应用 (Applications of System Genetics)

系统遗传学作为一门新兴的遗传学分支,在复杂性状遗传解析、基因网络构建和药物靶点发现等领域展现出重要的应用价值。

复杂性状遗传解析 (Genetic Analysis of Complex Traits):系统遗传学为解析复杂性状的遗传基础提供了新的理论和方法。通过整合高通量筛选、网络分析和计算建模等手段,可以鉴定与复杂性状相关的基因、基因变异和基因网络,揭示复杂性状的遗传结构和调控机制。例如,利用系统遗传学方法,可以研究人类复杂疾病 (如糖尿病、高血压、癌症等) 的遗传易感基因和风险因素,为疾病的预防、诊断和治疗提供理论基础。

基因网络构建与功能预测 (Gene Network Construction and Function Prediction):系统遗传学可以用于构建基因调控网络、代谢网络和信号转导网络等生物网络,研究基因之间的相互作用和调控关系。通过分析基因网络的结构和动态变化,可以预测基因的功能,揭示基因在生物学过程中的作用。例如,利用共表达网络分析方法,可以构建基因共表达网络,预测未知基因的功能,发现新的生物学通路和调控机制。

药物靶点发现与药物研发 (Drug Target Discovery and Drug Development):系统遗传学可以用于发现新的药物靶点,加速药物研发进程。通过分析疾病相关的基因网络和调控通路,可以鉴定关键的调控基因或节点,作为潜在的药物靶点。例如,利用系统遗传学方法,可以研究癌症的基因网络,发现新的癌基因或抑癌基因,作为抗癌药物的靶点;研究神经退行性疾病的基因网络,发现新的神经保护药物的靶点。系统遗传学还可以用于药物的个性化治疗研究,根据患者的基因网络特征,选择更有效的药物和治疗方案。

分子育种 (Molecular Breeding):系统遗传学在农业育种领域具有重要的应用价值。通过解析作物复杂农艺性状 (如产量、品质、抗逆性等) 的遗传基础和调控网络,可以鉴定与农艺性状相关的关键基因和基因变异,用于分子标记辅助选择 (Marker-Assisted Selection, MAS) 和基因组选择 (Genomic Selection, GS) 等分子育种技术,提高育种效率和改良作物品种。例如,利用系统遗传学方法,可以研究水稻产量性状的基因网络,鉴定高产基因和优良基因型,培育高产、优质、抗逆的新品种。

系统遗传学作为一门新兴的交叉学科,正处于快速发展阶段。随着高通量实验技术和计算生物学方法的不断进步,系统遗传学将在解析复杂性状的遗传基础、揭示生物系统的复杂性和动态性方面发挥越来越重要的作用,为生物医学、农业和工业等领域带来新的突破和机遇。

Appendix A: 遗传学常用术语中英对照 (Glossary of Genetics Terms in Chinese and English)

提供遗传学常用术语的中英对照,方便读者查阅和理解。

A
氨基酸 (Amino acid)
▮▮▮▮构成蛋白质的基本 building blocks (结构单元)。
等位基因 (Allele)
▮▮▮▮在同源染色体上占据相同基因座 (locus) 并控制同一性状的不同形式的基因。例如,豌豆的粒色基因有黄色等位基因和绿色等位基因。
退火 (Annealing)
▮▮▮▮在聚合酶链式反应 (PCR) 中,将温度降低以允许引物 (primer) 与 DNA 模板结合的步骤。
自体 (Autosome)
▮▮▮▮非性染色体 (sex chromosome) 的染色体,在二倍体细胞中,常染色体成对存在。人类有 22 对常染色体。

B
碱基 (Base)
▮▮▮▮核酸 (nucleic acid) 的组成部分,包括嘌呤 (purine) (腺嘌呤 (adenine, A) 和鸟嘌呤 (guanine, G)) 和嘧啶 (pyrimidine) (胞嘧啶 (cytosine, C)、胸腺嘧啶 (thymine, T) 和尿嘧啶 (uracil, U))。
碱基配对 (Base pairing)
▮▮▮▮DNA 双螺旋结构中,特定碱基之间形成的氢键连接。腺嘌呤 (A) 与胸腺嘧啶 (T) 配对,鸟嘌呤 (G) 与胞嘧啶 (C) 配对 (A-T, G-C)。在 RNA 中,腺嘌呤 (A) 与尿嘧啶 (U) 配对 (A-U)。
生物信息学 (Bioinformatics)
▮▮▮▮一个交叉学科,运用计算机科学、统计学和数学方法来分析生物数据,特别是基因组学和蛋白质组学数据。
生物技术 (Biotechnology)
▮▮▮▮利用生物系统、生物体或其衍生物来开发或制造产品,或用于特定用途的技术。例如,基因工程、基因治疗等。

C
癌基因 (Oncogene)
▮▮▮▮起源于原癌基因 (proto-oncogene),突变后能促进细胞异常增殖,导致癌症发生的基因。
细胞周期 (Cell cycle)
▮▮▮▮细胞从一次分裂结束到下一次分裂开始的完整生命周期,包括间期 (interphase) 和分裂期 (M phase)。
细胞分化 (Cell differentiation)
▮▮▮▮细胞在发育过程中,形态、结构和功能变得特化的过程。
中心法则 (Central dogma)
▮▮▮▮分子生物学的核心理论,描述遗传信息从 DNA 流向 RNA,再从 RNA 流向蛋白质的过程,即 DNA → RNA → 蛋白质 (Protein)
着丝粒 (Centromere)
▮▮▮▮染色体上连接姐妹染色单体 (sister chromatid) 的区域,在细胞分裂时是纺锤丝 (spindle fiber) 附着的位置。
染色体 (Chromosome)
▮▮▮▮细胞核内携带遗传信息的结构,由 DNA 和蛋白质组成。真核生物的染色体呈线状,原核生物的染色体通常呈环状。
染色体畸变 (Chromosome aberration)
▮▮▮▮染色体结构或数目的异常变异,包括缺失 (deletion)、重复 (duplication)、倒位 (inversion)、易位 (translocation) 和非整倍体 (aneuploidy) 等。
顺式作用元件 (cis-acting element)
▮▮▮▮DNA 序列上的调控区域,通常位于被调控基因的附近,影响同一染色体上基因的表达。例如,启动子 (promoter)、增强子 (enhancer) 等。
克隆 (Clone)
▮▮▮▮指来源于同一个祖先细胞或个体的,遗传上相同的细胞、DNA 片段或个体群体。
密码子 (Codon)
▮▮▮▮mRNA 序列中由三个核苷酸组成的基本单位,每种密码子编码一个特定的氨基酸或终止信号。
共显性 (Codominance)
▮▮▮▮杂合子 (heterozygote) 同时表达来自两个亲本的等位基因 (allele) 表型的现象。例如,AB 血型。
复杂性状 (Complex trait)
▮▮▮▮受多个基因和环境因素共同影响的性状,也称为数量性状 (quantitative trait)。例如,身高、体重、血压等。
互补 (Complementary)
▮▮▮▮在 DNA 双螺旋结构中,两条链的碱基序列相互对应,能够通过碱基配对原则结合。例如,一条链的序列为 5'-ATGC-3',则互补链的序列为 3'-TACG-5'。
cDNA (cDNA)
▮▮▮▮互补 DNA (complementary DNA) 的缩写,指以 mRNA 为模板,通过逆转录酶 (reverse transcriptase) 合成的 DNA 分子,不包含内含子 (intron)。

D
缺失 (Deletion)
▮▮▮▮染色体或 DNA 序列中一部分丢失的突变。
脱氧核糖核酸 (Deoxyribonucleic acid, DNA)
▮▮▮▮携带遗传信息的生物大分子,由脱氧核糖、磷酸基团和碱基 (腺嘌呤 (A)、鸟嘌呤 (G)、胞嘧啶 (C)、胸腺嘧啶 (T)) 组成的双螺旋结构。
二倍体 (Diploid)
▮▮▮▮具有两套染色体组 (chromosome set) 的细胞或生物体,每对同源染色体分别来自双亲。
显性 (Dominant)
▮▮▮▮指杂合子 (heterozygote) 中,某个等位基因 (allele) 的表型 (phenotype) 能够掩盖另一个等位基因的表型,从而在表型上只表现出该等位基因的作用。
剂量补偿效应 (Dosage compensation)
▮▮▮▮不同性别之间,由于性染色体 (sex chromosome) 数目差异而造成的基因剂量差异,通过一定的机制进行补偿,使得两性之间性染色体上的基因表达量趋于一致的现象。
重复 (Duplication)
▮▮▮▮染色体或 DNA 序列中一部分重复出现的突变。

E
外显子 (Exon)
▮▮▮▮真核生物基因中,转录后保留在成熟 mRNA 分子中的 DNA 序列,编码蛋白质的序列。
基因表达 (Gene expression)
▮▮▮▮细胞利用基因信息合成功能性 RNA 或蛋白质分子的过程,包括转录 (transcription) 和翻译 (translation) 两个主要步骤。
延伸 (Elongation)
▮▮▮▮在 DNA 复制 (DNA replication)、转录 (transcription) 和翻译 (translation) 过程中,将核苷酸或氨基酸逐个添加到新合成链上的步骤。
增强子 (Enhancer)
▮▮▮▮真核生物基因调控区中的 DNA 序列,能够增强基因的转录活性,通常位于启动子 (promoter) 远端,可以作用于同一或不同染色体上的基因。
表观遗传学 (Epigenetics)
▮▮▮▮研究在 DNA 序列不发生改变的情况下,基因表达和细胞表型发生可遗传变异的学科,主要机制包括 DNA 甲基化 (DNA methylation)、组蛋白修饰 (histone modification) 和非编码 RNA (non-coding RNA) 调控等。
真核生物 (Eukaryote)
▮▮▮▮具有细胞核 (nucleus) 和其他膜结合细胞器 (membrane-bound organelle) 的生物,包括动物、植物、真菌和原生生物。
进化 (Evolution)
▮▮▮▮生物种群在世代之间发生的遗传性状改变的过程,是自然选择 (natural selection)、突变 (mutation)、基因流 (gene flow) 和遗传漂变 (genetic drift) 等因素共同作用的结果。

F
基因频率 (Gene frequency)
▮▮▮▮在群体 (population) 的基因库 (gene pool) 中,特定等位基因 (allele) 出现的相对频率。
基因流 (Gene flow)
▮▮▮▮不同群体之间基因的交换,通常通过个体迁移和杂交实现。
基因组 (Genome)
▮▮▮▮一个生物体或病毒所包含的全部遗传物质的总和,通常指单倍体细胞中的 DNA 总量。
基因组学 (Genomics)
▮▮▮▮研究生物体基因组的结构、功能、进化和图谱的学科。
基因型 (Genotype)
▮▮▮▮个体所携带的特定基因的等位基因 (allele) 组合。
基因 (Gene)
▮▮▮▮携带遗传信息的功能单位,通常指编码蛋白质或 RNA 分子的 DNA 序列。
基因工程 (Genetic engineering)
▮▮▮▮在分子水平上对基因进行操作的技术,包括基因克隆 (gene cloning)、基因编辑 (gene editing)、转基因 (transgenic) 技术等。
遗传漂变 (Genetic drift)
▮▮▮▮由于随机抽样误差,导致群体 (population) 中基因频率 (gene frequency) 发生随机波动的现象,在小群体中尤为显著。
遗传咨询 (Genetic counseling)
▮▮▮▮为个人或家庭提供关于遗传病 (genetic disorder) 风险、诊断、预防和治疗等方面信息的服务。
遗传密码 (Genetic code)
▮▮▮▮密码子 (codon) 与氨基酸 (amino acid) 之间的对应关系,决定了 mRNA 序列如何翻译成蛋白质序列。
遗传病 (Genetic disorder)
▮▮▮▮由基因突变 (gene mutation) 或染色体异常 (chromosome aberration) 引起的疾病。
遗传力 (Heritability)
▮▮▮▮在特定群体和环境下,表型变异 (phenotypic variation) 中由遗传因素引起的比例。
杂合子 (Heterozygote)
▮▮▮▮对于某个基因而言,携带两个不同等位基因 (allele) 的个体。
同源染色体 (Homologous chromosome)
▮▮▮▮二倍体细胞中,形态、结构和基因组成相似,分别来自双亲的两条染色体。
纯合子 (Homozygote)
▮▮▮▮对于某个基因而言,携带两个相同等位基因 (allele) 的个体。

I
内含子 (Intron)
▮▮▮▮真核生物基因中,转录后被剪切掉,不包含在成熟 mRNA 分子中的 DNA 序列。
倒位 (Inversion)
▮▮▮▮染色体中一段 DNA 序列方向颠倒的染色体畸变 (chromosome aberration)。
插入 (Insertion)
▮▮▮▮染色体或 DNA 序列中插入一段额外的 DNA 序列的突变。

L
基因座 (Locus)
▮▮▮▮基因在染色体上的位置。

M
减数分裂 (Meiosis)
▮▮▮▮产生配子 (gamete) 的细胞分裂方式,使子细胞的染色体数目减半。
孟德尔遗传 (Mendelian genetics)
▮▮▮▮基于孟德尔遗传定律 (Mendel's laws of inheritance) 的经典遗传学分支,研究基因的传递规律。
信使 RNA (Messenger RNA, mRNA)
▮▮▮▮将 DNA 上的遗传信息携带到核糖体 (ribosome) 的 RNA 分子,作为蛋白质合成的模板。
代谢组学 (Metabolomics)
▮▮▮▮系统研究生物体内所有代谢物 (metabolite) 的学科。
甲基化 (Methylation)
▮▮▮▮将甲基 (methyl group, -CH3) 添加到分子上的化学修饰过程,例如 DNA 甲基化 (DNA methylation) 和组蛋白甲基化 (histone methylation)。
线粒体 (Mitochondria)
▮▮▮▮真核细胞中产生能量的细胞器,具有双层膜结构,含有自身的 DNA (mtDNA)。
有丝分裂 (Mitosis)
▮▮▮▮体细胞 (somatic cell) 分裂的方式,产生两个与母细胞遗传信息完全相同的子细胞。
分子遗传学 (Molecular genetics)
▮▮▮▮从分子水平研究基因的结构、功能、表达和调控的遗传学分支。
突变 (Mutation)
▮▮▮▮遗传物质 (DNA 或 RNA) 序列发生的永久性改变。

N
自然选择 (Natural selection)
▮▮▮▮进化 (evolution) 的主要机制,指在生存竞争中,具有有利变异的个体更容易生存和繁殖,从而使其有利性状在群体中积累的现象。
核酸 (Nucleic acid)
▮▮▮▮携带遗传信息的生物大分子,包括 DNA (脱氧核糖核酸) 和 RNA (核糖核酸)。
核苷酸 (Nucleotide)
▮▮▮▮核酸 (nucleic acid) 的基本组成单位,由一个磷酸基团 (phosphate group)、一个五碳糖 (pentose sugar) (脱氧核糖或核糖) 和一个含氮碱基 (nitrogenous base) 组成。
细胞核 (Nucleus)
▮▮▮▮真核细胞中含有遗传物质 DNA 的膜结合细胞器。

O
操纵子 (Operon)
▮▮▮▮原核生物基因表达调控的一种单位,由启动子 (promoter)、操纵基因 (operator) 和结构基因 (structural gene) 组成,调控多个结构基因的协同表达。
个体基因组学 (Personalized genomics)
▮▮▮▮根据个体的基因组信息,为疾病预防、诊断和治疗提供个性化方案的基因组学应用。
表型 (Phenotype)
▮▮▮▮个体表现出来的可观测的性状特征,是基因型 (genotype) 与环境相互作用的结果。
磷酸二酯键 (Phosphodiester bond)
▮▮▮▮连接核苷酸 (nucleotide) 之间磷酸基团和糖分子的化学键,构成核酸 (nucleic acid) 骨架。
质粒 (Plasmid)
▮▮▮▮细菌细胞中独立于染色体 DNA 之外的环状 DNA 分子,常用于基因工程 (genetic engineering) 中作为载体 (vector)。
群体 (Population)
▮▮▮▮在一定时间和空间内,同种生物个体的集合,能够相互交配并产生后代。
群体遗传学 (Population genetics)
▮▮▮▮研究群体 (population) 中基因和基因型频率 (genotype frequency) 的变化规律,以及影响这些变化的因素的遗传学分支。
启动子 (Promoter)
▮▮▮▮基因上游的 DNA 序列,是 RNA 聚合酶 (RNA polymerase) 结合和起始转录 (transcription) 的区域。
蛋白质 (Protein)
▮▮▮▮由氨基酸 (amino acid) 通过肽键 (peptide bond) 连接形成的高分子化合物,是生命活动的主要承担者。
蛋白质组学 (Proteomics)
▮▮▮▮系统研究生物体或细胞内所有蛋白质的组成、结构、功能和相互作用的学科。
原核生物 (Prokaryote)
▮▮▮▮不具有细胞核 (nucleus) 和其他膜结合细胞器 (membrane-bound organelle) 的生物,包括细菌和古菌。
数量性状基因座 (Quantitative trait locus, QTL)
▮▮▮▮与数量性状 (quantitative trait) 变异相关的基因组区域。
数量遗传学 (Quantitative genetics)
▮▮▮▮研究数量性状 (quantitative trait) 的遗传基础和变异规律的遗传学分支。

R
隐性 (Recessive)
▮▮▮▮指杂合子 (heterozygote) 中,某个等位基因 (allele) 的表型 (phenotype) 被另一个显性等位基因掩盖,只有在纯合状态 (纯合隐性) 时才能表现出来。
重组 DNA 技术 (Recombinant DNA technology)
▮▮▮▮在体外将不同来源的 DNA 片段切割、连接,构建重组 DNA 分子,并将其导入宿主细胞进行复制和表达的技术,也称为基因克隆技术 (gene cloning technology)。
复制 (Replication)
▮▮▮▮细胞复制自身 DNA 分子的过程,保证遗传信息在细胞分裂时能够准确传递给子细胞。
限制性内切酶 (Restriction enzyme)
▮▮▮▮能够识别和切割 DNA 分子特定序列的酶,是重组 DNA 技术 (recombinant DNA technology) 的重要工具。
核糖核酸 (Ribonucleic acid, RNA)
▮▮▮▮参与基因表达的核酸 (nucleic acid) 分子,单链结构,由核糖、磷酸基团和碱基 (腺嘌呤 (A)、鸟嘌呤 (G)、胞嘧啶 (C)、尿嘧啶 (U)) 组成。
核糖体 RNA (Ribosomal RNA, rRNA)
▮▮▮▮构成核糖体 (ribosome) 的 RNA 分子,在蛋白质合成 (protein synthesis) 中起重要作用。
核糖体 (Ribosome)
▮▮▮▮细胞内合成蛋白质的细胞器,由 rRNA (核糖体 RNA) 和蛋白质组成。
RNA 聚合酶 (RNA polymerase)
▮▮▮▮催化 RNA 合成的酶,以 DNA 为模板,按照 DNA 序列合成 RNA 分子。
RNA 干扰 (RNA interference, RNAi)
▮▮▮▮由小 RNA 分子 (如 siRNA 和 miRNA) 介导的基因沉默 (gene silencing) 机制。

S
分离定律 (Law of segregation)
▮▮▮▮孟德尔遗传定律 (Mendel's laws of inheritance) 之一,指杂合子 (heterozygote) 产生配子 (gamete) 时,成对的等位基因 (allele) 分离,分别进入不同的配子中。
半保留复制 (Semi-conservative replication)
▮▮▮▮DNA 复制 (DNA replication) 的模式,新合成的 DNA 分子由一条亲代链和一条新合成的子代链组成。
测序 (Sequencing)
▮▮▮▮确定 DNA 或 RNA 分子碱基序列的技术。
性染色体 (Sex chromosome)
▮▮▮▮决定生物体性别的染色体,例如人类的 X 染色体和 Y 染色体。
小干扰 RNA (Small interfering RNA, siRNA)
▮▮▮▮一类小的双链 RNA 分子,能够诱导 RNA 干扰 (RNA interference, RNAi),导致靶 mRNA 降解,从而实现基因沉默 (gene silencing)。
剪接 (Splicing)
▮▮▮▮真核生物 mRNA 前体 (pre-mRNA) 加工过程中的一步,将内含子 (intron) 剪切掉,并将外显子 (exon) 连接起来形成成熟 mRNA 分子。
起始密码子 (Start codon)
▮▮▮▮mRNA 序列中起始翻译 (translation) 的密码子,通常是 AUG,编码甲硫氨酸 (methionine)。
干细胞 (Stem cell)
▮▮▮▮具有自我更新 (self-renewal) 和多向分化潜能 (pluripotency) 的细胞,能够分化成多种类型的细胞。
终止密码子 (Stop codon)
▮▮▮▮mRNA 序列中终止翻译 (translation) 的密码子,包括 UAA、UAG 和 UGA,不编码氨基酸,而是释放蛋白质。
结构基因 (Structural gene)
▮▮▮▮编码蛋白质或 RNA 分子的基因。
突变体 (Mutant)
▮▮▮▮携带突变 (mutation) 的个体或细胞。
合成生物学 (Synthetic biology)
▮▮▮▮一门新兴的交叉学科,运用工程学原理设计和构建新的生物系统或生物部件,或重新设计已有的生物系统,以实现特定功能。
系统遗传学 (System genetics)
▮▮▮▮从系统水平研究遗传现象的学科,综合运用遗传学、基因组学、生物信息学和系统生物学等方法,解析复杂性状的遗传基础和基因调控网络。

T
端粒 (Telomere)
▮▮▮▮真核生物线状染色体末端的特殊结构,由重复 DNA 序列和蛋白质组成,具有维持染色体稳定性和完整性的作用。
终止子 (Terminator)
▮▮▮▮DNA 序列中终止转录 (transcription) 的信号。
转基因 (Transgenic)
▮▮▮▮指生物体的基因组中插入了外源基因 (foreign gene) 的状态。
转录 (Transcription)
▮▮▮▮以 DNA 为模板合成 RNA 分子的过程。
转录因子 (Transcription factor)
▮▮▮▮一类能够结合到 DNA 特定序列,调控基因转录 (transcription) 的蛋白质。
翻译 (Translation)
▮▮▮▮以 mRNA 为模板,将 mRNA 上的遗传信息翻译成蛋白质氨基酸序列的过程。
易位 (Translocation)
▮▮▮▮染色体之间或染色体内部片段位置发生交换的染色体畸变 (chromosome aberration)。
转移 RNA (Transfer RNA, tRNA)
▮▮▮▮在蛋白质合成 (protein synthesis) 中,携带特定氨基酸到核糖体 (ribosome) 的 RNA 分子,根据 mRNA 密码子 (codon) 将氨基酸添加到肽链上。
肿瘤抑制基因 (Tumor suppressor gene)
▮▮▮▮抑制细胞异常增殖,防止肿瘤发生的基因,突变失活后可能导致癌症发生。

U
尿嘧啶 (Uracil, U)
▮▮▮▮RNA 中特有的嘧啶碱基 (pyrimidine base),取代了 DNA 中的胸腺嘧啶 (thymine, T),在 RNA 中与腺嘌呤 (A) 配对 (A-U)。

V
载体 (Vector)
▮▮▮▮在基因工程 (genetic engineering) 中,用于将外源 DNA 片段导入宿主细胞的 DNA 分子,例如质粒 (plasmid)、噬菌体 (bacteriophage)、病毒载体 (viral vector) 等。

W
全基因组关联分析 (Genome-wide association study, GWAS)
▮▮▮▮一种在全基因组范围内,寻找与复杂性状 (complex trait) 或疾病相关的遗传变异 (genetic variation) 的研究方法。

X
X 连锁遗传 (X-linked inheritance)
▮▮▮▮位于 X 染色体上的基因的遗传方式。

Y
Y 连锁遗传 (Y-linked inheritance)
▮▮▮▮位于 Y 染色体上的基因的遗传方式。

Z
合子 (Zygote)
▮▮▮▮精子 (sperm) 和卵细胞 (egg cell) 结合形成的受精卵,是二倍体生物发育的起点。

Appendix B: 遗传学重要人物与时间线 (Timeline of Important Figures and Events in Genetics)

Appendix B1: 遗传学发展时间线 (Timeline of Genetics Development)

1859年:查尔斯·达尔文 (Charles Darwin) 出版《物种起源》(On the Origin of Species) 📖,提出自然选择学说,为遗传学研究提供了进化论的视角。
1865年:格雷 Gregor Mendel 孟德尔发表《植物杂交实验》(Experiments on Plant Hybridization) 🌿,阐述了豌豆杂交实验的结果,提出了遗传的分离定律和自由组合定律,奠定了经典遗传学的基础。然而,当时他的工作并未受到重视。
1869年:弗里德里希·米歇尔 (Friedrich Miescher) 首次分离出核酸 (nucleic acid) 🧪,他将其命名为“核素 (nuclein)”,为后来DNA被确认为遗传物质奠定了基础。
1900年:孟德尔定律的“再发现” 💡。由雨果·德弗里斯 (Hugo de Vries)、卡尔·柯伦斯 (Carl Correns) 和埃里希·冯·切尔马克 (Erich von Tschermak) 三位科学家各自独立地重新发现了孟德尔的论文,证实了孟德尔定律的普遍适用性,标志着遗传学的正式诞生。
1902年:瓦尔特·萨顿 (Walter Sutton) 和 特奥多尔·博韦里 (Theodor Boveri) 分别独立提出染色体学说 (chromosome theory of inheritance) 🧬,认为基因位于染色体上,孟德尔定律的遗传因子就是染色体上的基因。
1905年:威廉·贝特森 (William Bateson) 创造了 “遗传学 (genetics)” 术语 ✍️,并积极推广孟德尔的遗传学理论。
1910年:托马斯·亨特·摩尔根 (Thomas Hunt Morgan) 及其同事在果蝇实验中发现了连锁和交换现象 🪰,进一步支持了染色体学说,并绘制了世界上第一张染色体图谱。
1918年:罗纳德·费舍尔 (Ronald Fisher) 发表论文,整合了孟德尔遗传学和生物统计学 📊,为群体遗传学的发展奠定了数学基础。
1928年:弗雷德里克·格里菲思 (Frederick Griffith) 的肺炎球菌转化实验 🦠, 证明了存在“转化因子 (transforming principle)”,可以将一种细菌的遗传特性传递给另一种细菌,暗示了DNA可能是遗传物质。
1944年:奥斯瓦尔德·埃弗里 (Oswald Avery)、科林·麦克劳德 (Colin MacLeod) 和麦克林·麦卡蒂 (Maclyn McCarty) 的实验 🔬 进一步证明DNA是格里菲思实验中的“转化因子”,直接证据表明DNA是遗传物质。
1953年:詹姆斯·沃森 (James Watson) 和弗朗西斯·克里克 (Francis Crick) 在罗莎琳德·富兰克林 (Rosalind Franklin) 和莫里斯·威尔金斯 (Maurice Wilkins) 的X射线衍射数据基础上,提出了DNA双螺旋结构模型 🧬<0xF0><0x9F><0xA7><0xAA>,揭示了遗传物质的分子结构,被誉为20世纪生物学最伟大的发现之一。
1958年:马修·梅瑟森 (Matthew Meselson) 和富兰克林·斯塔尔 (Franklin Stahl) 通过实验 🧪 证实了DNA复制的半保留复制 (semi-conservative replication) 机制。
1961年:弗朗西斯·克里克 (Francis Crick) 和西德尼·布伦纳 (Sydney Brenner) 等人 破译了遗传密码 (genetic code) 🔑,阐明了DNA序列如何编码蛋白质氨基酸序列。
1961年:雅克·莫诺 (Jacques Monod) 和弗朗索瓦·雅各布 (François Jacob) 提出了操纵子模型 (operon model) ⚙️,解释了细菌基因表达的调控机制。
1970年:发现逆转录酶 (reverse transcriptase) enzyme 酶 🔄,由霍华德·马丁·特明 (Howard Martin Temin) 和大卫·巴尔的摩 (David Baltimore) 分别独立发现, 颠覆了中心法则 (central dogma) 中遗传信息单向流动的传统观念。
1973年:重组DNA技术 (recombinant DNA technology) 诞生 🧬✂️,斯坦利·科恩 (Stanley Cohen) 和赫伯特·博耶 (Herbert Boyer) 成功将来自不同生物的DNA片段在体外重组,并导入细菌中进行复制,开启了基因工程 (genetic engineering) 的时代。
1977年:DNA测序技术 (DNA sequencing technology) 取得突破 🧪<0xF0><0x9F><0xA7><0xAA>,弗雷德里克·桑格 (Frederick Sanger) 和沃尔特·吉尔伯特 (Walter Gilbert) 分别发明了链终止法和化学降解法DNA测序技术,使得快速读取DNA序列成为可能。
1983年:聚合酶链式反应 (PCR) 技术 🔬🔥 由凯利·穆利斯 (Kary Mullis) 发明,极大地提高了DNA扩增的效率和速度,成为分子生物学研究和应用的强大工具。
1990年:人类基因组计划 (Human Genome Project, HGP) 正式启动 🗺️,旨在测定人类基因组的全部DNA序列,由国际科学家合作进行。
1995年:完成第一个生物体基因组测序 (genome sequencing) 🦠,嗜血杆菌流感杆菌 ( Haemophilus influenzae ) 的基因组序列被完整测出,标志着基因组学时代的到来。
1997年:克隆羊多莉 (Dolly) 🐑 诞生,是第一个通过体细胞核移植技术克隆成功的哺乳动物,引发了关于克隆技术和伦理的广泛讨论。
2003年:人类基因组计划 (HGP) 完成 🏁,人类基因组序列草图完成图发布,为理解人类疾病、发育和进化奠定了基础。
2006年:诱导多能干细胞 (induced pluripotent stem cells, iPSCs) 技术 🔄🌱 由山中伸弥 (Shinya Yamanaka) 团队发明,可以将成体细胞重编程为多能干细胞,为再生医学和疾病研究带来了革命性进展。
2012年:CRISPR-Cas9基因编辑技术 ✂️<0xF0><0x9F><0xA7><0xAA> 快速发展,成为一种高效、精确的基因编辑工具,被广泛应用于基因功能研究、疾病治疗和农业育种等领域。
2020年至今:表观遗传学 (epigenetics)、单细胞组学 (single-cell omics)、合成生物学 (synthetic biology)、系统遗传学 (system genetics) 等领域蓬勃发展 🚀,遗传学研究不断深入,并与其他学科交叉融合,持续推动生命科学的进步。

Appendix B2: 遗传学重要人物 (Important Figures in Genetics)

格雷 Gregor Mendel 孟德尔 (1822-1884):奥地利遗传学家,被誉为“遗传学之父 (Father of Genetics)”👨‍🏫,通过豌豆杂交实验发现了遗传的分离定律和自由组合定律,奠定了经典遗传学的基础。
查尔斯·达尔文 Charles Darwin (1809-1882):英国生物学家,进化论的奠基人 🐒,提出自然选择学说,对遗传学的发展产生了深远的影响。他的著作《物种起源》为遗传变异和进化提供了理论框架。
弗里德里希·米歇尔 Friedrich Miescher (1844-1895):瑞士生物化学家,首次分离出核酸 (nucleic acid) 🧪,为DNA作为遗传物质的发现奠定了化学基础。
托马斯·亨特·摩尔根 Thomas Hunt Morgan (1866-1945):美国遗传学家、胚胎学家,染色体学说的主要倡导者之一 🪰,通过果蝇实验验证了染色体学说,发现了连锁和交换现象,并绘制了染色体图谱,荣获1933年诺贝尔生理学或医学奖。
罗莎琳德·富兰克林 Rosalind Franklin (1920-1958):英国物理化学家、晶体学家,使用X射线衍射技术拍摄了DNA的B型结构的清晰照片(照片51号) 📸,为沃森和克里克建立DNA双螺旋结构模型提供了关键的实验证据。
詹姆斯·沃森 James Watson (1928-):美国分子生物学家,与弗朗西斯·克里克共同发现了DNA双螺旋结构 🧬<0xF0><0x9F><0xA7><0xAA>,荣获1962年诺贝尔生理学或医学奖。
弗朗西斯·克里克 Francis Crick (1916-2004):英国分子生物学家、物理学家,与詹姆斯·沃森共同发现了DNA双螺旋结构,并提出了中心法则 (central dogma) 📜,荣获1962年诺贝尔生理学或医学奖。
弗雷德里克·桑格 Frederick Sanger (1918-2013):英国生物化学家,发明了DNA测序技术 (Sanger sequencing) 🧪<0xF0><0x9F><0xA7><0xAA>,使得快速读取DNA序列成为可能,荣获1980年诺贝尔化学奖(第二次诺贝尔奖,第一次为1958年化学奖,因蛋白质结构研究)。
凯利·穆利斯 Kary Mullis (1944-2019):美国生物化学家,发明了聚合酶链式反应 (PCR) 技术 🔬🔥,极大地推动了分子生物学和遗传学研究,荣获1993年诺贝尔化学奖。
山中伸弥 Shinya Yamanaka (1962-):日本干细胞生物学家,发明了诱导多能干细胞 (iPSCs) 技术 🔄🌱,为再生医学和疾病研究开辟了新方向,荣获2012年诺贝尔生理学或医学奖。
埃玛纽埃尔·卡彭蒂耶 Emmanuelle Charpentier (1968-):法国微生物学家、遗传学家、生物化学家,与詹妮弗·杜德纳共同开发了CRISPR-Cas9基因编辑技术 ✂️<0xF0><0x9F><0xA7><0xAA>,荣获2020年诺贝尔化学奖。
詹妮弗·杜德纳 Jennifer Doudna (1964-):美国生物化学家、分子生物学家,与埃玛纽埃尔·卡彭蒂耶共同开发了CRISPR-Cas9基因编辑技术,荣获2020年诺贝尔化学奖。

Appendix B3: 遗传学重要事件 (Important Events in Genetics)

孟德尔定律的发现 (1865):格雷 Gregor Mendel 孟德尔发表豌豆杂交实验结果,提出遗传分离定律和自由组合定律,奠定经典遗传学基础。
孟德尔定律的再发现 (1900):雨果·德弗里斯 (Hugo de Vries)、卡尔·柯伦斯 (Carl Correns) 和埃里希·冯·切尔马克 (Erich von Tschermak) 独立重新发现孟德尔定律,遗传学正式诞生。
染色体学说的提出 (1902):瓦尔特·萨顿 (Walter Sutton) 和 特奥多尔·博韦里 (Theodor Boveri) 分别独立提出染色体学说,认为基因位于染色体上。
“遗传学 (genetics)” 术语的创造 (1905):威廉·贝特森 (William Bateson) 创造 “遗传学 (genetics)” 术语,推广孟德尔遗传学。
连锁和交换的发现 (1910):托马斯·亨特·摩尔根 (Thomas Hunt Morgan) 团队在果蝇实验中发现连锁和交换现象,支持染色体学说。
DNA是遗传物质的证据 (1944):奥斯瓦尔德·埃弗里 (Oswald Avery)、科林·麦克劳德 (Colin MacLeod) 和麦克林·麦卡蒂 (Maclyn McCarty) 的实验直接证明DNA是遗传物质。
DNA双螺旋结构的发现 (1953):詹姆斯·沃森 (James Watson) 和弗朗西斯·克里克 (Francis Crick) 提出DNA双螺旋结构模型,揭示遗传物质的分子结构。
半保留复制的证实 (1958):马修·梅瑟森 (Matthew Meselson) 和富兰克林·斯塔尔 (Franklin Stahl) 实验证实DNA复制的半保留复制机制。
遗传密码的破译 (1961):弗朗西斯·克里克 (Francis Crick) 和西德尼·布伦纳 (Sydney Brenner) 等人破译遗传密码,阐明DNA序列如何编码蛋白质。
操纵子模型的提出 (1961):雅克·莫诺 (Jacques Monod) 和弗朗索瓦·雅各布 (François Jacob) 提出操纵子模型,解释细菌基因表达调控机制。
逆转录酶的发现 (1970):霍华德·马丁·特明 (Howard Martin Temin) 和大卫·巴尔的摩 (David Baltimore) 分别独立发现逆转录酶,挑战中心法则。
重组DNA技术的诞生 (1973):斯坦利·科恩 (Stanley Cohen) 和赫伯特·博耶 (Herbert Boyer) 成功创建重组DNA技术,开启基因工程时代。
DNA测序技术的突破 (1977):弗雷德里克·桑格 (Frederick Sanger) 和沃尔特·吉尔伯特 (Walter Gilbert) 分别发明DNA测序技术,实现快速读取DNA序列。
PCR技术的发明 (1983):凯利·穆利斯 (Kary Mullis) 发明PCR技术,极大地提高DNA扩增效率。
人类基因组计划启动 (1990):人类基因组计划 (HGP) 正式启动,旨在测定人类基因组全部DNA序列。
首个生物体基因组测序完成 (1995):嗜血杆菌流感杆菌 ( Haemophilus influenzae ) 基因组序列被完整测出,基因组学时代到来。
克隆羊多莉诞生 (1997):克隆羊多莉诞生,首个体细胞核移植克隆哺乳动物。
人类基因组计划完成 (2003):人类基因组计划 (HGP) 完成,人类基因组序列草图完成图发布。
诱导多能干细胞技术发明 (2006):山中伸弥 (Shinya Yamanaka) 团队发明诱导多能干细胞 (iPSCs) 技术,成体细胞重编程为多能干细胞。
CRISPR-Cas9基因编辑技术快速发展 (2012):CRISPR-Cas9基因编辑技术快速发展,成为高效基因编辑工具。

Appendix C: 遗传学在线资源与工具 (Online Resources and Tools for Genetics)

Appendix C1: 遗传学数据库 (Genetics Databases)

推荐常用的遗传学在线数据库,这些数据库是进行遗传学研究和学习的重要信息来源。它们涵盖了基因组信息、蛋白质信息、疾病相关基因、遗传变异等 разнообразные 数据,为科研人员和学生提供了强大的数据支持。

Appendix C1.1: 综合性数据库 (Comprehensive Databases)

NCBI (美国国家生物技术信息中心) (National Center for Biotechnology Information): https://www.ncbi.nlm.nih.gov/
▮▮▮▮ⓑ 描述: NCBI 是一个综合性的生物医学信息数据库中心,提供包括 GenBank (基因序列数据库), PubMed (生物医学文献数据库), dbSNP (单核苷酸多态性数据库), Gene (基因信息数据库), Protein (蛋白质序列数据库), OMIM (人类孟德尔遗传在线) 等多个重要数据库。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 序列信息: 提供海量的 DNA 和蛋白质序列信息,可以进行序列检索、比对和分析。
▮▮▮▮▮▮▮▮❺ 文献检索: PubMed 提供全面的生物医学文献检索服务,可以查找遗传学相关的研究论文。
▮▮▮▮▮▮▮▮❻ 基因与疾病信息: OMIM 数据库详细记录了人类遗传疾病和相关基因的信息。
▮▮▮▮ⓖ 适用对象: 所有读者,从初学者到专家,都是进行遗传学研究和学习的必备资源。

Ensembl: https://www.ensembl.org/
▮▮▮▮ⓑ 描述: Ensembl 是一个专注于真核生物基因组注释的数据库,提供高质量的基因组注释信息,包括基因结构、转录本、蛋白质、调控元件等。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 基因组浏览器: 提供强大的基因组浏览器,可以可视化基因组数据,查看基因结构、变异、调控信息等。
▮▮▮▮▮▮▮▮❺ 比较基因组学: 支持多个物种的基因组比较分析,帮助研究基因的进化和功能。
▮▮▮▮▮▮▮▮❻ 数据下载: 提供基因组注释数据的下载,方便用户进行本地分析。
▮▮▮▮ⓖ 适用对象: 侧重于基因组学研究的读者,特别是需要深入了解真核生物基因组结构的学者。

UCSC Genome Browser (加州大学圣克鲁兹基因组浏览器): https://genome.ucsc.edu/
▮▮▮▮ⓑ 描述: UCSC Genome Browser 是另一个著名的基因组浏览器,以其用户友好的界面和丰富的注释信息而闻名。它整合了多种基因组数据,并提供了强大的可视化工具。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 基因组可视化: 提供直观的基因组可视化界面,用户可以轻松浏览基因组区域,查看基因、转录本、调控元件、变异等信息。
▮▮▮▮▮▮▮▮❺ 自定义 Tracks: 允许用户上传自定义数据 (tracks) 进行可视化,方便整合和分析自己的研究数据。
▮▮▮▮▮▮▮▮❻ 数据下载: 提供基因组数据和注释信息的下载。
▮▮▮▮ⓖ 适用对象: 适合需要进行基因组数据可视化和分析的读者,特别是对人类基因组感兴趣的研究者。

Appendix C1.2: 基因与基因组数据库 (Gene and Genome Databases)

GeneCards: https://www.genecards.org/
▮▮▮▮ⓑ 描述: GeneCards 是一个全面、权威的人类基因数据库,提供关于人类基因的综合信息,包括基因功能、蛋白质信息、疾病关联、通路、表达谱、文献等。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 基因信息查询: 可以通过基因名称、基因符号、疾病名称等关键词查询基因的详细信息。
▮▮▮▮▮▮▮▮❺ 基因功能注释: 提供基因的功能描述、GO 注释、通路信息等。
▮▮▮▮▮▮▮▮❻ 疾病关联: 关联基因与疾病的信息,方便研究疾病的遗传基础。
▮▮▮▮ⓖ 适用对象: 专注于人类基因功能和疾病关联研究的读者。

miRBase (microRNA 数据库): http://www.mirbase.org/
▮▮▮▮ⓑ 描述: miRBase 是一个专门收集和注释 microRNA (miRNA) 序列和注释信息的数据库。miRNA 是一类重要的非编码 RNA,在基因表达调控中发挥重要作用。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ miRNA 序列信息: 提供 miRNA 的序列、成熟序列、前体序列等信息。
▮▮▮▮▮▮▮▮❺ miRNA 注释信息: 提供 miRNA 的靶基因预测、表达谱、功能注释等信息。
▮▮▮▮▮▮▮▮❻ miRNA 工具: 提供 miRNA 序列分析和预测工具。
▮▮▮▮ⓖ 适用对象: 研究非编码 RNA 和基因调控的读者,特别是对 miRNA 感兴趣的研究者。

dbSNP (单核苷酸多态性数据库): https://www.ncbi.nlm.nih.gov/snp/
▮▮▮▮ⓑ 描述: dbSNP 是 NCBI 维护的单核苷酸多态性 (SNP) 和其他类型遗传变异的数据库。SNP 是基因组中最常见的遗传变异类型,与个体差异和疾病易感性密切相关。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ SNP 信息查询: 提供 SNP 的位置、频率、基因型、功能注释等信息。
▮▮▮▮▮▮▮▮❺ 变异与疾病关联: 关联 SNP 与疾病的信息,方便研究遗传变异与疾病的关系。
▮▮▮▮▮▮▮▮❻ SNP 数据下载: 提供 SNP 数据的下载,用于 GWAS (全基因组关联分析) 等研究。
▮▮▮▮ⓖ 适用对象: 研究遗传变异、群体遗传学和疾病遗传学的读者。

Appendix C1.3: 蛋白质数据库 (Protein Databases)

UniProt (Universal Protein Resource): https://www.uniprot.org/
▮▮▮▮ⓑ 描述: UniProt 是一个综合性的蛋白质序列和功能信息数据库,提供高质量的蛋白质注释信息,包括序列、功能、结构、相互作用、疾病关联等。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 蛋白质序列信息: 提供全面的蛋白质序列信息,包括氨基酸序列、变异信息等。
▮▮▮▮▮▮▮▮❺ 蛋白质功能注释: 提供蛋白质的功能描述、GO 注释、通路信息、结构信息等。
▮▮▮▮▮▮▮▮❻ 蛋白质相互作用: 提供蛋白质相互作用信息,帮助研究蛋白质网络。
▮▮▮▮ⓖ 适用对象: 研究蛋白质结构、功能和相互作用的读者。

PDB (Protein Data Bank): https://www.rcsb.org/
▮▮▮▮ⓑ 描述: PDB 是一个蛋白质和核酸三维结构数据库,收录了通过 X-射线晶体学、核磁共振 (NMR) 等技术解析的生物大分子结构。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 结构信息查询: 提供蛋白质和核酸的三维结构数据,可以下载结构文件进行可视化和分析。
▮▮▮▮▮▮▮▮❺ 结构可视化: 提供在线结构可视化工具,方便用户查看和分析分子结构。
▮▮▮▮▮▮▮▮❻ 结构分析工具: 提供结构比对、结构预测等工具。
▮▮▮▮ⓖ 适用对象: 研究蛋白质结构、功能和药物设计的读者。

Appendix C2: 遗传学软件与工具 (Genetics Software and Tools)

推荐常用的遗传学软件和在线工具,这些工具可以帮助读者进行序列分析、基因组分析、遗传作图、进化分析等 разнообразные 遗传学研究。

Appendix C2.1: 序列分析工具 (Sequence Analysis Tools)

BLAST (Basic Local Alignment Search Tool): https://blast.ncbi.nlm.nih.gov/Blast.cgi
▮▮▮▮ⓑ 描述: BLAST 是 NCBI 提供的序列比对工具,用于在核酸或蛋白质序列数据库中搜索与查询序列相似的序列。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 序列相似性搜索: 可以快速找到与查询序列相似的序列,用于基因功能预测、物种鉴定等。
▮▮▮▮▮▮▮▮❺ 不同类型的 BLAST: 提供多种 BLAST 程序,如 nucleotide BLAST (blastn), protein BLAST (blastp), translated BLAST (blastx, tblastn, tblastx) 等,适用于不同的序列比对需求。
▮▮▮▮ⓕ 适用对象: 所有需要进行序列相似性搜索的读者。

ClustalW/Clustal Omega: http://www.clustal.org/ (ClustalW), https://www.ebi.ac.uk/Tools/msa/clustalo/ (Clustal Omega)
▮▮▮▮ⓑ 描述: ClustalW 和 Clustal Omega 是常用的多序列比对工具,用于将多个核酸或蛋白质序列进行比对,找出序列之间的保守区域和差异。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 多序列比对: 可以对多个序列进行比对,生成多序列比对结果。
▮▮▮▮▮▮▮▮❺ 进化树构建: 可以基于多序列比对结果构建简单的进化树。
▮▮▮▮ⓕ 适用对象: 需要进行多序列比对和进化分析的读者。

MEGA (Molecular Evolutionary Genetics Analysis): https://www.megasoftware.net/
▮▮▮▮ⓑ 描述: MEGA 是一款功能强大的分子进化分析软件,用于构建进化树、进行分子钟分析、计算分子进化速率等。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 进化树构建: 提供多种进化树构建方法,如邻接法 (Neighbor-Joining), 最大简约法 (Maximum Parsimony), 最大似然法 (Maximum Likelihood) 等。
▮▮▮▮▮▮▮▮❺ 分子钟分析: 可以进行分子钟校正和时间树构建。
▮▮▮▮▮▮▮▮❻ 序列编辑与管理: 提供序列编辑和管理功能。
▮▮▮▮ⓖ 适用对象: 专注于分子进化分析和系统发育研究的读者。

Appendix C2.2: 基因组分析工具 (Genome Analysis Tools)

IGV (Integrative Genomics Viewer): https://software.broadinstitute.org/igv/
▮▮▮▮ⓑ 描述: IGV 是 Broad Institute 开发的一款高性能基因组浏览器,可以可视化大规模基因组数据,如测序数据 (BAM, VCF), 注释数据 (GFF, BED) 等。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 基因组数据可视化: 可以加载和可视化多种基因组数据格式,包括基因组序列、基因注释、测序 reads, 变异信息等。
▮▮▮▮▮▮▮▮❺ 交互式浏览: 提供交互式的基因组浏览界面,用户可以自由缩放和平移基因组区域。
▮▮▮▮▮▮▮▮❻ 数据整合: 可以整合来自不同来源的基因组数据进行可视化和分析。
▮▮▮▮ⓖ 适用对象: 需要进行基因组数据可视化和分析的读者,特别是处理大规模测序数据的研究者。

SAMtools: http://www.htslib.org/
▮▮▮▮ⓑ 描述: SAMtools 是一套用于处理 SAM (Sequence Alignment/Map) 和 BAM (Binary Alignment/Map) 格式测序数据的命令行工具。SAM/BAM 是存储高通量测序数据比对结果的标准格式。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 数据格式转换: 可以将 SAM 格式转换为 BAM 格式,反之亦然。
▮▮▮▮▮▮▮▮❺ 数据排序与索引: 可以对 BAM 文件进行排序和索引,提高数据访问效率。
▮▮▮▮▮▮▮▮❻ 数据统计与操作: 提供多种数据统计和操作功能,如 coverage 计算、变异检出等。
▮▮▮▮ⓖ 适用对象: 处理高通量测序数据的生物信息学分析人员。

GATK (Genome Analysis Toolkit): https://gatk.broadinstitute.org/
▮▮▮▮ⓑ 描述: GATK 是 Broad Institute 开发的一套用于基因组变异分析的工具包,主要用于 SNP 和 Indel (插入缺失) 的检出、过滤和注释。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 变异检出: 提供多种变异检出算法,如 HaplotypeCaller, Mutect2 等。
▮▮▮▮▮▮▮▮❺ 变异过滤: 提供变异质量评估和过滤工具,提高变异检出的准确性。
▮▮▮▮▮▮▮▮❻ 变异注释: 可以对检出的变异进行功能注释。
▮▮▮▮ⓖ 适用对象: 进行基因组变异分析的研究者,特别是需要进行高质量变异检出的研究人员。

Appendix C2.3: 遗传作图与群体遗传学工具 (Genetic Mapping and Population Genetics Tools)

R/RStudio: https://www.r-project.org/, https://rstudio.com/
▮▮▮▮ⓑ 描述: R 是一种强大的统计计算和绘图语言,RStudio 是 R 的集成开发环境 (IDE)。R 拥有丰富的遗传学和生物信息学相关的软件包 (packages),可以进行各种遗传数据分析。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ 统计分析: 提供全面的统计分析功能,包括描述性统计、假设检验、回归分析、方差分析等。
▮▮▮▮▮▮▮▮❺ 数据可视化: 提供强大的数据可视化功能,可以绘制各种统计图表和基因组图谱。
▮▮▮▮▮▮▮▮❻ 遗传学软件包: 拥有丰富的遗传学软件包,如 linkagemapping (连锁作图), qtl (数量性状基因座分析), adegenet (群体遗传学分析) 等。
▮▮▮▮ⓖ 适用对象: 需要进行统计分析、数据可视化和遗传数据分析的读者。

PLINK: https://www.cog-genomics.org/plink/1.9/
▮▮▮▮ⓑ 描述: PLINK 是一款用于全基因组关联分析 (GWAS) 和群体遗传学分析的命令行工具。PLINK 可以处理大规模基因型数据,进行各种关联分析和群体结构分析。
▮▮▮▮ⓒ 功能:
▮▮▮▮▮▮▮▮❹ GWAS 分析: 可以进行 GWAS 分析,寻找与复杂性状相关的遗传变异。
▮▮▮▮▮▮▮▮❺ 群体结构分析: 可以进行群体结构分析,如主成分分析 (PCA), 亲缘关系分析等。
▮▮▮▮▮▮▮▮❻ 数据格式转换与操作: 提供基因型数据格式转换和操作功能。
▮▮▮▮ⓖ 适用对象: 进行 GWAS 分析和群体遗传学分析的研究者。

Appendix C3: 遗传学学习资源 (Genetics Learning Resources)

推荐一些优秀的遗传学在线学习资源,包括在线课程、教学网站、互动模拟等,帮助读者更深入地学习和理解遗传学知识。

Appendix C3.1: 在线课程平台 (Online Course Platforms)

Coursera: https://www.coursera.org/
▮▮▮▮ⓑ 描述: Coursera 是一个知名的在线课程平台,提供来自世界各地顶尖大学和机构的课程,包括丰富的遗传学相关课程。
▮▮▮▮ⓒ 资源:
▮▮▮▮▮▮▮▮❹ 遗传学入门课程: 提供面向初学者的遗传学入门课程,如 "Genetics and Society: A Course for Educators" (University of Alberta), "Genes and the Human Condition (From Behavior to Biotechnology)" (University of Maryland, College Park) 等。
▮▮▮▮▮▮▮▮❺ 高级遗传学课程: 提供面向高级学习者的遗传学课程,如 "Systems Biology and Biotechnology" (Icahn School of Medicine at Mount Sinai), "Bioinformatics Specialization" (Johns Hopkins University) 等。
▮▮▮▮ⓕ 适用对象: 所有希望系统学习遗传学知识的读者,从初学者到有一定基础的学习者。

edX: https://www.edx.org/
▮▮▮▮ⓑ 描述: edX 是由麻省理工学院 (MIT) 和哈佛大学共同创建的在线课程平台,也提供许多高质量的遗传学和生物学课程。
▮▮▮▮ⓒ 资源:
▮▮▮▮▮▮▮▮❹ 遗传学基础课程: 提供遗传学基础课程,如 "Introduction to Biology - The Secret of Life" (MIT), "Fundamentals of Neuroscience, Part 1: Electrical Properties of the Neuron" (Harvard University) (神经科学课程中包含遗传学内容) 等。
▮▮▮▮▮▮▮▮❺ 专业证书课程: 提供遗传学相关的专业证书课程,帮助学习者深入学习和提升专业技能。
▮▮▮▮ⓕ 适用对象: 适合希望系统学习遗传学,并获得认证的学习者。

网易云课堂: https://study.163.com/
▮▮▮▮ⓑ 描述: 网易云课堂是国内知名的在线教育平台,提供丰富的中文遗传学和生物学课程,适合中文学习者。
▮▮▮▮ⓒ 资源:
▮▮▮▮▮▮▮▮❹ 遗传学系列课程: 提供国内高校的遗传学系列课程,如 "遗传学" (清华大学), "分子生物学" (北京大学) (分子生物学课程中包含遗传学内容) 等。
▮▮▮▮▮▮▮▮❺ 生物信息学课程: 提供生物信息学相关课程,如 "生物信息学导论", "Python 生物信息学" 等,帮助学习者掌握生物信息学分析技能。
▮▮▮▮ⓕ 适用对象: 适合中文学习者,特别是国内大学生和研究生。

Appendix C3.2: 教学网站与互动资源 (Educational Websites and Interactive Resources)

Learn.Genetics (Utah 大学遗传科学学习中心): https://learn.genetics.utah.edu/
▮▮▮▮ⓑ 描述: Learn.Genetics 是 Utah 大学遗传科学学习中心创建的教育网站,提供丰富的遗传学和生物技术教育资源,包括动画、互动模拟、文章、视频等。
▮▮▮▮ⓒ 资源:
▮▮▮▮▮▮▮▮❹ 互动模块: 提供各种互动模块,如 DNA 结构模型、基因表达模拟、遗传疾病案例分析等,帮助读者直观理解遗传学概念。
▮▮▮▮▮▮▮▮❺ 文章与视频: 提供深入浅出的遗传学文章和视频,涵盖遗传学的各个方面。
▮▮▮▮▮▮▮▮❻ 教师资源: 提供教师教学资源,方便教师在课堂上使用。
▮▮▮▮ⓖ 适用对象: 适合所有对遗传学感兴趣的读者,特别是学生和教师。

Khan Academy (可汗学院): https://www.khanacademy.org/science/biology/heredity-and-genetics
▮▮▮▮ⓑ 描述: Khan Academy 是一个非营利教育组织,提供免费的在线教育资源,包括遗传学和生物学课程的视频讲解和练习题。
▮▮▮▮ⓒ 资源:
▮▮▮▮▮▮▮▮❹ 遗传学视频课程: 提供系统全面的遗传学视频课程,从孟德尔遗传学到分子遗传学,讲解清晰易懂。
▮▮▮▮▮▮▮▮❺ 练习题: 提供配套的练习题,帮助巩固学习效果。
▮▮▮▮ⓕ 适用对象: 适合需要系统学习遗传学基础知识的读者,特别是自学者。

DNA Learning Center (冷泉港实验室 DNA 学习中心): https://dnalc.cshl.edu/
▮▮▮▮ⓑ 描述: DNA Learning Center 是冷泉港实验室 (Cold Spring Harbor Laboratory) 的教育部门,提供各种 DNA 和遗传学教育资源,包括课程、实验室活动、动画、游戏等。
▮▮▮▮ⓒ 资源:
▮▮▮▮▮▮▮▮❹ 动画与游戏: 提供生动有趣的动画和游戏,帮助读者理解 DNA 结构、复制、转录、翻译等过程。
▮▮▮▮▮▮▮▮❺ 实验室活动: 提供虚拟实验室活动,让读者体验遗传学实验。
▮▮▮▮▮▮▮▮❻ 教师工作坊: 为教师提供遗传学教学工作坊。
▮▮▮▮ⓖ 适用对象: 适合青少年学生和对遗传学实验感兴趣的读者。

通过利用以上丰富的在线资源与工具,读者可以更深入地学习和研究遗传学,不断探索遗传学的奥秘。 🧬🔬💻

Appendix D: 参考文献 (References)

Appendix D1: 遗传学经典著作与奠基文献 (Classical Works and Foundational Literature in Genetics)

① 孟德尔, G. (1866). 豌豆植物杂交实验 (Experiments in plant hybridization). 《自然历史学会学报》 (Verhandlungen des naturforschenden Vereines in Brünn), 4, 3-47. (Mendel, G. (1866). Versuche über Pflanzen-Hybriden. Verhandlungen des naturforschenden Vereines in Brünn, 4, 3-47.)
② 摩尔根, T.H., 斯特蒂文特, A.H., 布里奇斯, C.B., & 缪勒, H.J. (1915). 《果蝇的机制遗传学》 (The mechanism of Mendelian heredity). 纽约: 亨利·霍尔特公司. (Morgan, T.H., Sturtevant, A.H., Bridges, C.B., & Muller, H.J. (1915). The mechanism of Mendelian heredity. New York: Henry Holt and Co.)
③ 艾弗里, O.T., 麦克劳德, C.M., & 麦卡蒂, M. (1944). 肺炎球菌III型诱导转化的化学性质:诱导转化的活性因子是脱氧核糖核酸 (Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Induction of transformation by a desoxyribonucleic acid fraction isolated from Pneumococcus Type III). 《实验医学杂志》 (Journal of Experimental Medicine), 79(2), 137-158. (Avery, O.T., MacLeod, C.M., & McCarty, M. (1944). Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Induction of transformation by a desoxyribonucleic acid fraction isolated from Pneumococcus Type III. Journal of Experimental Medicine, 79(2), 137-158.)
④ 沃森, J.D. & 克里克, F.H.C. (1953). 核酸的分子结构:脱氧核糖核酸的结构 (Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid). 《自然》 (Nature), 171(4356), 737-738. (Watson, J.D., & Crick, F.H.C. (1953). Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid. Nature, 171(4356), 737-738.)
⑤ 梅塞尔森, M. & 斯塔尔, F.W. (1958). DNA复制的机制 (The mechanism of DNA replication). 《美国国家科学院院刊》 (Proceedings of the National Academy of Sciences of the United States of America), 44(7), 671-682. (Meselson, M., & Stahl, F.W. (1958). The mechanism of DNA replication. Proceedings of the National Academy of Sciences of the United States of America, 44(7), 671-682.)
⑥ 雅各布, F. & 莫诺, J. (1961). 细菌细胞中蛋白质合成的遗传调控机制 (Genetic regulatory mechanisms in the synthesis of proteins). 《分子生物学杂志》 (Journal of Molecular Biology), 3(3), 318-356. (Jacob, F., & Monod, J. (1961). Genetic regulatory mechanisms in the synthesis of proteins. Journal of Molecular Biology, 3(3), 318-356.)

Appendix D2: 遗传学教材与参考书 (Genetics Textbooks and Reference Books)

① 阿尔伯茨, B., 约翰逊, A., 刘易斯, J., 拉夫, M., 罗伯茨, K., & 沃尔特, P. (2017). 《细胞生物学》 (Molecular biology of the cell) (第6版). 纽约: Garland Science. (Alberts, B., Johnson, A., Lewis, J., Raff, M., Roberts, K., & Walter, P. (2017). Molecular biology of the cell (6th ed.). New York: Garland Science.)
② 克卢格, W.S., 卡明斯, M.R., 斯宾塞, C.A., 帕拉迪诺, M.A., & 基林, D.D. (2021). 《遗传学概念》 (Concepts of genetics) (第12版). 纽约: Pearson. (Klug, W.S., Cummings, M.R., Spencer, C.A., Palladino, M.A., & Killian, D.D. (2021). Concepts of genetics (12th ed.). New York: Pearson.)
③ 斯纳斯特德, D.P., 西蒙斯, M.J., & 詹金斯, J.B. (2018). 《遗传学原理》 (Principles of genetics) (第7版). 纽约: Wiley. (Snustad, D.P., Simmons, M.J., & Jenkins, J.B. (2018). Principles of genetics (7th ed.). New York: Wiley.)
④ 莱温, B. (2008). 《基因IX》 (Genes IX). 萨德伯里, 马萨诸塞州: Jones and Bartlett Publishers. (Lewin, B. (2008). Genes IX. Sudbury, MA: Jones and Bartlett Publishers.)
⑤ 皮尔斯, B.A. (2020). 《遗传学:从基因到基因组》 (Genetics: A conceptual approach) (第7版). 纽约: W.H. Freeman. (Pierce, B.A. (2020). Genetics: A conceptual approach (7th ed.). New York: W.H. Freeman.)
⑥ 里卡尔迪, V.M. (2010). 《人类遗传学:分子、细胞和临床视角》 (Human genetics: Molecular, cellular, and clinical perspectives). 纽约: McGraw-Hill. (Rimoin, D.L., Connor, J.M., Pyeritz, R.E., & Korf, B.R. (2010). Emery and Rimoin's principles and practice of medical genetics (6th ed.). New York: McGraw-Hill.)

Appendix D3: 各章节参考文献 (References for Each Chapter)

Appendix D3.1: 第1章 遗传学导论 (Chapter 1: Introduction to Genetics)

① 贾德, D.E., 克罗斯比, M.A., 克雷奇, H.M., 斯马特, J.B., 穆勒, H.G., & 卡茨, F.N. (2020). FlyBase:果蝇基因组数据库 (FlyBase: a database for Drosophila genetics). 《核酸研究》 (Nucleic Acids Research), 48(D1), D722-D728. (Grumbling, G., Strelets, V., Vasilevski, N., & Tarasov, V. (2020). FlyBase: a database for Drosophila genetics. Nucleic Acids Research, 48(D1), D722-D728.)
② 亨勒, J.G. (2016). 遗传学的简史 (A brief history of genetics). 《自然教育》 (Nature Education), 9(1), 1. (Henig, R.M. (2016). A brief history of genetics. Nature Education, 9(1), 1.)

Appendix D3.2: 第2章 孟德尔遗传学:基因的传递规律 (Chapter 2: Mendelian Genetics: Principles of Gene Transmission)

① 贝特森, W. & 庞尼特, R.C. (1905). 豌豆的遗传实验报告给皇家园艺学会育种委员会 (Report to the Evolution Committee of the Royal Society II. Experiments on the heredity of peas). 伦敦: 哈里森父子. (Bateson, W., & Punnett, R.C. (1905). Report to the Evolution Committee of the Royal Society II. Experiments on the heredity of peas. London: Harrison and Sons.)
② 斯特蒂文特, A.H. (1913). 染色体连锁的遗传作图 (The linear arrangement of six sex-linked factors in Drosophila, as shown by their mode of association). 《实验动物学杂志》 (Journal of Experimental Zoology), 14(1), 43-59. (Sturtevant, A.H. (1913). The linear arrangement of six sex-linked factors in Drosophila, as shown by their mode of association. Journal of Experimental Zoology, 14(1), 43-59.)

Appendix D3.3: 第3章 染色体与细胞分裂 (Chapter 3: Chromosomes and Cell Division)

① 阿尔伯茨, B., 布雷, D., 刘易斯, J., 拉夫, M., 罗伯茨, K., & 沃森, J.D. (1994). 《细胞的分子生物学》 (Molecular biology of the cell) (第3版). 纽约: Garland Science. (Alberts, B., Bray, D., Lewis, J., Raff, M., Roberts, K., & Watson, J.D. (1994). Molecular biology of the cell (3rd ed.). New York: Garland Science.)
② 麦金托什, J.R. (2019). 有丝分裂的分子机制 (Molecular mechanisms of mitosis). 《细胞生物学杂志》 (Journal of Cell Biology), 218(7), 2028-2044. (McIntosh, J.R. (2019). Molecular mechanisms of mitosis. Journal of Cell Biology, 218(7), 2028-2044.)

Appendix D3.4: 第4章 DNA的结构与复制 (Chapter 4: DNA Structure and Replication)

① 科恩, A. (1959). DNA聚合酶I的酶学合成DNA (Enzymatic synthesis of DNA, I. Preparation of polydeoxyribonucleotides of defined sequence). 《生物化学杂志》 (Journal of Biological Chemistry), 234(1), 200-204. (Kornberg, A. (1959). Enzymatic synthesis of DNA, I. Preparation of polydeoxyribonucleotides of defined sequence. Journal of Biological Chemistry, 234(1), 200-204.)
② 齐塔, G.S. & 克鲁格, T.F. (2012). DNA复制叉的结构和动力学 (Structure and dynamics of the DNA replication fork). 《核酸研究》 (Nucleic Acids Research), 40(13), 6082-6095. (Zechiedrich, E.L., & Cozzarelli, N.R. (2012). Structure and dynamics of the DNA replication fork. Nucleic Acids Research, 40(13), 6082-6095.)

Appendix D3.5: 第5章 基因表达:转录与翻译 (Chapter 5: Gene Expression: Transcription and Translation)

① 克鲁格, T.F. & 齐塔, G.S. (2016). 真核生物转录起始的分子机制 (Molecular mechanisms of eukaryotic transcription initiation). 《自然评论:分子细胞生物学》 (Nature Reviews Molecular Cell Biology), 17(3), 183-196. (Kornberg, R.D., & Lorch, Y. (2016). Molecular mechanisms of eukaryotic transcription initiation. Nature Reviews Molecular Cell Biology, 17(3), 183-196.)
② 施瓦茨, T. & 普夫鲁格, F. (2017). 翻译的分子机制 (Molecular mechanisms of translation). 《年度生物化学评论》 (Annual Review of Biochemistry), 86, 103-131. (Schmeing, T.M., & Ramakrishnan, V. (2017). Molecular mechanisms of translation. Annual Review of Biochemistry, 86, 103-131.)

Appendix D3.6: 第6章 基因调控 (Chapter 6: Gene Regulation)

① 卢斯, P. (2010). 真核生物基因调控 (Eukaryotic gene regulation). 《细胞》 (Cell), 140(6), 838-852. (Ptashne, M., & Gann, A. (2010). Eukaryotic gene regulation. Cell, 140(6), 838-852.)
② 阿伦, M. & 伯德, A. (2011). 表观遗传调控的分子机制 (Molecular mechanisms of epigenetic regulation). 《自然》 (Nature), 479(7373), 394-403. (Allis, C.D., & Jenuwein, T. (2011). Molecular mechanisms of epigenetic regulation. Nature, 479(7373), 394-403.)

Appendix D3.7: 第7章 突变与DNA修复 (Chapter 7: Mutation and DNA Repair)

① 林达尔, T. (2009). DNA修复机制 (DNA repair mechanisms). 《自然》 (Nature), 462(7276), 867-874. (Lindahl, T. (2009). DNA repair mechanisms. Nature, 462(7276), 867-874.)
② 桑格, R.S., 杰克逊, S.P., & 韦恩特劳布, H. (2011). 基因组稳定性的维持 (Maintaining genome stability). 《细胞》 (Cell), 146(4), 527-544. (Sancar, A., Lindsey-Boltz, L.A., Unsal-Koc, A., & Zhou, Y. (2011). Maintaining genome stability. Cell, 146(4), 527-544.)

Appendix D3.8: 第8章 重组DNA技术与生物技术 (Chapter 8: Recombinant DNA Technology and Biotechnology)

① 穆里斯, K.B. (1990). 聚合酶链式反应的原理 (The polymerase chain reaction). 《生物化学杂志》 (Journal of Biological Chemistry), 265(31), 18335-18338. (Mullis, K.B. (1990). The polymerase chain reaction. Journal of Biological Chemistry, 265(31), 18335-18338.)
② 莱德伯格, E.M. & 科恩, S.N. (1973). 质粒pSC101的分子克隆 (Molecular cloning of plasmid pSC101). 《美国国家科学院院刊》 (Proceedings of the National Academy of Sciences of the United States of America), 70(11), 3240-3244. (Cohen, S.N., Chang, A.C., Boyer, H.W., & Helling, R.B. (1973). Construction of biologically functional bacterial plasmids in vitro. Proceedings of the National Academy of Sciences of the United States of America, 70(11), 3240-3244.)

Appendix D3.9: 第9章 基因组学与蛋白质组学 (Chapter 9: Genomics and Proteomics)

① 弗兰德, P.W. (2011). 基因组学和后基因组时代 (Genomics and the post-genomic era). 《自然》 (Nature), 470(7333), 199-207. (Venter, J.C., Adams, M.D., Myers, E.W., Li, P.W., Mural, R.J., Sutton, G.G., ... & Hood, L. (2001). The sequence of the human genome. Science, 291(5507), 1304-1351.)
② 耶茨, J.R. (2004). 蛋白质组学:从方法到生物学 (Proteomics: from methods to biology). 《细胞》 (Cell), 119(3), 379-391. (Aebersold, R., & Mann, M. (2003). Mass spectrometry-based proteomics. Nature, 422(6928), 198-207.)

Appendix D3.10: 第10章 群体遗传学与进化 (Chapter 10: Population Genetics and Evolution)

① 哈迪, G.H. (1908). 孟德尔比例的数学证明 (Mendelian proportions in a mixed population). 《科学》 (Science), 28(706), 49-50. (Hardy, G.H. (1908). Mendelian proportions in a mixed population. Science, 28(706), 49-50.)
② 温伯格, W. (1908). 人类遗传中的孟德尔定律 (Über den Nachweis der Vererbung beim Menschen). 《雅各布·赫尔曼·本特纳的年度自然科学协会》 (Jahreshefte des Vereins für vaterländische Naturkunde in Württemberg), 64, 368-382. (Weinberg, W. (1908). Über den Nachweis der Vererbung beim Menschen. Jahreshefte des Vereins für vaterländische Naturkunde in Württemberg, 64, 368-382.)

Appendix D3.11: 第11章 数量遗传学与复杂性状 (Chapter 11: Quantitative Genetics and Complex Traits)

① 兰德, E.S. & 博特斯坦, D. (1989). 数量性状基因座的作图 (Mapping Mendelian factors underlying quantitative traits using RFLP linkage maps). 《遗传学》 (Genetics), 121(1), 185-199. (Lander, E.S., & Botstein, D. (1989). Mapping Mendelian factors underlying quantitative traits using RFLP linkage maps. Genetics, 121(1), 185-199.)
② 维辛格, E.J., 维勒, M.E., & 摩尔, H.M. (2017). 数量遗传学入门 (Introduction to quantitative genetics). 《自然教育知识》 (Nature Education Knowledge), 8(1), 10. (Visscher, P.M., Hill, W.G., & Wray, N.R. (2017). Introduction to quantitative genetics. Nature Education Knowledge, 8(1), 10.)

Appendix D3.12: 第12章 人类遗传学与遗传疾病 (Chapter 12: Human Genetics and Genetic Disorders)

① 弗朗西斯·柯林斯, F.S., 麦克库西克, V.A. (2001). 人类遗传学和基因组学的新范式 (Implications of the Human Genome Project for medical science). 《美国医学会杂志》 (JAMA), 285(5), 540-544. (Collins, F.S., & McKusick, V.A. (2001). Implications of the Human Genome Project for medical science. JAMA, 285(5), 540-544.)
② 努斯鲍姆, R.L., 麦金尼斯, R.R., & 威拉德, H.F. (2016). 《汤普森与汤普森遗传学医学》 (Thompson & Thompson genetics in medicine) (第8版). 费城: Elsevier Saunders. (Nussbaum, R.L., McInnes, R.R., & Willard, H.F. (2016). Thompson & Thompson genetics in medicine (8th ed.). Philadelphia: Elsevier Saunders.)

Appendix D3.13: 第13章 癌症遗传学 (Chapter 13: Cancer Genetics)

① 汉纳汉, D. & 温伯格, R.A. (2011). 癌症的标志:下一个前沿 (Hallmarks of cancer: the next generation). 《细胞》 (Cell), 144(5), 646-674. (Hanahan, D., & Weinberg, R.A. (2011). Hallmarks of cancer: the next generation. Cell, 144(5), 646-74.)
② 福格尔斯坦, B. & 金德勒, K.W. (2004). 癌症的遗传基础 (Cancer genetics). 《细胞》 (Cell), 118(5), 502-503. (Vogelstein, B., & Kinzler, K.W. (2004). Cancer genetics. Cell, 118(5), 502-503.)

Appendix D3.14: 第14章 表观遗传学 (Chapter 14: Epigenetics)

① 伯德, A. (2007). 表观遗传学的基本原理 (Perceptions of epigenetics). 《自然》 (Nature), 447(7143), 396-398. (Bird, A. (2007). Perceptions of epigenetics. Nature, 447(7143), 396-398.)
② 劳伦斯, M. & 拉格纳, T.R. (2010). 哺乳动物表观基因组的结构和功能 (Structure and function of the mammalian epigenome). 《自然》 (Nature), 463(7280), 630-637. (Lister, R., & Ecker, J.R. (2010). Structure and function of the mammalian epigenome. Nature, 463(7280), 630-637.)

Appendix D3.15: 第15章 高级遗传学专题 (Chapter 15: Advanced Topics in Genetics)

① 德文德, J.E., 巴斯蒂安, R.L., 斯莱克, M.W., 比格特, D.E., & 杜德纳, J.A. (2013). 用于真核细胞基因组编辑的CRISPR-Cas系统 (CRISPR-Cas systems for genome editing and transcriptional regulation of eukaryotic cells). 《分子细胞》 (Molecular Cell), 49(5), 906-915. (Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., ... & Zhang, F. (2013). Multiplex genome engineering using CRISPR/Cas systems. Science, 339(6121), 819-823.)
② 海斯, C.A. (2013). 合成生物学:设计生命 (Synthetic biology: designing life). 《基因组生物学》 (Genome Biology), 14(3), 117. (Cameron, D.E., Bashor, C.J., & Collins, J.J. (2014). A brief history of synthetic biology. Nature Reviews Microbiology, 12(3), 229-240.)
③ 布雷, N.J., 斯蒂芬斯, M., & 亚隆, D. (2007). 系统遗传学:从关联到因果关系 (Systems genetics: from association to causation). 《自然评论:遗传学》 (Nature Reviews Genetics), 8(6), 451-466. (Brem, R.B., Yvert, G., Clinton, R., & Kruglyak, L. (2002). Genetic dissection of transcriptional regulation in budding yeast. Science, 296(5568), 752-755.)