003 《分子生物学 (Molecular Biology): 全面且深度解析》
🌟🌟🌟本文由Gemini 2.0 Flash Thinking Experimental 01-21生成,用来辅助学习。🌟🌟🌟
书籍大纲
▮▮ 1. 分子生物学导论 (Introduction to Molecular Biology)
▮▮▮▮ 1.1 分子生物学的定义与范畴 (Definition and Scope of Molecular Biology)
▮▮▮▮▮▮ 1.1.1 分子生物学的核心概念 (Core Concepts of Molecular Biology)
▮▮▮▮▮▮ 1.1.2 分子生物学的发展简史 (Brief History of Molecular Biology)
▮▮▮▮▮▮ 1.1.3 分子生物学在生命科学中的地位 (Role of Molecular Biology in Life Sciences)
▮▮▮▮ 1.2 生命的基本分子:核酸与蛋白质 (Fundamental Molecules of Life: Nucleic Acids and Proteins)
▮▮▮▮▮▮ 1.2.1 核酸:DNA 的结构与功能 (Nucleic Acids: Structure and Function of DNA)
▮▮▮▮▮▮ 1.2.2 核酸:RNA 的结构与功能 (Nucleic Acids: Structure and Function of RNA)
▮▮▮▮▮▮ 1.2.3 蛋白质:氨基酸、多肽与蛋白质结构 (Proteins: Amino Acids, Polypeptides, and Protein Structure)
▮▮▮▮ 1.3 分子生物学的中心法则 (Central Dogma of Molecular Biology)
▮▮▮▮▮▮ 1.3.1 DNA 复制 (DNA Replication)
▮▮▮▮▮▮ 1.3.2 转录 (Transcription)
▮▮▮▮▮▮ 1.3.3 翻译 (Translation)
▮▮▮▮▮▮ 1.3.4 中心法则的例外与扩展 (Exceptions and Extensions to the Central Dogma)
▮▮ 2. 基因组的结构与功能 (Genome Structure and Function)
▮▮▮▮ 2.1 基因组的组织层次 (Organizational Levels of the Genome)
▮▮▮▮▮▮ 2.1.1 原核生物基因组 (Prokaryotic Genomes)
▮▮▮▮▮▮ 2.1.2 真核生物基因组 (Eukaryotic Genomes)
▮▮▮▮▮▮ 2.1.3 病毒基因组 (Viral Genomes)
▮▮▮▮ 2.2 染色质结构与功能 (Chromatin Structure and Function)
▮▮▮▮▮▮ 2.2.1 核小体 (Nucleosomes)
▮▮▮▮▮▮ 2.2.2 染色质的高级结构 (Higher-Order Chromatin Structures)
▮▮▮▮▮▮ 2.2.3 染色质修饰与表观遗传 (Chromatin Modifications and Epigenetics)
▮▮▮▮ 2.3 基因的结构与功能 (Gene Structure and Function)
▮▮▮▮▮▮ 2.3.1 基因的组成元件 (Components of a Gene)
▮▮▮▮▮▮ 2.3.2 基因家族与基因重复 (Gene Families and Gene Duplication)
▮▮▮▮▮▮ 2.3.3 假基因与非编码基因 (Pseudogenes and Non-coding Genes)
▮▮▮▮ 2.4 基因组的变异与进化 (Genome Variation and Evolution)
▮▮▮▮▮▮ 2.4.1 突变 (Mutation)
▮▮▮▮▮▮ 2.4.2 重组与基因组重排 (Recombination and Genome Rearrangement)
▮▮▮▮▮▮ 2.4.3 基因组进化与物种形成 (Genome Evolution and Speciation)
▮▮ 3. DNA 的复制、修复与重组 (DNA Replication, Repair, and Recombination)
▮▮▮▮ 3.1 DNA 复制的分子机制 (Molecular Mechanisms of DNA Replication)
▮▮▮▮▮▮ 3.1.1 复制的起始 (Replication Initiation)
▮▮▮▮▮▮ 3.1.2 复制的延伸 (Replication Elongation)
▮▮▮▮▮▮ 3.1.3 复制的终止 (Replication Termination)
▮▮▮▮▮▮ 3.1.4 复制的调控 (Regulation of Replication)
▮▮▮▮ 3.2 DNA 损伤与修复 (DNA Damage and Repair)
▮▮▮▮▮▮ 3.2.1 DNA 损伤的类型与来源 (Types and Sources of DNA Damage)
▮▮▮▮▮▮ 3.2.2 直接修复 (Direct Repair)
▮▮▮▮▮▮ 3.2.3 切除修复 (Excision Repair)
▮▮▮▮▮▮ 3.2.4 重组修复 (Recombination Repair)
▮▮▮▮▮▮ 3.2.5 跨损伤合成 (Translesion Synthesis)
▮▮▮▮ 3.3 DNA 重组 (DNA Recombination)
▮▮▮▮▮▮ 3.3.1 同源重组 (Homologous Recombination)
▮▮▮▮▮▮ 3.3.2 位点特异性重组 (Site-Specific Recombination)
▮▮▮▮▮▮ 3.3.3 转座作用 (Transposition)
▮▮▮▮▮▮ 3.3.4 重组的应用 (Applications of Recombination)
▮▮ 4. 基因的转录与 RNA 加工 (Gene Transcription and RNA Processing)
▮▮▮▮ 4.1 转录的分子机制 (Molecular Mechanisms of Transcription)
▮▮▮▮▮▮ 4.1.1 RNA 聚合酶 (RNA Polymerases)
▮▮▮▮▮▮ 4.1.2 转录的起始 (Transcription Initiation)
▮▮▮▮▮▮ 4.1.3 转录的延伸与终止 (Transcription Elongation and Termination)
▮▮▮▮▮▮ 4.1.4 转录的调控 (Regulation of Transcription)
▮▮▮▮ 4.2 RNA 的加工与修饰 (RNA Processing and Modification)
▮▮▮▮▮▮ 4.2.1 mRNA 的加工 (mRNA Processing)
▮▮▮▮▮▮ 4.2.2 rRNA 和 tRNA 的加工 (rRNA and tRNA Processing)
▮▮▮▮▮▮ 4.2.3 RNA 编辑 (RNA Editing)
▮▮▮▮▮▮ 4.2.4 RNA 转运 (RNA Transport)
▮▮▮▮ 4.3 非编码 RNA (Non-coding RNAs)
▮▮▮▮▮▮ 4.3.1 小 RNA (Small RNAs): miRNA 和 siRNA
▮▮▮▮▮▮ 4.3.2 长非编码 RNA (Long Non-coding RNAs, lncRNAs)
▮▮▮▮▮▮ 4.3.3 其他非编码 RNA (Other Non-coding RNAs)
▮▮ 5. 基因的翻译与蛋白质合成 (Gene Translation and Protein Synthesis)
▮▮▮▮ 5.1 翻译的分子机制 (Molecular Mechanisms of Translation)
▮▮▮▮▮▮ 5.1.1 核糖体结构与功能 (Ribosome Structure and Function)
▮▮▮▮▮▮ 5.1.2 tRNA 的作用 (Role of tRNA)
▮▮▮▮▮▮ 5.1.3 翻译的起始 (Translation Initiation)
▮▮▮▮▮▮ 5.1.4 翻译的延伸 (Translation Elongation)
▮▮▮▮▮▮ 5.1.5 翻译的终止 (Translation Termination)
▮▮▮▮ 5.2 蛋白质的折叠、修饰与转运 (Protein Folding, Modification, and Transport)
▮▮▮▮▮▮ 5.2.1 蛋白质的折叠 (Protein Folding)
▮▮▮▮▮▮ 5.2.2 蛋白质的翻译后修饰 (Post-translational Modifications, PTMs)
▮▮▮▮▮▮ 5.2.3 蛋白质的转运 (Protein Transport)
▮▮▮▮▮▮ 5.2.4 蛋白质的降解 (Protein Degradation)
▮▮▮▮ 5.3 翻译的调控 (Regulation of Translation)
▮▮▮▮▮▮ 5.3.1 翻译起始的调控 (Regulation of Translation Initiation)
▮▮▮▮▮▮ 5.3.2 mRNA 结构与翻译调控 (mRNA Structure and Translational Control)
▮▮▮▮▮▮ 5.3.3 非编码 RNA 与翻译调控 (Non-coding RNAs and Translational Control)
▮▮▮▮▮▮ 5.3.4 细胞信号通路与翻译调控 (Cellular Signaling Pathways and Translational Control)
▮▮ 6. 基因表达的调控 (Regulation of Gene Expression)
▮▮▮▮ 6.1 转录水平的调控 (Transcriptional Regulation)
▮▮▮▮▮▮ 6.1.1 转录因子的作用机制 (Mechanisms of Transcription Factors)
▮▮▮▮▮▮ 6.1.2 顺式作用元件 (Cis-regulatory Elements)
▮▮▮▮▮▮ 6.1.3 染色质结构与转录调控 (Chromatin Structure and Transcriptional Regulation)
▮▮▮▮▮▮ 6.1.4 表观遗传调控 (Epigenetic Regulation)
▮▮▮▮ 6.2 转录后水平的调控 (Post-transcriptional Regulation)
▮▮▮▮▮▮ 6.2.1 RNA 剪接调控 (Regulation of RNA Splicing)
▮▮▮▮▮▮ 6.2.2 RNA 稳定性与降解调控 (Regulation of RNA Stability and Degradation)
▮▮▮▮▮▮ 6.2.3 RNA 定位与翻译调控 (Regulation of RNA Localization and Translation)
▮▮▮▮▮▮ 6.2.4 非编码 RNA 在转录后调控中的作用 (Role of Non-coding RNAs in Post-transcriptional Regulation)
▮▮▮▮ 6.3 翻译水平的调控 (Translational Regulation)
▮▮▮▮▮▮ 6.3.1 翻译起始的调控机制 (Mechanisms of Translational Initiation Regulation)
▮▮▮▮▮▮ 6.3.2 mRNA 结构与翻译调控 (mRNA Structure and Translational Control)
▮▮▮▮▮▮ 6.3.3 细胞信号通路与翻译调控 (Cellular Signaling Pathways and Translational Control)
▮▮▮▮ 6.4 蛋白质水平的调控 (Post-translational Regulation)
▮▮▮▮▮▮ 6.4.1 蛋白质翻译后修饰的调控作用 (Regulatory Roles of Post-translational Modifications)
▮▮▮▮▮▮ 6.4.2 蛋白质的定位与调控 (Protein Localization and Regulation)
▮▮▮▮▮▮ 6.4.3 蛋白质的相互作用与调控 (Protein-Protein Interactions and Regulation)
▮▮▮▮▮▮ 6.4.4 蛋白质降解的调控 (Regulation of Protein Degradation)
▮▮ 7. 分子生物学技术 (Molecular Biology Techniques)
▮▮▮▮ 7.1 核酸的分离、纯化与分析 (Nucleic Acid Isolation, Purification, and Analysis)
▮▮▮▮▮▮ 7.1.1 DNA 的提取与纯化 (DNA Extraction and Purification)
▮▮▮▮▮▮ 7.1.2 RNA 的提取与纯化 (RNA Extraction and Purification)
▮▮▮▮▮▮ 7.1.3 核酸的定量与定性分析 (Nucleic Acid Quantification and Qualitative Analysis)
▮▮▮▮ 7.2 DNA 克隆与基因工程 (DNA Cloning and Genetic Engineering)
▮▮▮▮▮▮ 7.2.1 限制性内切酶与 DNA 连接酶 (Restriction Enzymes and DNA Ligases)
▮▮▮▮▮▮ 7.2.2 载体 (Vectors)
▮▮▮▮▮▮ 7.2.3 DNA 克隆的步骤 (Steps of DNA Cloning)
▮▮▮▮▮▮ 7.2.4 基因工程的应用 (Applications of Genetic Engineering)
▮▮▮▮ 7.3 聚合酶链式反应 (Polymerase Chain Reaction, PCR)
▮▮▮▮▮▮ 7.3.1 PCR 的原理与基本步骤 (Principle and Basic Steps of PCR)
▮▮▮▮▮▮ 7.3.2 PCR 的类型与应用 (Types and Applications of PCR)
▮▮▮▮▮▮ 7.3.3 PCR 的优化与故障排除 (PCR Optimization and Troubleshooting)
▮▮▮▮ 7.4 DNA 测序技术 (DNA Sequencing Technologies)
▮▮▮▮▮▮ 7.4.1 Sanger 测序 (Sanger Sequencing)
▮▮▮▮▮▮ 7.4.2 新一代测序技术 (Next-Generation Sequencing, NGS)
▮▮▮▮▮▮ 7.4.3 测序数据的分析与解读 (Sequencing Data Analysis and Interpretation)
▮▮▮▮ 7.5 蛋白质的分离、纯化与分析 (Protein Isolation, Purification, and Analysis)
▮▮▮▮▮▮ 7.5.1 蛋白质的提取与纯化 (Protein Extraction and Purification)
▮▮▮▮▮▮ 7.5.2 蛋白质的定量与定性分析 (Protein Quantification and Qualitative Analysis)
▮▮▮▮▮▮ 7.5.3 蛋白质相互作用研究技术 (Techniques for Studying Protein-Protein Interactions)
▮▮▮▮ 7.6 细胞生物学常用技术 (Common Techniques in Cell Biology)
▮▮▮▮▮▮ 7.6.1 细胞培养 (Cell Culture)
▮▮▮▮▮▮ 7.6.2 细胞显微镜技术 (Cell Microscopy Techniques)
▮▮▮▮▮▮ 7.6.3 流式细胞术与细胞分选 (Flow Cytometry and Cell Sorting)
▮▮▮▮▮▮ 7.6.4 细胞功能分析 (Cell Function Analysis)
▮▮▮▮ 7.7 基因组学常用技术 (Common Techniques in Genomics)
▮▮▮▮▮▮ 7.7.1 基因组文库构建 (Genomic Library Construction)
▮▮▮▮▮▮ 7.7.2 基因芯片技术 (DNA Microarray Technology)
▮▮▮▮▮▮ 7.7.3 基因组编辑技术 (Genome Editing Technologies)
▮▮▮▮▮▮ 7.7.4 染色质免疫共沉淀测序 (ChIP-Seq)
▮▮▮▮▮▮ 7.7.5 RNA 测序 (RNA-Seq)
▮▮ 8. 分子生物学在医学中的应用 (Molecular Biology in Medicine)
▮▮▮▮ 8.1 疾病的分子机制 (Molecular Mechanisms of Diseases)
▮▮▮▮▮▮ 8.1.1 癌症的分子机制 (Molecular Mechanisms of Cancer)
▮▮▮▮▮▮ 8.1.2 遗传病的分子机制 (Molecular Mechanisms of Genetic Diseases)
▮▮▮▮▮▮ 8.1.3 感染性疾病的分子机制 (Molecular Mechanisms of Infectious Diseases)
▮▮▮▮▮▮ 8.1.4 自身免疫性疾病的分子机制 (Molecular Mechanisms of Autoimmune Diseases)
▮▮▮▮ 8.2 分子诊断 (Molecular Diagnostics)
▮▮▮▮▮▮ 8.2.1 基因诊断 (Genetic Diagnosis)
▮▮▮▮▮▮ 8.2.2 核酸检测 (Nucleic Acid Detection)
▮▮▮▮▮▮ 8.2.3 蛋白质诊断 (Protein Diagnostics)
▮▮▮▮▮▮ 8.2.4 循环肿瘤细胞检测与液体活检 (Circulating Tumor Cell Detection and Liquid Biopsy)
▮▮▮▮ 8.3 基因治疗 (Gene Therapy)
▮▮▮▮▮▮ 8.3.1 基因治疗的原理与类型 (Principles and Types of Gene Therapy)
▮▮▮▮▮▮ 8.3.2 基因治疗载体 (Gene Therapy Vectors)
▮▮▮▮▮▮ 8.3.3 基因治疗的策略与临床应用 (Strategies and Clinical Applications of Gene Therapy)
▮▮▮▮▮▮ 8.3.4 基因治疗的挑战与未来展望 (Challenges and Future Perspectives of Gene Therapy)
▮▮▮▮ 8.4 药物开发与分子靶向治疗 (Drug Development and Molecular Targeted Therapy)
▮▮▮▮▮▮ 8.4.1 药物开发的流程 (Drug Development Process)
▮▮▮▮▮▮ 8.4.2 药物靶点的发现与验证 (Drug Target Discovery and Validation)
▮▮▮▮▮▮ 8.4.3 药物筛选与药物设计 (Drug Screening and Drug Design)
▮▮▮▮▮▮ 8.4.4 分子靶向治疗 (Molecular Targeted Therapy)
▮▮▮▮ 8.5 个性化医疗与精准医学 (Personalized Medicine and Precision Medicine)
▮▮▮▮▮▮ 8.5.1 个性化医疗与精准医学的概念与发展 (Concepts and Development of Personalized and Precision Medicine)
▮▮▮▮▮▮ 8.5.2 个性化医疗与精准医学的技术基础 (Technological Basis of Personalized and Precision Medicine)
▮▮▮▮▮▮ 8.5.3 个性化医疗与精准医学的应用前景 (Application Prospects of Personalized and Precision Medicine)
▮▮▮▮▮▮ 8.5.4 个性化医疗与精准医学的伦理问题 (Ethical Issues of Personalized and Precision Medicine)
▮▮ 9. 分子生物学在生物技术中的应用 (Molecular Biology in Biotechnology)
▮▮▮▮ 9.1 基因工程与重组 DNA 技术 (Genetic Engineering and Recombinant DNA Technology)
▮▮▮▮▮▮ 9.1.1 基因克隆与表达 (Gene Cloning and Expression)
▮▮▮▮▮▮ 9.1.2 转基因生物 (Transgenic Organisms)
▮▮▮▮▮▮ 9.1.3 基因编辑技术在生物技术中的应用 (Applications of Genome Editing Technologies in Biotechnology)
▮▮▮▮▮▮ 9.1.4 重组 DNA 技术在疫苗和药物开发中的应用 (Applications of Recombinant DNA Technology in Vaccine and Drug Development)
▮▮▮▮ 9.2 蛋白质工程与酶工程 (Protein Engineering and Enzyme Engineering)
▮▮▮▮▮▮ 9.2.1 蛋白质结构预测与分子模拟 (Protein Structure Prediction and Molecular Simulation)
▮▮▮▮▮▮ 9.2.2 蛋白质定向进化 (Directed Evolution of Proteins)
▮▮▮▮▮▮ 9.2.3 酶的改造与应用 (Enzyme Modification and Application)
▮▮▮▮ 9.3 细胞工程与组织工程 (Cell Engineering and Tissue Engineering)
▮▮▮▮▮▮ 9.3.1 细胞培养与细胞融合 (Cell Culture and Cell Fusion)
▮▮▮▮▮▮ 9.3.2 干细胞技术 (Stem Cell Technology)
▮▮▮▮▮▮ 9.3.3 组织工程与再生医学 (Tissue Engineering and Regenerative Medicine)
▮▮▮▮ 9.4 代谢工程与合成生物学 (Metabolic Engineering and Synthetic Biology)
▮▮▮▮▮▮ 9.4.1 代谢途径改造与微生物细胞工厂 (Metabolic Pathway Engineering and Microbial Cell Factories)
▮▮▮▮▮▮ 9.4.2 合成生物学:生物元件、生物器件与生物系统 (Synthetic Biology: BioBricks, BioDevices, and BioSystems)
▮▮▮▮▮▮ 9.4.3 生物信息学在生物技术中的应用 (Applications of Bioinformatics in Biotechnology)
▮▮ 10. 生物信息学导论 (Introduction to Bioinformatics)
▮▮▮▮ 10.1 生物信息学的定义与范畴 (Definition and Scope of Bioinformatics)
▮▮▮▮▮▮ 10.1.1 生物信息学的核心概念 (Core Concepts of Bioinformatics)
▮▮▮▮▮▮ 10.1.2 生物信息学的发展简史 (Brief History of Bioinformatics)
▮▮▮▮▮▮ 10.1.3 生物信息学在生命科学中的地位 (Role of Bioinformatics in Life Sciences)
▮▮▮▮ 10.2 生物信息学的主要研究内容 (Main Research Areas of Bioinformatics)
▮▮▮▮▮▮ 10.2.1 生物数据库 (Biological Databases)
▮▮▮▮▮▮ 10.2.2 序列分析 (Sequence Analysis)
▮▮▮▮▮▮ 10.2.3 基因组学与基因组信息学 (Genomics and Genome Informatics)
▮▮▮▮▮▮ 10.2.4 蛋白质组学与蛋白质信息学 (Proteomics and Proteome Informatics)
▮▮▮▮▮▮ 10.2.5 系统生物学与系统生物信息学 (Systems Biology and Systems Bioinformatics)
▮▮▮▮▮▮ 10.2.6 药物信息学 (Chemoinformatics and Drug Informatics)
▮▮▮▮ 10.3 生物信息学常用工具与平台 (Common Bioinformatics Tools and Platforms)
▮▮▮▮▮▮ 10.3.1 序列分析工具 (Sequence Analysis Tools)
▮▮▮▮▮▮ 10.3.2 基因组学分析工具 (Genomics Analysis Tools)
▮▮▮▮▮▮ 10.3.3 蛋白质组学分析工具 (Proteomics Analysis Tools)
▮▮▮▮▮▮ 10.3.4 生物信息学编程语言与环境 (Bioinformatics Programming Languages and Environments)
▮▮▮▮▮▮ 10.3.5 生物信息学在线资源与平台 (Online Bioinformatics Resources and Platforms)
▮▮ 附录A: 分子生物学常用缩略语 (Common Abbreviations in Molecular Biology)
▮▮ 附录B: 分子生物学重要网站与资源 (Important Websites and Resources for Molecular Biology)
▮▮ 附录C: 分子生物学实验常用试剂与耗材 (Common Reagents and Consumables in Molecular Biology Experiments)
▮▮ 附录D: 参考文献 (References)
▮▮ 附录E: 术语表 (Glossary)
1. 分子生物学导论 (Introduction to Molecular Biology)
本章作为分子生物学的入门,概述了分子生物学的定义、发展历程、中心法则以及在生命科学中的地位和作用,为后续章节的学习奠定基础。
1.1 分子生物学的定义与范畴 (Definition and Scope of Molecular Biology)
明确分子生物学的定义,阐述其研究对象、研究层次和与其他生物学科的关系,例如生物化学、遗传学和细胞生物学。
1.1.1 分子生物学的核心概念 (Core Concepts of Molecular Biology)
介绍分子生物学的核心概念,如基因 (gene)、DNA、RNA、蛋白质 (protein)、中心法则 (central dogma) 等,构建学科的基本框架。
分子生物学 (Molecular Biology) 是一门在分子水平上研究生物生命现象的学科。它旨在理解生物大分子,如核酸 (nucleic acid) (DNA 和 RNA) 和蛋白质 (protein) 的结构、功能以及它们在细胞 (cell) 内的相互作用,从而阐明生命过程的本质。分子生物学的核心概念构成了理解生命现象的基石,以下是几个关键概念:
① 基因 (Gene):基因是遗传的基本单位,是 DNA 分子上携带遗传信息的特定序列。在经典遗传学中,基因被认为是性状的决定因素。在分子生物学中,基因被定义为编码蛋白质或 RNA 分子的 DNA 序列。基因包含了生物体生长、发育和繁殖所需的所有遗传指令。基因的表达是一个复杂的过程,包括转录 (transcription) 和翻译 (translation) 两个主要步骤,最终产生功能性的蛋白质或 RNA 分子。
② 脱氧核糖核酸 (Deoxyribonucleic Acid, DNA):DNA 是生物体的遗传物质,负责长期储存遗传信息。DNA 是一种双螺旋结构的大分子,由脱氧核苷酸 (deoxyribonucleotide) 组成。每个脱氧核苷酸包含一个脱氧核糖 (deoxyribose)、一个磷酸基团 (phosphate group) 和一个含氮碱基 (nitrogenous base)。DNA 中有四种碱基:腺嘌呤 (adenine, A)、鸟嘌呤 (guanine, G)、胞嘧啶 (cytosine, C) 和胸腺嘧啶 (thymine, T)。DNA 的双螺旋结构由詹姆斯·沃森 (James Watson) 和弗朗西斯·克里克 (Francis Crick) 于 1953 年发现,这一发现被誉为分子生物学诞生的标志之一。DNA 的功能包括:
▮▮▮▮ⓑ 遗传信息的储存:DNA 序列编码了生物体的所有遗传信息。
▮▮▮▮ⓒ 遗传信息的复制 (replication):DNA 能够精确地复制自身,确保遗传信息在细胞分裂时传递给子代细胞。
▮▮▮▮ⓓ 遗传信息的表达:DNA 通过转录和翻译过程指导蛋白质的合成。
③ 核糖核酸 (Ribonucleic Acid, RNA):RNA 在基因表达中扮演着多种角色。与 DNA 类似,RNA 也是一种核酸,但它通常是单链的,并且含有核糖 (ribose) 而不是脱氧核糖,以及尿嘧啶 (uracil, U) 替代了胸腺嘧啶 (T)。RNA 主要有以下几种类型,每种类型在细胞中执行不同的功能:
▮▮▮▮ⓑ 信使 RNA (messenger RNA, mRNA):mRNA 携带来自 DNA 的遗传信息,作为蛋白质合成的模板。
▮▮▮▮ⓒ 转运 RNA (transfer RNA, tRNA):tRNA 在翻译过程中识别 mRNA 上的密码子 (codon) 并携带相应的氨基酸 (amino acid) 到核糖体 (ribosome)。
▮▮▮▮ⓓ 核糖体 RNA (ribosomal RNA, rRNA):rRNA 是核糖体的组成成分,核糖体是蛋白质合成的场所。
▮▮▮▮ⓔ 非编码 RNA (non-coding RNA, ncRNA):包括多种调控 RNA,如 microRNA (miRNA)、small interfering RNA (siRNA)、long non-coding RNA (lncRNA) 等,参与基因表达调控、染色质结构调控等多种生物过程。
④ 蛋白质 (Protein):蛋白质是生命活动的主要执行者,具有极其多样化的功能。蛋白质是由氨基酸通过肽键 (peptide bond) 连接形成的多聚物。蛋白质的结构复杂,可以分为一级结构、二级结构、三级结构和四级结构。蛋白质的功能包括:
▮▮▮▮ⓑ 酶 (enzyme):催化生物化学反应。
▮▮▮▮ⓒ 结构蛋白 (structural protein):构成细胞和组织的结构框架。
▮▮▮▮ⓓ 信号蛋白 (signaling protein):传递细胞信号,调控细胞行为。
▮▮▮▮ⓔ 运动蛋白 (motor protein):参与细胞运动和物质运输。
▮▮▮▮ⓕ 调控蛋白 (regulatory protein):调控基因表达和其他细胞过程。
⑤ 分子生物学的中心法则 (Central Dogma of Molecular Biology):中心法则是分子生物学的核心理论,由弗朗西斯·克里克于 1958 年提出,描述了遗传信息的流动方向。经典中心法则认为,遗传信息从 DNA 传递到 RNA,再从 RNA 传递到蛋白质,即 DNA → RNA → 蛋白质。这个过程包括三个主要步骤:
▮▮▮▮ⓑ 复制 (Replication):DNA 复制产生 DNA 的拷贝,确保遗传信息的世代传递。
▮▮▮▮ⓒ 转录 (Transcription):DNA 上的基因序列被转录成 RNA 分子,主要是 mRNA。
▮▮▮▮ⓓ 翻译 (Translation):mRNA 上的遗传密码被翻译成蛋白质的氨基酸序列。
中心法则概括了基因表达的基本流程,是理解基因如何控制细胞功能和生物性状的关键。虽然中心法则最初的表述比较简单,但随着分子生物学的发展,人们发现中心法则存在一些例外和扩展,例如逆转录 (reverse transcription) 和 RNA 复制 (RNA replication),以及非编码 RNA 的重要作用。这些发现丰富和完善了中心法则,使其更加全面地反映了生物体内遗传信息的流动和调控机制。
理解这些核心概念是学习分子生物学的基础。基因、DNA、RNA 和蛋白质是构成生命世界的基本分子,而中心法则则阐明了这些分子之间相互作用的基本规律。掌握这些概念,有助于我们深入理解生命现象的分子机制,并为进一步学习分子生物学的其他内容打下坚实的基础。
1.1.2 分子生物学的发展简史 (Brief History of Molecular Biology)
回顾分子生物学的发展历程,介绍重要的里程碑事件和关键人物,展现学科的演进脉络。
分子生物学 (Molecular Biology) 的发展历程是一部充满发现和创新的历史。从 20 世纪初的萌芽到今天的蓬勃发展,分子生物学经历了多个关键阶段,每一次突破都深刻地改变了我们对生命的理解。
① 萌芽期 (19世纪末 - 20世纪30年代):分子生物学的思想萌芽于 19 世纪末和 20 世纪初。早期的生物化学和遗传学研究为分子生物学的诞生奠定了基础。
▮▮▮▮ⓑ 核酸的发现:1869 年,弗里德里希·米歇尔 (Friedrich Miescher) 首次从细胞核中分离出核酸,尽管当时对其生物学功能尚不清楚。
▮▮▮▮ⓒ 孟德尔遗传定律的重新发现:1900 年,卡尔·科伦斯 (Carl Correns)、雨果·德弗里斯 (Hugo de Vries) 和埃里希·冯·切尔马克 (Erich von Tschermak) 重新发现了格雷戈尔·孟德尔 (Gregor Mendel) 的遗传定律,为遗传学的分子研究方向提供了理论框架。
▮▮▮▮ⓓ 染色体与基因的联系:20 世纪初,沃尔特·萨顿 (Walter Sutton) 和西奥多·博韦里 (Theodor Boveri) 等人提出染色体是遗传物质的载体,将遗传学与细胞学联系起来。
② 奠基期 (20世纪30年代 - 50年代):这个时期,物理学、化学和生物学的交叉融合,为分子生物学的建立提供了方法论和技术基础。
▮▮▮▮ⓑ “生命是什么?”:1944 年,物理学家埃尔温·薛定谔 (Erwin Schrödinger) 发表了《生命是什么?》(What is Life?) 一书,从物理学的角度探讨生命现象,激发了物理学家和化学家进入生物学领域,共同探索生命的分子机制。
▮▮▮▮ⓒ DNA 是遗传物质的证据:1944 年,奥斯瓦尔德·埃弗里 (Oswald Avery)、科林·麦克劳德 (Colin MacLeod) 和麦克林·麦卡蒂 (Maclyn McCarty) 通过肺炎链球菌转化实验证明 DNA 是遗传物质,而非此前普遍认为的蛋白质。这个实验被认为是分子生物学发展史上的重要里程碑。
▮▮▮▮ⓓ DNA 双螺旋结构的发现:1953 年,詹姆斯·沃森 (James Watson) 和弗朗西斯·克里克 (Francis Crick) 在罗莎琳德·富兰克林 (Rosalind Franklin) 和莫里斯·威尔金斯 (Maurice Wilkins) 的 X 射线衍射数据基础上,提出了 DNA 双螺旋结构模型。这一发现揭示了遗传信息储存和复制的分子机制,标志着分子生物学的正式诞生。
③ 中心法则和基因表达的阐明期 (20世纪50年代 - 60年代):DNA 双螺旋结构的发现开启了分子生物学研究的新纪元。科学家们开始深入研究遗传信息的传递和表达机制。
▮▮▮▮ⓑ 中心法则的提出:1958 年,弗朗西斯·克里克 (Francis Crick) 提出了分子生物学的中心法则,概括了遗传信息从 DNA 到 RNA 再到蛋白质的流动方向,为理解基因表达提供了理论框架。
▮▮▮▮ⓒ 遗传密码的破译:20 世纪 60 年代,马歇尔·尼伦伯格 (Marshall Nirenberg)、海因里希·马特伊 (Johann Heinrich Matthaei) 和西韦罗·奥乔亚 (Severo Ochoa) 等人通过一系列实验,逐步破译了遗传密码,揭示了 mRNA 序列如何编码蛋白质的氨基酸序列。
▮▮▮▮ⓓ mRNA 的发现:雅克布 (François Jacob) 和莫诺 (Jacques Monod) 提出了 mRNA 的概念,并阐明了 mRNA 在基因表达中的作用,解释了遗传信息如何从细胞核传递到核糖体进行蛋白质合成。
▮▮▮▮ⓔ 操纵子模型的提出:雅克布 (François Jacob) 和莫诺 (Jacques Monod) 提出了操纵子 (operon) 模型,解释了细菌基因表达的调控机制,揭示了基因表达调控的分子基础。
④ 分子生物学技术的快速发展期 (20世纪70年代 - 90年代):分子生物学技术的创新和应用极大地推动了学科的发展。
▮▮▮▮ⓑ 重组 DNA 技术 (recombinant DNA technology) 的诞生:20 世纪 70 年代初,限制性内切酶 (restriction enzyme) 和 DNA 连接酶 (DNA ligase) 等工具的发现和应用,使得 DNA 的剪切、拼接和克隆成为可能,诞生了重组 DNA 技术。这一技术彻底改变了生物学研究的方式,开启了基因工程 (genetic engineering) 时代。
▮▮▮▮ⓒ DNA 测序技术 (DNA sequencing technology) 的发展:弗雷德里克·桑格 (Frederick Sanger) 和沃尔特·吉尔伯特 (Walter Gilbert) 等人分别独立开发了 DNA 测序技术,使得读取 DNA 序列成为可能。DNA 测序技术的出现为基因组学 (genomics) 的发展奠定了基础。
▮▮▮▮ⓓ 聚合酶链式反应 (polymerase chain reaction, PCR) 技术的发明:1983 年,凯利·穆利斯 (Kary Mullis) 发明了 PCR 技术,实现了 DNA 片段的体外快速扩增,极大地提高了 DNA 分析的效率和灵敏度,成为分子生物学实验室的常规技术。
⑤ 基因组学、系统生物学和生物信息学 (bioinformatics) 的兴起 (21世纪至今):随着人类基因组计划 (Human Genome Project) 的启动和完成,分子生物学进入了基因组学时代。
▮▮▮▮ⓑ 人类基因组计划:1990 年启动的人类基因组计划旨在测定人类基因组的完整序列。2003 年,人类基因组计划宣布完成,绘制了人类基因组的精细图谱,为理解人类疾病的遗传基础、开发新的诊疗方法奠定了基础。
▮▮▮▮ⓒ 新一代测序技术 (next-generation sequencing, NGS) 的发展:NGS 技术的出现使得 DNA 测序的成本大大降低,速度显著提高,推动了基因组学、转录组学 (transcriptomics)、表观基因组学 (epigenomics) 等领域的快速发展。
▮▮▮▮ⓓ 系统生物学 (systems biology) 和生物信息学的兴起:系统生物学强调从整体和系统的角度研究生物学问题,生物信息学则利用计算机科学和统计学方法分析海量的生物数据。这两个学科的兴起,使得分子生物学研究从关注单个基因或分子的功能,转向研究基因和分子之间的相互作用网络,以及整个生物系统的复杂行为。
▮▮▮▮ⓔ 基因编辑技术 (genome editing technology) 的应用:CRISPR-Cas9 等基因编辑技术的出现,使得基因的精确编辑成为可能,为基因治疗 (gene therapy)、疾病模型构建、农业育种等领域带来了革命性的变革。
分子生物学的发展历程是一部不断探索、不断创新的历史。从最初对核酸和蛋白质的发现,到 DNA 双螺旋结构的揭示,再到中心法则的提出和基因表达机制的阐明,以及各种分子生物学技术的发明和应用,每一步都凝聚着无数科学家的智慧和努力。分子生物学的发展不仅深刻地改变了我们对生命的理解,也为医学、农业、生物技术等领域带来了巨大的进步。展望未来,分子生物学将继续在生命科学领域发挥核心作用,为解决人类健康、粮食安全、环境保护等重大挑战做出更大的贡献。
1.1.3 分子生物学在生命科学中的地位 (Role of Molecular Biology in Life Sciences)
阐述分子生物学在现代生命科学中的核心地位,以及其在医学、农业、生物技术等领域的应用前景。
分子生物学 (Molecular Biology) 作为生命科学领域的核心学科,在现代生命科学中占据着举足轻重的地位。它不仅是理解生命现象本质的基础,也是推动医学、农业、生物技术等领域发展的关键驱动力。
① 分子生物学是理解生命现象本质的基础:
▮▮▮▮ⓑ 揭示生命活动的分子机制:分子生物学从分子水平研究生命现象,揭示了 DNA、RNA、蛋白质等生物大分子的结构、功能和相互作用,阐明了基因复制、转录、翻译、基因调控等基本生命过程的分子机制。这些机制是理解细胞生长、发育、代谢、遗传、进化等生命活动的基础。
▮▮▮▮ⓒ 构建生命科学的理论框架:分子生物学的中心法则、基因概念、基因表达调控理论等,构成了现代生命科学的理论框架。这些理论不仅深化了我们对生命本质的认识,也为其他生命科学分支学科的研究提供了指导。
▮▮▮▮ⓓ 促进学科交叉融合:分子生物学与生物化学、遗传学、细胞生物学、生理学、发育生物学、进化生物学等学科紧密交叉融合,共同推动生命科学的整体发展。例如,分子遗传学、分子细胞生物学、分子进化生物学等交叉学科的兴起,丰富和拓展了生命科学的研究领域。
② 分子生物学在医学领域的应用:
▮▮▮▮ⓑ 疾病分子机制的研究:分子生物学方法被广泛应用于研究疾病的分子机制,例如癌症、遗传病、感染性疾病、自身免疫性疾病等。通过揭示疾病相关的基因、蛋白质和信号通路异常,为疾病的诊断、治疗和预防提供了分子基础。
▮▮▮▮ⓒ 分子诊断 (molecular diagnostics):分子生物学技术,如 PCR、核酸杂交、基因芯片、NGS 等,被广泛应用于疾病的分子诊断。基因诊断可以用于遗传病筛查、肿瘤早期诊断、病原微生物检测、药物基因组学等,提高诊断的准确性和效率。
▮▮▮▮ⓓ 基因治疗 (gene therapy):基因治疗利用分子生物学技术将外源基因导入患者细胞,以纠正基因缺陷或治疗疾病。基因治疗在遗传病、癌症、感染性疾病等领域显示出巨大的潜力,为一些难治性疾病带来了新的希望。
▮▮▮▮ⓔ 药物开发 (drug development) 与分子靶向治疗 (molecular targeted therapy):分子生物学在药物靶点的发现、药物筛选、药物设计和临床试验中发挥着关键作用。分子靶向治疗针对疾病相关的特定分子靶点,开发靶向药物,提高治疗的精确性和疗效,降低副作用。
▮▮▮▮ⓕ 个性化医疗 (personalized medicine) 与精准医学 (precision medicine):基于基因组学、蛋白质组学、代谢组学等分子生物学技术,结合临床信息和生活方式数据,实现对疾病的个体化诊断和治疗,提高医疗的精准性和有效性。
③ 分子生物学在农业领域的应用:
▮▮▮▮ⓑ 转基因作物 (genetically modified crops):利用基因工程技术,将外源基因导入农作物,改良作物的性状,如提高产量、抗虫、抗病、抗除草剂、改善营养品质等。转基因作物在提高粮食产量、保障粮食安全方面发挥着重要作用。
▮▮▮▮ⓒ 分子标记辅助育种 (marker-assisted selection, MAS):利用分子标记技术,如 DNA 标记,辅助传统育种,提高育种效率和精确性。MAS 可以用于基因定位、基因聚合、优良基因的快速选择和导入,缩短育种周期,培育优良品种。
▮▮▮▮ⓓ 植物抗逆性研究:分子生物学方法被应用于研究植物抗旱、抗盐、抗寒、抗病虫害等逆境胁迫的分子机制,为培育抗逆性强的作物品种提供理论基础和技术手段。
▮▮▮▮ⓔ 农产品品质改良:利用分子生物学技术,改良农产品的营养成分、风味、加工特性等品质,提高农产品的附加值和市场竞争力。
④ 分子生物学在生物技术领域的应用:
▮▮▮▮ⓑ 基因工程药物 (gene engineering drugs):利用重组 DNA 技术,生产基因工程药物,如胰岛素、干扰素、生长激素、单克隆抗体等。基因工程药物具有生产效率高、质量可控、副作用小等优点,为疾病治疗提供了新的手段。
▮▮▮▮ⓒ 酶工程 (enzyme engineering):利用蛋白质工程和酶工程技术,改造酶的性质,如提高酶的活性、稳定性、特异性,拓展酶的应用范围。酶工程在工业催化、生物传感器、生物诊断等领域具有广泛应用前景。
▮▮▮▮ⓓ 细胞工程 (cell engineering) 与组织工程 (tissue engineering):利用细胞培养、细胞融合、干细胞技术、组织工程技术,构建细胞工厂、生产单克隆抗体、开发再生医学产品。细胞工程和组织工程在生物医药、生物材料、疾病模型构建等领域具有重要应用价值。
▮▮▮▮ⓔ 代谢工程 (metabolic engineering) 与合成生物学 (synthetic biology):利用代谢工程和合成生物学方法,改造微生物的代谢途径,构建微生物细胞工厂,生产生物燃料、生物基化学品、生物医药产品等。代谢工程和合成生物学为可持续发展和生物经济提供了新的途径。
▮▮▮▮ⓕ 生物信息学 (bioinformatics):生物信息学作为分子生物学的重要分支,利用计算机科学和统计学方法分析海量的生物数据,为基因组学、蛋白质组学、系统生物学等研究提供数据分析和挖掘工具。生物信息学在基因功能预测、药物靶点发现、疾病标志物筛选、个性化医疗等领域发挥着越来越重要的作用。
总之,分子生物学作为生命科学的核心学科,不仅深化了我们对生命本质的理解,也为医学、农业、生物技术等领域带来了革命性的变革。随着分子生物学技术的不断发展和应用,我们有理由相信,分子生物学将在解决人类面临的健康、粮食、环境等重大挑战中发挥越来越重要的作用,为构建人类命运共同体贡献力量。
1.2 生命的基本分子:核酸与蛋白质 (Fundamental Molecules of Life: Nucleic Acids and Proteins)
介绍构成生命的基本分子,重点讲解核酸 (DNA和RNA) 和蛋白质的结构、功能和生物学意义,为理解分子机制打下基础。
1.2.1 核酸:DNA 的结构与功能 (Nucleic Acids: Structure and Function of DNA)
详细解析 DNA 的化学结构、双螺旋模型、DNA 的多样性与功能,以及 DNA 作为遗传物质的特性。
脱氧核糖核酸 (Deoxyribonucleic Acid, DNA) 是地球上所有已知生命形式(除了某些病毒,它们使用 RNA 作为遗传物质)的遗传物质。DNA 携带生物体的遗传信息,控制着细胞的生长、发育、功能和繁殖。理解 DNA 的结构和功能是分子生物学的核心内容。
① DNA 的化学结构:DNA 是一种由重复单元——脱氧核苷酸 (deoxyribonucleotide) 组成的多聚物。每个脱氧核苷酸由三部分构成:
▮▮▮▮ⓑ 脱氧核糖 (deoxyribose):一种五碳糖,与核糖 (ribose) 类似,但 2' 碳原子上少一个氧原子。
▮▮▮▮ⓒ 磷酸基团 (phosphate group):连接在脱氧核糖的 5' 碳原子上。
▮▮▮▮ⓓ 含氮碱基 (nitrogenous base):连接在脱氧核糖的 1' 碳原子上。DNA 中有四种主要的含氮碱基,分为两类:
▮▮▮▮▮▮▮▮❺ 嘌呤 (purine):腺嘌呤 (adenine, A) 和鸟嘌呤 (guanine, G),它们是双环结构。
▮▮▮▮▮▮▮▮❻ 嘧啶 (pyrimidine):胞嘧啶 (cytosine, C) 和胸腺嘧啶 (thymine, T),它们是单环结构。
脱氧核苷酸通过磷酸二酯键 (phosphodiester bond) 连接形成 DNA 链。磷酸二酯键连接一个脱氧核苷酸的 5' 碳原子的磷酸基团和下一个脱氧核苷酸的 3' 碳原子的羟基。DNA 链具有方向性,一端是 5' 端(磷酸基团),另一端是 3' 端(羟基)。
② DNA 的双螺旋模型:1953 年,詹姆斯·沃森 (James Watson) 和弗朗西斯·克里克 (Francis Crick) 基于罗莎琳德·富兰克林 (Rosalind Franklin) 和莫里斯·威尔金斯 (Maurice Wilkins) 的 X 射线衍射数据,提出了 DNA 的双螺旋结构模型。DNA 双螺旋结构的主要特点包括:
▮▮▮▮ⓑ 双链结构:DNA 由两条多核苷酸链组成,两条链相互缠绕成双螺旋结构。
▮▮▮▮ⓒ 反向平行 (antiparallel):两条 DNA 链方向相反,一条链的 5' 端对应另一条链的 3' 端。
▮▮▮▮ⓓ 碱基配对 (base pairing):两条链通过碱基之间的氢键 (hydrogen bond) 连接在一起。腺嘌呤 (A) 总是与胸腺嘧啶 (T) 配对,形成两个氢键 (A=T);鸟嘌呤 (G) 总是与胞嘧啶 (C) 配对,形成三个氢键 (G≡C)。这种配对规则称为 沃森-克里克碱基配对 (Watson-Crick base pairing) 或 互补碱基配对 (complementary base pairing)。
▮▮▮▮ⓔ 螺旋结构:DNA 双螺旋呈右手螺旋结构,螺旋直径约为 2 nm,螺距约为 3.4 nm,每螺距包含约 10 个碱基对。碱基对堆积在螺旋内部,糖-磷酸骨架 (sugar-phosphate backbone) 位于螺旋外部。
▮▮▮▮ⓕ 大沟 (major groove) 和小沟 (minor groove):DNA 双螺旋表面形成大沟和小沟,这些沟槽是蛋白质与 DNA 相互作用的重要位点。
DNA 双螺旋结构不仅解释了 DNA 如何稳定地储存遗传信息,也为 DNA 的复制和基因表达提供了结构基础。
③ DNA 的多样性:尽管 DNA 的基本结构相对简单,但 DNA 序列的多样性是巨大的,这使得 DNA 能够编码生物体复杂多样的遗传信息。DNA 的多样性主要体现在以下几个方面:
▮▮▮▮ⓑ 碱基序列的多样性:DNA 序列由四种碱基 A、T、C、G 组成,碱基的排列顺序可以千变万化,形成无数种不同的 DNA 序列。基因的特异性正是由其独特的碱基序列决定的。
▮▮▮▮ⓒ DNA 分子长度的多样性:不同生物的基因组 DNA 分子长度差异很大,从病毒的几千个碱基对到哺乳动物的数十亿个碱基对。DNA 分子长度的多样性反映了生物体遗传信息的复杂程度。
▮▮▮▮ⓓ DNA 结构的多样性:DNA 除了常见的 B-DNA 形式外,还存在 A-DNA、Z-DNA 等不同的构象。此外,DNA 还可以形成环状 DNA、超螺旋 DNA 等不同的拓扑结构。这些结构多样性可能与 DNA 的功能调控有关。
④ DNA 的功能:DNA 作为遗传物质,在生命活动中发挥着核心作用。DNA 的主要功能包括:
▮▮▮▮ⓑ 遗传信息的储存:DNA 序列编码了生物体的所有遗传信息,包括基因的结构和调控信息。遗传信息决定了生物体的性状、发育和进化。DNA 的双螺旋结构和碱基配对规则保证了遗传信息能够稳定地储存和精确地传递。
▮▮▮▮ⓒ 遗传信息的复制 (replication):DNA 能够精确地复制自身,确保遗传信息在细胞分裂时传递给子代细胞。DNA 复制是一个高度精确和复杂的过程,涉及多种酶和蛋白因子的协同作用。DNA 复制的半保留复制机制 (semi-conservative replication) 保证了子代 DNA 分子与亲代 DNA 分子具有相同的遗传信息。
▮▮▮▮ⓓ 遗传信息的表达 (gene expression):DNA 通过转录 (transcription) 和翻译 (translation) 过程指导蛋白质的合成。基因表达是一个复杂而精细调控的过程,受到多种因素的影响。基因表达的调控决定了细胞的类型、功能和状态。
▮▮▮▮ⓔ 遗传变异 (genetic variation):DNA 序列会发生突变 (mutation) 和重组 (recombination),产生遗传变异。遗传变异是生物进化的基础,也是物种多样性的来源。DNA 修复机制 (DNA repair mechanism) 能够修复 DNA 损伤,维持基因组的稳定性。
⑤ DNA 作为遗传物质的特性:DNA 之所以能够成为遗传物质,是由于其独特的结构和性质:
▮▮▮▮ⓑ 稳定性:DNA 的双螺旋结构和脱氧核糖的化学性质使得 DNA 分子具有较高的稳定性,能够长期储存遗传信息。
▮▮▮▮ⓒ 精确复制:DNA 的半保留复制机制和 DNA 聚合酶 (DNA polymerase) 的高保真性保证了 DNA 复制的精确性,使得遗传信息能够准确地传递给子代。
▮▮▮▮ⓓ 信息容量大:DNA 序列的多样性和 DNA 分子的长度使得 DNA 能够储存大量的遗传信息,编码生物体复杂多样的性状。
▮▮▮▮ⓔ 可变性:DNA 序列可以发生突变和重组,产生遗传变异,为生物进化提供原材料。
总之,DNA 以其独特的双螺旋结构和化学性质,成为生命世界中最重要的遗传物质。理解 DNA 的结构和功能,是深入理解生命现象的分子机制的关键。
1.2.2 核酸:RNA 的结构与功能 (Nucleic Acids: Structure and Function of RNA)
详细解析 RNA 的化学结构、类型 (mRNA, tRNA, rRNA 等)、RNA 的多样性与功能,以及 RNA 在基因表达中的作用。
核糖核酸 (Ribonucleic Acid, RNA) 是另一种重要的核酸,在细胞中扮演着多种关键角色,尤其是在基因表达过程中。与 DNA 相比,RNA 在结构和功能上都存在一些显著的差异。
① RNA 的化学结构:RNA 与 DNA 类似,也是一种由核苷酸 (ribonucleotide) 组成的多聚物。每个核糖核苷酸由三部分构成:
▮▮▮▮ⓑ 核糖 (ribose):一种五碳糖,与脱氧核糖 (deoxyribose) 的区别在于 2' 碳原子上多一个羟基 (-OH)。
▮▮▮▮ⓒ 磷酸基团 (phosphate group):连接在核糖的 5' 碳原子上。
▮▮▮▮ⓓ 含氮碱基 (nitrogenous base):连接在核糖的 1' 碳原子上。RNA 中也有四种主要的含氮碱基,与 DNA 类似,嘌呤碱基是腺嘌呤 (adenine, A) 和鸟嘌呤 (guanine, G),嘧啶碱基是胞嘧啶 (cytosine, C) 和 尿嘧啶 (uracil, U)。尿嘧啶 (U) 取代了 DNA 中的胸腺嘧啶 (T)。
核糖核苷酸通过磷酸二酯键 (phosphodiester bond) 连接形成 RNA 链,与 DNA 类似,RNA 链也具有 5' 端和 3' 端。
② RNA 的结构特点:RNA 与 DNA 在结构上主要有以下几点不同:
▮▮▮▮ⓑ 糖的种类:RNA 使用核糖,DNA 使用脱氧核糖。核糖 2' 碳原子上的羟基使得 RNA 比 DNA 更不稳定,更容易发生水解。
▮▮▮▮ⓒ 碱基组成:RNA 使用尿嘧啶 (U) 代替胸腺嘧啶 (T)。尿嘧啶与腺嘌呤 (A) 配对,与胸腺嘧啶的功能相似。
▮▮▮▮ⓓ 链的结构:RNA 通常是单链分子,而 DNA 通常是双链分子。单链 RNA 可以折叠成复杂的二级结构和三级结构,形成茎环结构 (stem-loop structure)、发夹结构 (hairpin structure)、假结 (pseudoknot) 等。这些结构对于 RNA 的功能至关重要。
▮▮▮▮ⓔ 长度:RNA 分子的长度通常比 DNA 分子短,但也有一些例外,如某些病毒的 RNA 基因组。
③ RNA 的类型与功能:细胞中存在多种类型的 RNA,每种类型执行不同的功能,主要包括:
▮▮▮▮ⓑ 信使 RNA (messenger RNA, mRNA):mRNA 携带来自 DNA 基因的遗传信息,作为蛋白质合成的模板。mRNA 通过转录过程从 DNA 基因转录而来,然后将遗传信息传递给核糖体,指导蛋白质的合成。mRNA 的碱基序列决定了蛋白质的氨基酸序列。
▮▮▮▮ⓒ 转运 RNA (transfer RNA, tRNA):tRNA 在蛋白质翻译过程中起着“适配器”的作用。tRNA 分子具有特定的三叶草结构 (cloverleaf structure) 或 L 形结构,一端携带特定的氨基酸,另一端的反密码子 (anticodon) 能够识别 mRNA 上的密码子 (codon)。tRNA 将氨基酸运送到核糖体,根据 mRNA 的密码子序列,将氨基酸添加到正在合成的肽链上。
▮▮▮▮ⓓ 核糖体 RNA (ribosomal RNA, rRNA):rRNA 是核糖体的组成成分,核糖体是蛋白质合成的场所。rRNA 与核糖体蛋白 (ribosomal protein) 结合形成核糖体亚基。rRNA 在核糖体的结构和功能中起着关键作用,包括催化肽键的形成 (rRNA 具有核酶活性,ribozyme activity) 和 mRNA 与 tRNA 的结合。
▮▮▮▮ⓔ 非编码 RNA (non-coding RNA, ncRNA):非编码 RNA 是指不编码蛋白质的 RNA 分子。近年来,人们发现非编码 RNA 在基因表达调控、染色质结构调控、细胞功能调控等多种生物过程中发挥着重要作用。主要的非编码 RNA 类型包括:
▮▮▮▮▮▮▮▮❻ 转运 RNA (transfer RNA, tRNA) 和核糖体 RNA (ribosomal RNA, rRNA):虽然 tRNA 和 rRNA 不编码蛋白质,但它们在蛋白质合成中起着至关重要的作用,因此也被归为非编码 RNA。
▮▮▮▮▮▮▮▮❼ 小核 RNA (small nuclear RNA, snRNA):snRNA 参与 RNA 剪接 (RNA splicing) 和其他 RNA 加工过程。
▮▮▮▮▮▮▮▮❽ 小核仁 RNA (small nucleolar RNA, snoRNA):snoRNA 参与 rRNA 的修饰和加工。
▮▮▮▮▮▮▮▮❾ microRNA (miRNA):miRNA 是一类小的调控 RNA,通过与靶 mRNA 结合,抑制 mRNA 的翻译或促进 mRNA 的降解,从而调控基因表达。
▮▮▮▮▮▮▮▮❿ small interfering RNA (siRNA):siRNA 是一类双链 RNA 分子,可以诱导 RNA 干扰 (RNA interference, RNAi) 途径,导致靶 mRNA 的降解,从而沉默基因表达。
▮▮▮▮▮▮▮▮❻ long non-coding RNA (lncRNA):lncRNA 是一类长度超过 200 个核苷酸的非编码 RNA,参与多种生物过程的调控,如基因表达调控、染色质结构调控、细胞分化、肿瘤发生等。
④ RNA 在基因表达中的作用:RNA 在基因表达的各个环节都发挥着重要作用:
▮▮▮▮ⓑ 转录 (transcription):RNA 是基因转录的产物。mRNA、tRNA、rRNA 和非编码 RNA 都是通过转录过程从 DNA 基因转录而来。
▮▮▮▮ⓒ 翻译 (translation):mRNA 作为蛋白质合成的模板,tRNA 作为氨基酸的载体,rRNA 作为核糖体的组成成分,共同参与蛋白质的翻译过程。
▮▮▮▮ⓓ 基因表达调控 (gene expression regulation):非编码 RNA,如 miRNA、siRNA、lncRNA 等,参与基因表达的调控,可以在转录水平、转录后水平和翻译水平调控基因的表达。
▮▮▮▮ⓔ RNA 世界假说 (RNA world hypothesis):RNA 世界假说认为,在生命起源的早期阶段,RNA 不仅是遗传信息的载体,也具有催化活性,能够执行酶的功能。RNA 可能是生命起源和早期进化的核心分子。
总之,RNA 是一种功能多样的核酸,在基因表达、基因调控和生命起源中都扮演着重要的角色。理解 RNA 的结构、类型和功能,对于深入理解分子生物学和生命科学至关重要。
1.2.3 蛋白质:氨基酸、多肽与蛋白质结构 (Proteins: Amino Acids, Polypeptides, and Protein Structure)
介绍蛋白质的组成单元氨基酸、肽键的形成、蛋白质的四级结构,以及蛋白质结构与功能的关系。
蛋白质 (Protein) 是细胞中含量最丰富的生物大分子,是生命活动的主要执行者。蛋白质具有极其多样化的功能,包括催化生物化学反应 (酶)、构成细胞和组织的结构框架 (结构蛋白)、传递细胞信号 (信号蛋白)、参与细胞运动和物质运输 (运动蛋白)、调控基因表达 (调控蛋白) 等。蛋白质的结构复杂多样,与其功能密切相关。
① 氨基酸 (amino acid):蛋白质的组成单元:蛋白质是由 20 种基本氨基酸 (standard amino acid) 通过肽键 (peptide bond) 连接形成的多聚物。每种氨基酸都具有相同的基本结构:
▮▮▮▮ⓑ 中心碳原子 (α-碳原子):连接四个不同的基团。
▮▮▮▮ⓒ 氨基 (-NH2):碱性基团。
▮▮▮▮ⓓ 羧基 (-COOH):酸性基团。
▮▮▮▮ⓔ 氢原子 (-H)。
▮▮▮▮ⓕ R 基团 (侧链):决定氨基酸种类和特性的可变基团。
20 种基本氨基酸根据 R 基团的性质可以分为不同的类别,如非极性疏水氨基酸、极性亲水氨基酸、酸性氨基酸、碱性氨基酸等。R 基团的性质决定了氨基酸在蛋白质结构和功能中的作用。
② 肽键 (peptide bond) 的形成:氨基酸通过肽键连接形成多肽链 (polypeptide chain)。肽键是连接一个氨基酸的羧基 (-COOH) 和另一个氨基酸的氨基 (-NH2) 的共价键,同时释放一分子水 (脱水缩合)。多肽链具有方向性,一端是氨基端 (N-端),另一端是羧基端 (C-端)。
③ 蛋白质的结构层次:蛋白质的结构可以分为四个层次:一级结构、二级结构、三级结构和四级结构。
▮▮▮▮ⓑ 一级结构 (primary structure):蛋白质的一级结构是指蛋白质多肽链中氨基酸的排列顺序。一级结构是蛋白质结构的基础,决定了蛋白质的高级结构和功能。蛋白质的一级结构由基因的 DNA 序列编码。
▮▮▮▮ⓒ 二级结构 (secondary structure):蛋白质的二级结构是指多肽链骨架原子在空间排列上形成的局部有序结构。常见的二级结构包括:
▮▮▮▮▮▮▮▮❹ α-螺旋 (α-helix):多肽链呈螺旋状盘绕,氨基酸残基的羰基氧原子与下方第四个氨基酸残基的氨基氢原子之间形成氢键,维持螺旋结构的稳定。α-螺旋是蛋白质中最常见的二级结构之一。
▮▮▮▮▮▮▮▮❺ β-折叠 (β-sheet):多肽链呈折叠的片层状结构,相邻多肽链之间或同一条多肽链的不同区段之间通过氢键连接,形成片层结构。β-折叠可以是平行的 (parallel) 或反平行的 (antiparallel)。
▮▮▮▮▮▮▮▮❻ β-转角 (β-turn):连接 α-螺旋和 β-折叠的短链区,通常由 4 个氨基酸残基组成,使多肽链改变方向。
▮▮▮▮▮▮▮▮❼ 无规卷曲 (random coil):不具有规则二级结构的区域。
二级结构是由多肽链骨架原子之间的氢键形成的,反映了多肽链的局部构象。
▮▮▮▮ⓒ 三级结构 (tertiary structure):蛋白质的三级结构是指整条多肽链在三维空间折叠形成的独特构象。三级结构是蛋白质功能的基础。蛋白质的三级结构主要由以下相互作用力维持:
▮▮▮▮▮▮▮▮❷ 疏水相互作用 (hydrophobic interaction):非极性氨基酸残基倾向于聚集在蛋白质内部,避免与水接触。
▮▮▮▮▮▮▮▮❸ 氢键 (hydrogen bond):氨基酸残基之间或氨基酸残基与水分子之间形成的氢键。
▮▮▮▮▮▮▮▮❹ 离子键 (ionic bond):带相反电荷的氨基酸残基之间形成的静电吸引力。
▮▮▮▮▮▮▮▮❺ 二硫键 (disulfide bond):半胱氨酸 (cysteine) 残基的硫氢基 (-SH) 之间形成的共价键。
蛋白质的三级结构是由一级结构决定的,受到二级结构和各种相互作用力的影响。蛋白质的正确折叠形成具有生物活性的天然构象 (native conformation)。
▮▮▮▮ⓓ 四级结构 (quaternary structure):蛋白质的四级结构是指由多个多肽链 (亚基, subunit) 组装形成的蛋白质复合物的结构。具有四级结构的蛋白质称为多聚体蛋白质 (multimeric protein)。亚基之间通过非共价键 (如氢键、离子键、疏水相互作用) 相互作用,形成稳定的复合物。例如,血红蛋白 (hemoglobin) 由 4 个亚基组成,具有四级结构。
并非所有蛋白质都具有四级结构,只有由多个亚基组成的蛋白质才具有四级结构。
④ 蛋白质结构与功能的关系:蛋白质的结构决定其功能,蛋白质的功能依赖于其特定的三维结构。蛋白质的结构与功能之间存在着密切的联系:
▮▮▮▮ⓑ 结构决定功能:蛋白质的生物活性 (如酶的催化活性、受体的配体结合活性、抗体的抗原结合活性等) 取决于其特定的三维结构。蛋白质只有在正确的折叠状态下才能发挥正常的功能。
▮▮▮▮ⓒ 功能反映结构:蛋白质的功能多样性反映了其结构的多样性。不同功能的蛋白质具有不同的结构特征。例如,酶通常具有活性位点 (active site),能够特异性地结合底物并催化化学反应;抗体具有抗原结合位点 (antigen-binding site),能够特异性地识别和结合抗原。
▮▮▮▮ⓓ 结构动态性与功能调控:蛋白质的结构不是静态的,而是具有一定的动态性。蛋白质的构象变化 (conformational change) 可以调控其功能。例如,酶的变构调节 (allosteric regulation) 和蛋白质的翻译后修饰 (post-translational modification) 都可以通过改变蛋白质的结构来调控其功能。
蛋白质的错误折叠 (protein misfolding) 或结构异常会导致蛋白质功能丧失或异常,甚至引发疾病,如阿尔茨海默病 (Alzheimer's disease)、帕金森病 (Parkinson's disease)、疯牛病 (mad cow disease) 等蛋白质折叠疾病 (protein folding disease)。
总之,蛋白质是生命活动的主要执行者,其结构复杂多样,功能广泛。理解氨基酸的组成、肽键的形成、蛋白质的结构层次以及蛋白质结构与功能的关系,是深入理解分子生物学和生命科学的关键。
1.3 分子生物学的中心法则 (Central Dogma of Molecular Biology)
深入解读分子生物学的中心法则,包括 DNA 复制、转录和翻译的过程,以及逆转录和 RNA 复制等特殊情况。
分子生物学的中心法则 (Central Dogma of Molecular Biology) 是由弗朗西斯·克里克 (Francis Crick) 于 1958 年提出的,描述了细胞内遗传信息从 DNA 到 RNA 再到蛋白质的流动方向。中心法则是分子生物学的核心理论,概括了基因表达的基本流程。经典中心法则可以用以下流程图表示:
\[ \text{DNA} \xrightarrow{\text{Replication}} \text{DNA} \xrightarrow{\text{Transcription}} \text{RNA} \xrightarrow{\text{Translation}} \text{Protein} \]
中心法则包括三个主要的遗传信息传递过程:DNA 复制 (DNA replication)、转录 (transcription) 和翻译 (translation)。
1.3.1 DNA 复制 (DNA Replication)
概述 DNA 复制的半保留复制机制、复制酶系、复制起始、延伸和终止过程,以及真核生物和原核生物复制的异同。
DNA 复制 (DNA replication) 是细胞分裂前将 DNA 分子复制成两个完全相同的拷贝的过程,确保遗传信息能够准确地传递给子代细胞。DNA 复制是一个高度精确、快速且复杂的过程,涉及多种酶和蛋白因子的协同作用。
① 半保留复制机制 (semi-conservative replication):DNA 复制的机制是半保留复制。在半保留复制中,亲代 DNA 双螺旋解开,每条链作为模板 (template strand),合成一条新的互补链 (complementary strand)。子代 DNA 分子由一条亲代链和一条新合成的子链组成,因此称为半保留复制。半保留复制机制保证了遗传信息的世代传递的准确性。
② DNA 复制的酶系 (enzymes involved in DNA replication):DNA 复制需要多种酶和蛋白因子的参与,构成复杂的复制酶系,主要包括:
▮▮▮▮ⓑ DNA 聚合酶 (DNA polymerase):DNA 聚合酶是 DNA 复制的核心酶,负责催化脱氧核苷酸 (dNTP) 聚合形成 DNA 链。DNA 聚合酶只能沿着 5'→3' 方向合成 DNA,并且需要引物 (primer) 才能起始 DNA 合成。不同类型的 DNA 聚合酶在复制中发挥不同的作用,如原核生物的 DNA 聚合酶 I、II、III,真核生物的 DNA 聚合酶 α、δ、ε 等。
▮▮▮▮ⓒ 解旋酶 (helicase):解旋酶负责解开 DNA 双螺旋,形成复制叉 (replication fork),为 DNA 复制提供单链 DNA 模板。
▮▮▮▮ⓓ 拓扑异构酶 (topoisomerase):拓扑异构酶负责解除 DNA 复制过程中产生的拓扑张力,防止 DNA 缠绕打结。
▮▮▮▮ⓔ 引物酶 (primase):引物酶是一种 RNA 聚合酶,负责合成 RNA 引物,为 DNA 聚合酶提供 3'-OH 末端,起始 DNA 合成。
▮▮▮▮ⓕ DNA 连接酶 (DNA ligase):DNA 连接酶负责连接冈崎片段 (Okazaki fragment),形成完整的 DNA 子链。
▮▮▮▮ⓖ 单链 DNA 结合蛋白 (single-stranded DNA-binding protein, SSB):SSB 结合到单链 DNA 上,防止单链 DNA 复性,并保护单链 DNA 免受核酸酶 (nuclease) 的降解。
▮▮▮▮ⓗ 核酸外切酶 (exonuclease) 和核酸内切酶 (endonuclease):参与 DNA 复制的校对和修复过程,去除复制错误或损伤的核苷酸。
③ DNA 复制的过程:DNA 复制是一个有序、分阶段进行的过程,可以分为起始 (initiation)、延伸 (elongation) 和终止 (termination) 三个阶段。
▮▮▮▮ⓑ 复制起始 (replication initiation):复制起始发生在 DNA 分子上的特定位点,称为复制起点 (origin of replication, ori)。复制起点通常富含 A=T 碱基对,容易解开双螺旋。在复制起点,起始蛋白 (initiator protein) 识别并结合复制起点序列,解开 DNA 双螺旋,形成复制泡 (replication bubble)。在复制泡的两端形成复制叉,DNA 复制从复制叉开始双向延伸。
▮▮▮▮ⓒ 复制延伸 (replication elongation):复制延伸是指沿着 DNA 模板合成新的 DNA 子链的过程。DNA 聚合酶以亲代 DNA 链为模板,按照碱基互补配对原则,将游离的脱氧核苷酸 (dNTP) 添加到引物的 3'-OH 末端,形成磷酸二酯键,合成新的 DNA 链。由于 DNA 聚合酶只能沿着 5'→3' 方向合成 DNA,而 DNA 双螺旋是反向平行的,因此 DNA 复制过程中,两条子链的合成方式不同:
▮▮▮▮▮▮▮▮❹ 前导链 (leading strand):前导链的合成方向与复制叉的移动方向一致,DNA 聚合酶可以连续地沿着 5'→3' 方向合成前导链。只需要一个 RNA 引物起始合成。
▮▮▮▮▮▮▮▮❺ 滞后链 (lagging strand):滞后链的合成方向与复制叉的移动方向相反,DNA 聚合酶只能不连续地合成滞后链,形成一系列短的 DNA 片段,称为冈崎片段 (Okazaki fragment)。每个冈崎片段都需要一个 RNA 引物起始合成。
在复制延伸过程中,解旋酶不断解开 DNA 双螺旋,复制叉不断移动,前导链连续合成,滞后链不连续合成冈崎片段。RNA 引物酶在滞后链上合成 RNA 引物,DNA 聚合酶合成冈崎片段,DNA 聚合酶 I 去除 RNA 引物并填补空隙,DNA 连接酶连接冈崎片段,最终形成完整的滞后链。
▮▮▮▮ⓒ 复制终止 (replication termination):复制终止是指 DNA 复制完成,复制叉停止移动,复制过程结束。复制终止的机制在原核生物和真核生物中有所不同。
▮▮▮▮▮▮▮▮❷ 原核生物复制终止:原核生物的 DNA 通常是环状的,复制从一个复制起点双向延伸,最终两个复制叉在复制终止位点 (ter site) 相遇,复制终止。复制终止位点通常包含终止序列,可以阻碍复制叉的移动。
▮▮▮▮▮▮▮▮❸ 真核生物复制终止:真核生物的 DNA 是线性的,具有多个复制起点。复制从多个复制起点同时起始,双向延伸,最终相邻复制泡融合,完成 DNA 复制。真核生物染色体末端存在端粒 (telomere),端粒酶 (telomerase) 负责维持端粒的长度,解决线性染色体末端复制的问题。
④ 原核生物和真核生物 DNA 复制的异同:原核生物和真核生物的 DNA 复制在基本机制上是相似的,但在一些细节上存在差异:
▮▮▮▮ⓑ 复制起点:原核生物通常只有一个复制起点,真核生物有多个复制起点。
▮▮▮▮ⓒ 复制速度:原核生物 DNA 复制速度比真核生物快。
▮▮▮▮ⓓ DNA 聚合酶:原核生物和真核生物使用不同类型的 DNA 聚合酶。
▮▮▮▮ⓔ 染色质结构:真核生物 DNA 与组蛋白 (histone) 结合形成染色质 (chromatin),染色质结构对 DNA 复制有影响。真核生物 DNA 复制需要染色质重塑复合物 (chromatin remodeling complex) 和组蛋白伴侣 (histone chaperone) 的参与。
▮▮▮▮ⓕ 端粒复制:真核生物线性染色体末端存在端粒,端粒酶负责维持端粒的长度,解决线性染色体末端复制的问题。原核生物环状 DNA 没有端粒复制问题。
DNA 复制是生命活动的基础,保证了遗传信息的准确传递。对 DNA 复制机制的深入理解,不仅有助于我们理解生命现象的本质,也为疾病的诊断和治疗提供了理论基础。例如,抗病毒药物和抗肿瘤药物中,有一些药物的作用机制是抑制 DNA 复制。
1.3.2 转录 (Transcription)
概述转录的过程,包括 RNA 聚合酶、启动子、转录起始、延伸和终止,以及不同类型 RNA 的转录特点。
转录 (transcription) 是指以 DNA 为模板合成 RNA 分子的过程。转录是基因表达的第一步,将 DNA 上的遗传信息转录到 RNA 分子上,为后续的翻译过程提供模板。
① RNA 聚合酶 (RNA polymerase):RNA 聚合酶是转录的核心酶,负责催化核糖核苷酸 (rNTP) 聚合形成 RNA 链。RNA 聚合酶以 DNA 链为模板,沿着 3'→5' 方向读取 DNA 序列,合成与 DNA 模板链互补的 RNA 分子,RNA 合成方向为 5'→3'。RNA 聚合酶不需要引物即可起始 RNA 合成。
▮▮▮▮ⓑ 原核生物 RNA 聚合酶:原核生物通常只有一种 RNA 聚合酶,负责转录所有类型的 RNA (mRNA, tRNA, rRNA)。原核生物 RNA 聚合酶由多个亚基组成,包括 α、β、β'、σ 和 ω 亚基。σ 因子 (sigma factor) 负责识别启动子 (promoter),起始转录。
▮▮▮▮ⓒ 真核生物 RNA 聚合酶:真核生物有三种主要的 RNA 聚合酶,分别负责转录不同类型的 RNA:
▮▮▮▮▮▮▮▮❹ RNA 聚合酶 I (RNA polymerase I, Pol I):转录 rRNA 基因,合成 rRNA 前体 (pre-rRNA)。
▮▮▮▮▮▮▮▮❺ RNA 聚合酶 II (RNA polymerase II, Pol II):转录 mRNA 基因、miRNA 基因和 lncRNA 基因,合成 mRNA 前体 (pre-mRNA) 和其他非编码 RNA。
▮▮▮▮▮▮▮▮❻ RNA 聚合酶 III (RNA polymerase III, Pol III):转录 tRNA 基因、5S rRNA 基因和其他小 RNA 基因,合成 tRNA 前体 (pre-tRNA)、5S rRNA 和其他小 RNA。
② 启动子 (promoter):启动子是 DNA 序列上 RNA 聚合酶结合和起始转录的区域,位于基因的 5' 上游。启动子序列决定了基因转录的起始位点和转录频率。
▮▮▮▮ⓑ 原核生物启动子:原核生物启动子通常包含两个保守序列:-10 区 (Pribnow box, TATAAT 序列) 和 -35 区 (TTGACA 序列)。σ 因子识别并结合启动子 -10 区和 -35 区,引导 RNA 聚合酶结合到启动子上,起始转录。
▮▮▮▮ⓒ 真核生物启动子:真核生物启动子结构复杂多样,通常包含核心启动子区 (core promoter region) 和近端启动子区 (proximal promoter region)。核心启动子区位于转录起始位点附近,包含 TATA 盒 (TATA box, TATAAA 序列)、起始子 (initiator, Inr) 和下游启动子元件 (downstream promoter element, DPE) 等序列。TATA 结合蛋白 (TATA-binding protein, TBP) 识别并结合 TATA 盒,是 RNA 聚合酶 II 转录起始的关键步骤。近端启动子区位于核心启动子上游,包含多种顺式作用元件 (cis-regulatory element),如 CAAT 盒、GC 盒等,与基因表达调控有关。
③ 转录的过程:转录过程可以分为起始 (initiation)、延伸 (elongation) 和终止 (termination) 三个阶段。
▮▮▮▮ⓑ 转录起始 (transcription initiation):转录起始是指 RNA 聚合酶结合到启动子,解开 DNA 双螺旋,形成转录起始复合物 (transcription initiation complex),并开始合成 RNA 分子的过程。
▮▮▮▮▮▮▮▮❸ 原核生物转录起始:σ 因子识别并结合启动子,引导 RNA 聚合酶结合到启动子上,形成封闭复合物 (closed complex)。RNA 聚合酶解开启动子区域的 DNA 双螺旋,形成开放复合物 (open complex)。RNA 聚合酶开始合成 RNA 分子,合成最初几个核苷酸后,σ 因子释放,RNA 聚合酶进入延伸阶段。
▮▮▮▮▮▮▮▮❹ 真核生物转录起始:真核生物 RNA 聚合酶 II 转录起始需要多种通用转录因子 (general transcription factor, GTF) 的参与,如 TFIIB、TFIID、TFIIE、TFIIF、TFIIH 等。TFIID 复合物中的 TBP 识别并结合 TATA 盒,其他 GTF 依次结合到启动子区域,形成前起始复合物 (preinitiation complex, PIC)。RNA 聚合酶 II 结合到 PIC 上,TFIIH 具有解旋酶活性和激酶活性,解开启动子区域 DNA 双螺旋,磷酸化 RNA 聚合酶 II 的 C 端结构域 (C-terminal domain, CTD),激活 RNA 聚合酶 II,起始转录。
▮▮▮▮ⓑ 转录延伸 (transcription elongation):转录延伸是指 RNA 聚合酶沿着 DNA 模板链移动,不断合成 RNA 分子的过程。RNA 聚合酶沿着 DNA 模板链 3'→5' 方向移动,合成 RNA 分子 5'→3' 方向延伸。在转录延伸过程中,RNA 聚合酶维持转录泡 (transcription bubble),解开 DNA 双螺旋,暴露出单链 DNA 模板,同时将核糖核苷酸 (rNTP) 添加到 RNA 分子的 3'-OH 末端,形成磷酸二酯键。转录延伸的速率和效率受到多种因素的调控,如 DNA 序列、染色质结构、转录延伸因子 (transcription elongation factor) 等。
▮▮▮▮ⓒ 转录终止 (transcription termination):转录终止是指 RNA 聚合酶到达转录终止信号,停止转录,释放 RNA 分子,并与 DNA 模板分离的过程。转录终止的机制在原核生物和真核生物中有所不同。
▮▮▮▮▮▮▮▮❸ 原核生物转录终止:原核生物转录终止主要有两种机制:ρ 依赖性终止 (rho-dependent termination) 和 ρ 非依赖性终止 (rho-independent termination)。ρ 非依赖性终止依赖于 DNA 模板链上的终止序列,终止序列转录成 RNA 后形成发夹结构,导致 RNA 聚合酶停顿,转录终止。ρ 依赖性终止需要 ρ 蛋白 (rho protein) 的参与,ρ 蛋白是一种 ATP 酶,结合到 RNA 分子上,沿着 RNA 分子 5'→3' 方向移动,追赶 RNA 聚合酶,到达转录泡后,利用 ATP 水解的能量,解开 RNA-DNA 杂合链,导致转录终止。
▮▮▮▮▮▮▮▮❹ 真核生物转录终止:真核生物 RNA 聚合酶 II 转录终止机制复杂,与 RNA 的加工过程密切相关。对于 mRNA 基因,转录终止与 3' 端加工 (3'-end processing) 偶联。当 RNA 聚合酶 II 转录过 poly(A) 加尾信号序列 (polyadenylation signal sequence, AAUAAA) 后,CstF (cleavage stimulation factor) 和 CPSF (cleavage and polyadenylation specificity factor) 等蛋白因子识别并结合 poly(A) 加尾信号序列,切割 RNA 分子,并在 RNA 3' 端添加 poly(A) 尾,同时转录终止。
④ 不同类型 RNA 的转录特点:不同类型 RNA (mRNA, tRNA, rRNA) 的转录过程在启动子、RNA 聚合酶、转录调控等方面存在差异,反映了不同类型 RNA 的功能特点。
▮▮▮▮ⓑ mRNA 转录:mRNA 转录由 RNA 聚合酶 II 负责,启动子结构复杂,转录调控精细,受到多种转录因子和调控元件的调控。mRNA 转录产物需要经过 RNA 加工 (RNA processing),如加帽 (capping)、剪接 (splicing)、加尾 (polyadenylation) 等,才能成为成熟的 mRNA 分子。
▮▮▮▮ⓒ tRNA 转录:tRNA 转录由 RNA 聚合酶 III 负责,启动子位于基因内部,转录起始位点精确。tRNA 转录产物需要经过 RNA 加工,如 5' 端前导序列切除、3' 端尾部序列切除、内含子剪接、碱基修饰等,才能成为成熟的 tRNA 分子。
▮▮▮▮ⓓ rRNA 转录:rRNA 转录由 RNA 聚合酶 I 负责,在核仁 (nucleolus) 中进行,转录 rRNA 基因簇,合成 rRNA 前体 (pre-rRNA)。rRNA 前体需要经过 RNA 加工,如切割、修饰等,才能生成成熟的 rRNA 分子 (18S rRNA, 5.8S rRNA, 28S rRNA, 5S rRNA)。
转录是基因表达的关键步骤,将 DNA 上的遗传信息转化为 RNA 分子,为蛋白质合成和基因调控奠定基础。对转录机制的深入理解,有助于我们理解基因表达的调控规律,以及基因表达异常与疾病发生的关系。
1.3.3 翻译 (Translation)
概述翻译的过程,包括核糖体、tRNA、mRNA 的作用,翻译的起始、延伸和终止,以及蛋白质的折叠和修饰。
翻译 (translation) 是指以 mRNA 为模板,将 mRNA 上的遗传密码 (codon) 翻译成蛋白质的氨基酸序列的过程。翻译是基因表达的最后一步,将遗传信息从核酸序列转化为蛋白质序列,实现基因的功能。
① 核糖体 (ribosome):核糖体是蛋白质合成的场所,是一种复杂的核糖核蛋白复合物 (ribonucleoprotein complex),由 rRNA 和核糖体蛋白 (ribosomal protein) 组成。核糖体由大小两个亚基组成:
▮▮▮▮ⓑ 大亚基 (large subunit):真核生物核糖体大亚基为 60S,原核生物为 50S。大亚基主要负责催化肽键的形成 (肽基转移酶活性, peptidyl transferase activity)。
▮▮▮▮ⓒ 小亚基 (small subunit):真核生物核糖体小亚基为 40S,原核生物为 30S。小亚基主要负责 mRNA 和 tRNA 的结合,以及密码子的识别和解码。
核糖体具有三个 tRNA 结合位点:A 位点 (aminoacyl-tRNA binding site)、P 位点 (peptidyl-tRNA binding site) 和 E 位点 (exit site)。A 位点结合携带氨基酸的氨基酰 tRNA (aminoacyl-tRNA);P 位点结合携带肽链的肽酰 tRNA (peptidyl-tRNA);E 位点结合脱酰 tRNA (deacylated tRNA),准备离开核糖体。
② 转运 RNA (transfer RNA, tRNA):tRNA 是翻译过程中的“适配器”分子,负责识别 mRNA 上的密码子,并携带相应的氨基酸到核糖体。tRNA 分子具有特定的三叶草结构或 L 形结构,包含:
▮▮▮▮ⓑ 氨基酸臂 (acceptor arm):tRNA 3' 端 CCA 序列,氨基酸连接在 3' 端的腺苷 (A) 上。
▮▮▮▮ⓒ 反密码子环 (anticodon loop):包含反密码子序列,能够与 mRNA 上的密码子互补配对。
▮▮▮▮ⓓ D 环 (D loop) 和 TΨC 环 (TΨC loop):含有修饰碱基,参与 tRNA 的折叠和稳定。
每种氨基酸都对应一种或多种 tRNA,氨基酰 tRNA 合成酶 (aminoacyl-tRNA synthetase) 负责将氨基酸正确地连接到相应的 tRNA 上,形成氨基酰 tRNA。
③ 信使 RNA (messenger RNA, mRNA):mRNA 是翻译的模板,携带遗传密码,指导蛋白质的氨基酸序列。mRNA 分子包含:
▮▮▮▮ⓑ 5' 非翻译区 (5' untranslated region, 5' UTR):位于起始密码子 (start codon, AUG) 上游的区域,参与翻译起始的调控。
▮▮▮▮ⓒ 编码区 (coding region):包含一系列密码子,编码蛋白质的氨基酸序列。
▮▮▮▮ⓓ 3' 非翻译区 (3' untranslated region, 3' UTR):位于终止密码子 (stop codon, UAA, UAG, UGA) 下游的区域,参与 mRNA 稳定性、翻译效率和定位的调控。
▮▮▮▮ⓔ 5' 帽 (5' cap) 和 3' poly(A) 尾 (3' poly(A) tail):真核生物 mRNA 的 5' 端有 5' 帽结构,3' 端有 poly(A) 尾,增强 mRNA 的稳定性,促进翻译起始。
④ 翻译的过程:翻译过程可以分为起始 (initiation)、延伸 (elongation) 和终止 (termination) 三个阶段。
▮▮▮▮ⓑ 翻译起始 (translation initiation):翻译起始是指核糖体、mRNA 和起始 tRNA 组装形成翻译起始复合物 (translation initiation complex),并开始翻译 mRNA 密码子的过程。
▮▮▮▮▮▮▮▮❸ 原核生物翻译起始:原核生物翻译起始需要起始因子 (initiation factor, IF) IF1、IF2、IF3 的参与。小亚基 (30S) 结合 IF1 和 mRNA,识别 mRNA 上的核糖体结合位点 (Shine-Dalgarno sequence),引导核糖体结合到 mRNA 上。起始 tRNA (fMet-tRNAfMet) 结合 IF2 和 GTP,进入核糖体 P 位点,与起始密码子 AUG 配对。大亚基 (50S) 加入,形成 70S 起始复合物,IF1、IF2、IF3 释放,GTP 水解。
▮▮▮▮▮▮▮▮❹ 真核生物翻译起始:真核生物翻译起始过程复杂,需要多种起始因子 (eIFs, eukaryotic initiation factors) 的参与,如 eIF1、eIF1A、eIF2、eIF3、eIF4E、eIF4G、eIF4A、eIF4B、eIF5、eIF5B、eIF6 等。小亚基 (40S) 结合 eIF1、eIF1A、eIF3 和 eIF5,形成 43S 前起始复合物 (43S preinitiation complex)。43S 前起始复合物结合 mRNA 5' 帽结构,扫描 mRNA,寻找起始密码子 AUG。起始 tRNA (Met-tRNAiMet) 结合 eIF2 和 GTP,进入核糖体 P 位点,与起始密码子 AUG 配对。大亚基 (60S) 加入,形成 80S 起始复合物,eIFs 释放,GTP 水解。
▮▮▮▮ⓑ 翻译延伸 (translation elongation):翻译延伸是指核糖体沿着 mRNA 移动,不断将氨基酸添加到肽链上的过程。翻译延伸是一个循环过程,包括三个步骤:
▮▮▮▮▮▮▮▮❷ 密码子识别 (codon recognition):下一个氨基酰 tRNA (aminoacyl-tRNA) 结合延伸因子 (elongation factor, EF-Tu) 和 GTP,进入核糖体 A 位点,反密码子与 mRNA 上的密码子互补配对。
▮▮▮▮▮▮▮▮❸ 肽键形成 (peptide bond formation):核糖体 rRNA 具有肽基转移酶活性,催化 P 位点肽酰 tRNA 上的肽链转移到 A 位点氨基酰 tRNA 的氨基酸上,形成肽键。
▮▮▮▮▮▮▮▮❹ 转位 (translocation):核糖体沿着 mRNA 移动一个密码子的距离,原来位于 A 位点的肽酰 tRNA 移动到 P 位点,原来位于 P 位点的脱酰 tRNA 移动到 E 位点并释放,A 位点空出来,准备接受下一个氨基酰 tRNA。转位需要延伸因子 EF-G (原核生物) 或 eEF2 (真核生物) 和 GTP 的参与。
翻译延伸过程不断重复,直到核糖体遇到终止密码子。
▮▮▮▮ⓒ 翻译终止 (translation termination):翻译终止是指核糖体遇到 mRNA 上的终止密码子 (UAA, UAG, UGA),停止翻译,释放肽链和核糖体的过程。终止密码子不编码氨基酸,而是作为终止信号。
▮▮▮▮▮▮▮▮❷ 原核生物翻译终止:原核生物翻译终止需要释放因子 (release factor, RF) RF1、RF2、RF3 的参与。当核糖体 A 位点遇到终止密码子时,RF1 或 RF2 识别并结合终止密码子,RF3-GTP 结合到核糖体上,促进肽链水解和释放。核糖体解离成大小亚基,mRNA 和 tRNA 释放。
▮▮▮▮▮▮▮▮❸ 真核生物翻译终止:真核生物翻译终止需要释放因子 eRF1 和 eRF3 的参与。eRF1 识别所有三种终止密码子,eRF3-GTP 促进肽链水解和释放。核糖体解离成大小亚基,mRNA 和 tRNA 释放。
⑤ 蛋白质的折叠、修饰和转运:翻译结束后,新合成的多肽链需要折叠成具有生物活性的三维结构,并可能经过翻译后修饰 (post-translational modification, PTM),才能发挥正常的功能。蛋白质还需要转运到细胞内的特定部位或分泌到细胞外,才能发挥作用。
▮▮▮▮ⓑ 蛋白质折叠 (protein folding):多肽链在分子伴侣 (molecular chaperone) 的辅助下,折叠成具有生物活性的三维结构。蛋白质折叠是一个复杂的过程,受到氨基酸序列、分子伴侣、细胞环境等多种因素的影响。
▮▮▮▮ⓒ 蛋白质翻译后修饰 (post-translational modification, PTM):蛋白质翻译后修饰是指在蛋白质合成后,对其化学结构进行修饰的过程,如磷酸化 (phosphorylation)、糖基化 (glycosylation)、泛素化 (ubiquitination)、乙酰化 (acetylation)、甲基化 (methylation) 等。PTM 可以改变蛋白质的结构、活性、稳定性、定位和相互作用,调控蛋白质的功能。
▮▮▮▮ⓓ 蛋白质转运 (protein transport):蛋白质需要转运到细胞内的特定部位 (如细胞核、内质网、高尔基体、线粒体、叶绿体等) 或分泌到细胞外,才能发挥作用。蛋白质转运需要信号肽 (signal peptide) 和转运机制的参与。
翻译是基因表达的最后一步,将 mRNA 上的遗传信息转化为蛋白质,实现基因的功能。对翻译机制的深入理解,有助于我们理解基因表达的完整过程,以及基因表达调控的分子机制。蛋白质是生命活动的主要执行者,翻译过程的异常与多种疾病的发生有关。
1.3.4 中心法则的例外与扩展 (Exceptions and Extensions to the Central Dogma)
介绍逆转录、RNA 复制等对中心法则的补充和扩展,以及非编码 RNA 的发现对中心法则的挑战。
经典分子生物学中心法则描述了遗传信息从 DNA 到 RNA 再到蛋白质的单向流动。然而,随着分子生物学的深入研究,人们发现中心法则存在一些例外和扩展,需要对中心法则进行补充和完善。
① 逆转录 (reverse transcription):逆转录是指以 RNA 为模板合成 DNA 的过程,与中心法则的 DNA→RNA 方向相反。逆转录是由逆转录酶 (reverse transcriptase) 催化的。逆转录现象最初在逆转录病毒 (retrovirus) 中发现,如 HIV 病毒。逆转录病毒的基因组是 RNA,病毒感染宿主细胞后,利用逆转录酶将 RNA 基因组逆转录成 DNA,整合到宿主细胞基因组中,进行复制和表达。逆转录现象表明,遗传信息也可以从 RNA 流向 DNA,是对中心法则的重要补充。
\[ \text{RNA} \xrightarrow{\text{Reverse Transcription}} \text{DNA} \]
逆转录酶不仅存在于逆转录病毒中,也存在于一些真核生物细胞中,如端粒酶 (telomerase) 就具有逆转录酶活性,利用 RNA 模板合成端粒 DNA。逆转录技术在分子生物学研究和生物技术领域具有广泛应用,如 cDNA 文库的构建、RT-PCR (reverse transcription PCR) 等。
② RNA 复制 (RNA replication):RNA 复制是指以 RNA 为模板合成 RNA 的过程。RNA 复制主要发生在 RNA 病毒中,如流感病毒、SARS-CoV-2 病毒等。RNA 病毒的基因组是 RNA,病毒复制时,利用 RNA 复制酶 (RNA-dependent RNA polymerase, RdRP) 以 RNA 基因组为模板,合成新的 RNA 基因组。RNA 复制现象表明,遗传信息也可以在 RNA 分子之间复制和传递,是对中心法则的扩展。
\[ \text{RNA} \xrightarrow{\text{RNA Replication}} \text{RNA} \]
RNA 复制酶在宿主细胞中通常不存在,RNA 病毒需要编码 RNA 复制酶才能进行 RNA 复制。RNA 复制酶的保真性较低,容易产生突变,导致 RNA 病毒的变异速度快,进化速度快,给疫苗和药物的开发带来挑战。
③ RNA 编辑 (RNA editing):RNA 编辑是指在 RNA 分子转录后,对其序列进行修饰和改变的过程,导致 RNA 序列与 DNA 模板序列不一致。RNA 编辑可以改变 RNA 的编码信息,调控基因表达。RNA 编辑主要有两种类型:碱基插入/缺失 (insertion/deletion) 和碱基替换 (substitution)。RNA 编辑在不同生物和不同基因中都有发现,如哺乳动物的 ApoB 基因 mRNA 的 C→U 编辑,可以改变蛋白质的氨基酸序列和功能。RNA 编辑现象表明,遗传信息的流动不是完全线性的,RNA 序列可以在转录后发生改变,是对中心法则的复杂化。
④ 非编码 RNA (non-coding RNA, ncRNA) 的发现:经典中心法则主要关注编码蛋白质的 mRNA,认为遗传信息的主要目的是合成蛋白质。然而,近年来,人们发现细胞中存在大量的非编码 RNA,如 tRNA、rRNA、miRNA、siRNA、lncRNA 等,它们不编码蛋白质,但却在基因表达调控、染色质结构调控、细胞功能调控等多种生物过程中发挥着重要作用。非编码 RNA 的发现挑战了中心法则的“以蛋白质为中心”的观点,表明 RNA 不仅仅是遗传信息的中间载体,也具有重要的调控功能。非编码 RNA 的研究拓展了我们对基因表达和生命调控的认识,丰富了中心法则的内涵。
⑤ 朊病毒 (prion):朊病毒是一种具有感染性的蛋白质分子,能够自我复制和传播,引起朊病毒病 (prion disease),如疯牛病、羊瘙痒病、克雅氏病等。朊病毒的复制机制不同于传统的遗传信息传递方式,不依赖于核酸,而是通过诱导正常蛋白质构象转变来实现自我复制。朊病毒的发现挑战了中心法则的“遗传信息只能由核酸携带”的观点,表明蛋白质在特定情况下也可以作为遗传信息的载体。然而,朊病毒的遗传信息传递方式非常特殊,并不普遍适用于所有生物,因此朊病毒被认为是中心法则的例外情况。
中心法则的例外和扩展表明,遗传信息的流动和表达机制比最初的设想更加复杂多样。随着分子生物学的不断发展,我们对遗传信息的认识也在不断深入和完善。中心法则仍然是分子生物学的核心理论框架,但需要不断地修正和扩展,以适应新的发现和认识。对中心法则的深入理解,有助于我们更全面地认识生命现象的本质,并为疾病的防治和生物技术的创新提供理论指导。
2. 基因组的结构与功能 (Genome Structure and Function)
本章深入探讨基因组的组织结构、染色质的构成、基因的结构与功能,以及基因组的变异和进化,帮助读者理解基因组的复杂性和动态性。
2.1 基因组的组织层次 (Organizational Levels of the Genome)
本节介绍基因组的组织层次,从 DNA 分子到染色体,再到细胞核内的三维结构,以及不同生物基因组的特点。
2.1.1 原核生物基因组 (Prokaryotic Genomes)
原核生物,如细菌和古菌,的基因组结构相对真核生物来说更为简洁高效。理解原核生物基因组的特点,有助于我们认识生命结构多样性的统一性。原核生物基因组主要有以下几个显著特点:
① 环状 DNA 分子 (Circular DNA Molecule):
▮ 绝大多数原核生物的基因组 DNA 呈环状,形成一个或多个染色体。这种环状结构使得 DNA 分子更加稳定,不易受到末端降解的影响。
▮ 典型的细菌染色体是一个大型的环状双链 DNA 分子,例如大肠杆菌 ( Escherichia coli) 的基因组就是一个约 4.6 Mb (百万碱基对) 的环状 DNA。
▮ 环状染色体通常高度折叠和超螺旋化,形成拟核 (nucleoid) 结构,紧密地聚集在细胞质的特定区域,但没有核膜包被的细胞核。
② 质粒 (Plasmids):
▮ 除了染色体 DNA 之外,许多原核生物还含有质粒 (plasmids),质粒是染色体外自主复制的小型环状 DNA 分子。
▮ 质粒通常携带一些非必需但对细菌生存具有优势的基因,例如抗生素抗性基因、毒素基因、代谢酶基因等。
▮ 质粒在细菌的水平基因转移中起着重要作用,可以通过接合 (conjugation)、转化 (transformation) 或转导 (transduction) 等方式在细菌之间传递,导致抗生素抗性的快速传播等现象。
▮ 质粒也是基因工程中常用的载体 (vector),用于基因克隆和基因表达。
③ 基因密度高 (High Gene Density):
▮ 原核生物基因组的基因密度非常高,编码序列占基因组的大部分比例。
▮ 基因之间通常间隔很短,基因间区 (intergenic region) 较小,非编码 DNA 序列相对较少。
▮ 这种高基因密度反映了原核生物基因组的经济性和高效性,以最小的基因组大小编码尽可能多的生命功能。
④ 操纵子结构 (Operon Structure):
▮ 许多原核生物基因以操纵子 (operon) 的形式组织。操纵子是指在基因组中将功能相关的多个基因串联排列在一起,由同一个启动子 (promoter) 和终止子 (terminator) 调控的基因簇。
▮ 操纵子结构使得原核生物可以协调地调控多个基因的表达,实现对特定代谢途径或生理过程的统一调控。
▮ 典型的操纵子包括结构基因 (structural genes)、启动子 (promoter)、操纵序列 (operator) 和调节基因 (regulatory gene) 等组件。例如,乳糖操纵子 ( lac operon) 是研究最为透彻的操纵子之一,调控大肠杆菌对乳糖的利用。
⑤ 缺乏内含子 (Introns Absent):
▮ 原核生物基因的编码区通常是连续的,缺乏内含子 (introns)。这意味着原核生物的基因转录产生的 mRNA 无需剪接加工即可直接用于翻译蛋白质。
▮ 少数古菌中发现了内含子,但原核生物内含子的普遍性远低于真核生物。
⑥ 少量的重复序列 (Limited Repetitive Sequences):
▮ 与真核生物基因组相比,原核生物基因组中重复序列 (repetitive sequences) 的含量较少。
▮ 常见的重复序列包括插入序列 (insertion sequences, IS) 和转座子 (transposons) 等,但其比例远低于真核生物基因组中的散在重复序列 (interspersed repeats) 和串联重复序列 (tandem repeats)。
⑦ 紧凑的基因组大小 (Compact Genome Size):
▮ 原核生物基因组的大小通常比真核生物基因组小得多,范围从几十万碱基对到几百万碱基对不等。
▮ 基因组大小与原核生物的复杂程度和生活方式相关,例如,寄生性细菌的基因组往往比自由生活细菌的基因组更小。
理解原核生物基因组的这些特点,有助于我们深入认识原核生物的遗传信息组织方式、基因表达调控机制以及进化特点。
2.1.2 真核生物基因组 (Eukaryotic Genomes)
真核生物,包括植物、动物、真菌和原生生物,的基因组结构比原核生物复杂得多,体现了生命复杂性的进化。真核生物基因组具有以下主要特点:
① 线性染色体 (Linear Chromosomes):
▮ 真核生物的基因组 DNA 被组织成多个线性染色体 (linear chromosomes),而不是原核生物的环状染色体。
▮ 染色体位于细胞核内,被核膜包被,形成真正的细胞核。
▮ 不同物种的染色体数目和大小差异很大,例如,人类细胞有 23 对(46 条)染色体,果蝇细胞有 4 对(8 条)染色体。
▮ 线性染色体的末端具有特殊的结构,称为端粒 (telomere),由重复序列和蛋白质复合体组成,保护染色体末端免受损伤,并参与染色体复制和稳定性维持。
② 染色质结构 (Chromatin Structure):
▮ 真核生物基因组 DNA 与组蛋白 (histones) 和非组蛋白等蛋白质结合,形成染色质 (chromatin)。
▮ 染色质是 DNA 在细胞核内的基本组织形式,对 DNA 的包装、基因表达调控、DNA 复制和修复等过程至关重要。
▮ 染色质的基本结构单位是核小体 (nucleosome),由约 147 bp 的 DNA 缠绕在八聚体组蛋白 (两个 H2A-H2B 二聚体和 H3-H4 四聚体) 上形成。
▮ 核小体进一步折叠形成更高级的染色质结构,如 30nm 纤维 (30nm fiber)、染色质环 (chromatin loops) 和 染色质区室 (chromatin compartments) 等,实现对 DNA 的多级压缩和组织。
③ 基因密度低 (Low Gene Density):
▮ 与原核生物相比,真核生物基因组的基因密度较低,编码序列仅占基因组的一小部分比例。
▮ 大量的基因组 DNA 是非编码序列,包括基因间区 (intergenic regions)、内含子 (introns)、重复序列 (repetitive sequences) 等。
▮ 人类基因组中,编码蛋白质的基因序列仅占约 1.5%,而其余部分为非编码 DNA。
④ 内含子和外显子 (Introns and Exons):
▮ 真核生物基因的编码区通常是不连续的,被内含子 (introns) 分隔成多个外显子 (exons)。
▮ 外显子 (exons) 是基因中编码蛋白质序列的部分,而 内含子 (introns) 是基因中非编码蛋白质序列的部分。
▮ 基因转录产生的 前体 mRNA (pre-mRNA) 需要经过 RNA 剪接 (RNA splicing) 过程,去除内含子,将外显子连接起来,形成成熟的 mRNA 才能用于翻译蛋白质。
▮ 内含子的存在和 可变剪接 (alternative splicing) 机制增加了基因表达的复杂性和多样性。
⑤ 重复序列 (Repetitive Sequences):
▮ 真核生物基因组中含有大量的 重复序列 (repetitive sequences),约占人类基因组的一半以上。
▮ 重复序列可以分为两大类:散在重复序列 (interspersed repeats) 和 串联重复序列 (tandem repeats)。
▮ 散在重复序列 (interspersed repeats) 分散在基因组各处,主要包括 转座元件 (transposable elements, TEs),如 长散在核元件 (long interspersed nuclear elements, LINEs) 和 短散在核元件 (short interspersed nuclear elements, SINEs)。人类基因组中,LINE-1 和 Alu 元件是最主要的散在重复序列。
▮ 串联重复序列 (tandem repeats) 呈串联排列,在基因组的特定区域高度富集,如 卫星 DNA (satellite DNA)、小卫星 DNA (minisatellite DNA) 和 微卫星 DNA (microsatellite DNA)。端粒和着丝粒区域富含串联重复序列。
▮ 重复序列在基因组结构、染色体功能、基因表达调控和基因组进化中发挥着重要作用。
⑥ 基因家族 (Gene Families):
▮ 真核生物基因组中存在大量的 基因家族 (gene families),即由基因重复事件产生的、具有相似序列和相关功能的基因集合。
▮ 基因家族的成员可以通过 基因重复 (gene duplication)、基因散布 (gene dispersion) 等机制在基因组中扩增和分布。
▮ 基因家族的出现增加了基因组的功能冗余性和进化可塑性,使得生物体能够适应复杂多变的环境。例如,珠蛋白基因家族 (globin gene family) 编码不同类型的珠蛋白链,参与氧气运输和储存。
⑦ 复杂的基因调控 (Complex Gene Regulation):
▮ 真核生物基因表达调控机制非常复杂,涉及 转录调控 (transcriptional regulation)、转录后调控 (post-transcriptional regulation)、翻译调控 (translational regulation) 和 蛋白质水平调控 (post-translational regulation) 等多个层面。
▮ 基因调控受到多种因素的影响,包括 转录因子 (transcription factors)、顺式作用元件 (cis-regulatory elements)、染色质结构 (chromatin structure)、表观遗传修饰 (epigenetic modifications) 和 非编码 RNA (non-coding RNAs) 等。
▮ 复杂的基因调控网络使得真核生物能够实现精细的基因表达控制,适应复杂的生活环境和发育过程。
真核生物基因组的这些复杂特点,反映了真核生物在进化过程中获得的巨大复杂性和调控能力,是真核生物生命活动多样性的遗传基础。
2.1.3 病毒基因组 (Viral Genomes)
病毒是一类非细胞生命形态,其基因组结构和复制机制多种多样,展现了生命遗传物质的多样性。病毒基因组具有以下特点:
① 基因组多样性 (Genome Diversity):
▮ 病毒基因组的遗传物质可以是 DNA 或 RNA,可以是 双链 (double-stranded, ds) 或 单链 (single-stranded, ss),可以是 线性 (linear) 或 环状 (circular),还可以是 分节段的 (segmented)。
▮ 这种基因组多样性在所有生物中是独一无二的。根据基因组类型,病毒可以分为 DNA 病毒和 RNA 病毒两大类。
▮ DNA 病毒 (DNA viruses):基因组为 DNA,可以是 dsDNA (如 噬菌体 T4、疱疹病毒) 或 ssDNA (如 细小病毒)。
▮ RNA 病毒 (RNA viruses):基因组为 RNA,可以是 dsRNA (如 呼肠孤病毒) 或 ssRNA (如 流感病毒、HIV)。ssRNA 病毒又可分为正链 RNA 病毒 (positive-sense RNA viruses) 和负链 RNA 病毒 (negative-sense RNA viruses)。
▪ 正链 RNA 病毒 (positive-sense RNA viruses):其 RNA 基因组可以直接作为 mRNA 翻译蛋白质,如 脊髓灰质炎病毒 (poliovirus)、寨卡病毒 (Zika virus)。
▪ 负链 RNA 病毒 (negative-sense RNA viruses):其 RNA 基因组不能直接翻译,需要先转录成正链 RNA 才能作为 mRNA,如 流感病毒 (influenza virus)、狂犬病毒 (rabies virus)。
② 基因组大小差异大 (Variable Genome Size):
▮ 病毒基因组的大小差异很大,从几千个碱基对到几十万个碱基对不等。
▮ 最小的病毒基因组只编码几个基因,而最大的病毒基因组可以编码数百个基因。
▮ 基因组大小与病毒的复杂程度和生活方式相关。例如,拟菌病毒 (Mimivirus) 是一种巨型病毒,其基因组大小超过 1 Mb,编码的基因数量超过许多细菌。
③ 基因组结构紧凑 (Compact Genome Structure):
▮ 病毒基因组通常结构非常紧凑,基因密度很高,基因之间重叠现象普遍存在。
▮ 病毒基因组的非编码序列很少,基因编码区占基因组的大部分比例。
▮ 这种紧凑的基因组结构反映了病毒基因组的经济性和高效性,以最小的基因组大小编码完成复制和感染所需的必要功能。
④ 基因组复制机制多样 (Diverse Genome Replication Mechanisms):
▮ 病毒根据其基因组类型和复制策略,发展出多种多样的基因组复制机制。
▮ DNA 病毒复制 (DNA virus replication):dsDNA 病毒通常利用宿主细胞的 DNA 复制 machinery 进行复制,如 SV40 病毒。ssDNA 病毒则需要先合成互补链形成 dsDNA,再进行复制,如 细小病毒。
▮ RNA 病毒复制 (RNA virus replication):RNA 病毒由于宿主细胞没有 RNA 依赖的 RNA 聚合酶 (RNA-dependent RNA polymerase, RdRP),需要编码自己的 RdRP 进行 RNA 基因组的复制和 mRNA 的合成。
▪ 正链 RNA 病毒复制 (positive-sense RNA virus replication):正链 RNA 基因组既可以作为 mRNA 翻译蛋白质,也可以作为模板,通过 RdRP 合成负链 RNA,再以负链 RNA 为模板合成新的正链 RNA 基因组,如 脊髓灰质炎病毒。
▪ 负链 RNA 病毒复制 (negative-sense RNA virus replication):负链 RNA 基因组不能直接翻译,需要先通过 RdRP 转录成正链 RNA,正链 RNA 作为 mRNA 翻译蛋白质,同时作为模板合成新的负链 RNA 基因组,如 流感病毒。
▮ 逆转录病毒复制 (retrovirus replication):逆转录病毒 (retroviruses),如 HIV,具有特殊的复制机制。其基因组是 ssRNA,但复制过程中需要通过 逆转录酶 (reverse transcriptase, RT) 将 RNA 逆转录成 cDNA,cDNA 整合到宿主细胞基因组中,再以整合的 cDNA 为模板转录 RNA 病毒基因组和 mRNA。
⑤ 基因组进化快速 (Rapid Genome Evolution):
▮ 病毒,尤其是 RNA 病毒,基因组进化速率非常快,突变率远高于细胞生物。
▮ RNA 病毒的 RdRP 缺乏校对功能,导致复制错误率高。病毒世代周期短,群体数量庞大,使得突变能够快速积累和传播。
▮ 病毒基因组的快速进化使其能够快速适应新的宿主和环境,产生耐药性,逃避宿主免疫系统的攻击,给疾病防控带来挑战。
理解病毒基因组的多样性和特点,对于病毒的分类、进化、致病机制、疫苗和抗病毒药物的开发都具有重要意义。
2.2 染色质结构与功能 (Chromatin Structure and Function)
本节详细解析染色质的组成、核小体的结构、染色质的高级结构,以及染色质结构与基因表达调控的关系。
2.2.1 核小体 (Nucleosomes)
核小体 (nucleosome) 是染色质的基本结构单元,是 DNA 在真核细胞核内进行初步包装和组织的关键结构。理解核小体的组成、结构和功能,是理解染色质高级结构和基因调控的基础。
① 核小体的组成 (Composition of Nucleosomes):
▮ 核小体主要由 DNA 和 组蛋白 (histones) 组成。
▮ DNA:每个核小体核心颗粒包含约 147 个碱基对 (bp) 的 DNA 片段,称为 核心 DNA (core DNA)。连接相邻核小体的 DNA 片段称为 连接 DNA (linker DNA),长度可变,通常为 20-90 bp。
▮ 组蛋白 (histones):核小体核心颗粒由八个组蛋白分子组成,形成 组蛋白八聚体 (histone octamer)。这八个组蛋白分子包括两个 H2A-H2B 二聚体 (H2A-H2B dimers) 和一个 H3-H4 四聚体 (H3-H4 tetramer)。
▮ H1 组蛋白 (histone H1):H1 组蛋白 (histone H1) 不是核小体核心颗粒的组成部分,但它与连接 DNA 结合,参与核小体的进一步折叠和染色质高级结构的形成。每个核小体通常结合一个 H1 分子。
② 核小体的结构 (Structure of Nucleosomes):
▮ 核小体核心颗粒的结构类似于一个 “线轴”,核心 DNA 缠绕在组蛋白八聚体表面约 1.65 圈,形成左手超螺旋结构。
▮ 组蛋白八聚体由中心的一个 H3-H4 四聚体和两侧的两个 H2A-H2B 二聚体组成。
▮ 组蛋白之间以及组蛋白与 DNA 之间通过多种相互作用力维持核小体的稳定结构,包括氢键、离子键和疏水相互作用等。
▮ 核小体结构具有动态性,DNA 可以部分解离和重新结合,这对于 DNA 的复制、转录和修复等过程至关重要。
③ 核小体的组装 (Assembly of Nucleosomes):
▮ 核小体的组装是一个复杂的过程,需要多种 染色质组装因子 (chromatin assembly factors, CAFs) 的参与。
▮ CAF-1 (chromatin assembly factor 1) 是主要的染色质组装因子之一,与 DNA 复制 machinery 结合,在 DNA 复制叉后方将 H3-H4 四聚体和 H2A-H2B 二聚体沉积到新合成的 DNA 上,组装成核小体。
▮ 组蛋白伴侣 (histone chaperones) 参与组蛋白的运输、组装和稳定,防止组蛋白发生错误折叠和聚集。
▮ 核小体的组装过程受到多种因素的调控,包括 DNA 序列、DNA 甲基化、组蛋白修饰和 ATP 依赖的染色质重塑复合物等。
④ 核小体在染色质包装中的作用 (Role of Nucleosomes in Chromatin Packaging):
▮ 核小体是染色质一级包装结构,通过将 DNA 缠绕在组蛋白八聚体上,使 DNA 长度缩短约 6-7 倍。
▮ 核小体链进一步折叠形成 30nm 纤维 (30nm fiber),使 DNA 长度进一步缩短约 40 倍。
▮ 核小体和染色质的高级结构共同实现了对基因组 DNA 的多级压缩和包装,使得长达数米的 DNA 分子能够容纳在微小的细胞核内。
▮ 核小体的形成不仅实现了 DNA 的物理压缩,也对基因的 可及性 (accessibility) 产生了重要影响。核小体上的 DNA 不易被 DNA 结合蛋白 (如 转录因子、DNA 聚合酶) 接近,从而影响基因的转录、复制和修复等过程。
⑤ 核小体的动态性与基因调控 (Nucleosome Dynamics and Gene Regulation):
▮ 核小体结构并非静态不变,而是具有动态性。核小体可以发生 滑动 (sliding)、解离 (disassembly) 和 重组 (reassembly) 等动态变化。
▮ ATP 依赖的染色质重塑复合物 (ATP-dependent chromatin remodeling complexes) 利用 ATP 水解的能量,移动、移除或改变核小体的结构,调节 DNA 的可及性,从而调控基因表达。
▮ 核小体的动态变化受到多种信号的调控,包括细胞周期信号、发育信号和环境信号等。
▮ 核小体的动态性是基因表达调控的重要机制之一,通过调节核小体的定位和结构,细胞可以精细地控制基因的活性。
理解核小体的结构、组装、动态性和功能,是深入理解染色质生物学和基因调控的关键。核小体不仅是 DNA 包装的基本单元,也是基因表达调控的重要平台。
2.2.2 染色质的高级结构 (Higher-Order Chromatin Structures)
核小体链并非线性排列,而是进一步折叠形成更高级的染色质结构,实现对基因组 DNA 的更高级别包装和组织。染色质的高级结构对基因组的功能,特别是基因表达调控,具有重要影响。
① 30nm 纤维 (30nm Fiber):
▮ 核小体链通过进一步螺旋化和折叠,形成直径约为 30nm 的 30nm 纤维 (30nm fiber),也称为 螺线管结构 (solenoid structure)。
▮ H1 组蛋白 (histone H1) 在 30nm 纤维的形成中起着关键作用。H1 组蛋白结合在核小体之间,促进核小体链的进一步折叠和稳定。
▮ 30nm 纤维的结构模型有多种,包括 螺线管模型 (solenoid model) 和 之字形模型 (zigzag model) 等。螺线管模型认为核小体链呈螺旋状盘绕,每圈包含 6 个核小体。之字形模型则认为核小体链呈之字形折叠。
▮ 30nm 纤维使 DNA 长度在核小体的基础上进一步缩短约 4-7 倍,总共缩短约 40 倍。
▮ 30nm 纤维是染色质在 间期 (interphase) 细胞核内的主要存在形式。
② 染色质环 (Chromatin Loops):
▮ 30nm 纤维进一步组织成 染色质环 (chromatin loops),环状结构锚定在 核基质 (nuclear matrix) 或 染色体骨架 (chromosome scaffold) 上。
▮ 凝聚蛋白 (cohesin) 和 粘连蛋白 (condensin) 等 结构维持蛋白 (structural maintenance of chromosomes, SMC) 家族蛋白参与染色质环的形成和维持。
▮ 染色质环的形成将基因组划分为多个结构域,称为 拓扑结构域 (topologically associating domains, TADs)。TADs 是基因组功能组织的基本单元,TAD 内的基因和调控元件倾向于相互作用,而 TAD 之间的相互作用相对较少。
▮ 染色质环和 TADs 对基因表达调控具有重要意义,它们限制了 增强子 (enhancer) 和 启动子 (promoter) 之间的相互作用范围,影响基因的激活模式。
③ 染色质区室 (Chromatin Compartments):
▮ 在细胞核内,染色质进一步组织成 染色质区室 (chromatin compartments),主要分为 A 区室 (A compartment) 和 B 区室 (B compartment)。
▮ A 区室 (A compartment):富含 常染色质 (euchromatin),基因密度高,转录活跃,与基因激活和表达相关。A 区室通常位于细胞核内部。
▮ B 区室 (B compartment):富含 异染色质 (heterochromatin),基因密度低,转录沉默,与基因抑制和沉默相关。B 区室通常位于细胞核边缘和核仁周围。
▮ 染色质区室的形成与基因组的 三维结构 (3D structure) 和功能组织密切相关。A 区室和 B 区室的划分反映了基因组在核内的功能分区。
▮ 染色质区室的形成和维持受到多种因素的调控,包括 DNA 序列、染色质修饰、核基质相互作用和 液-液相分离 (liquid-liquid phase separation) 等。
④ 染色质高级结构与基因表达调控的关系 (Relationship between Higher-Order Chromatin Structures and Gene Regulation):
▮ 染色质的高级结构对基因表达调控具有重要影响,主要体现在以下几个方面:
▮ DNA 可及性 (DNA accessibility):染色质的致密程度直接影响 DNA 的可及性。高度压缩的染色质 (如 异染色质) 限制了 DNA 结合蛋白 (如 转录因子、RNA 聚合酶) 的接近,抑制基因转录。而开放的染色质 (如 常染色质) 则有利于 DNA 结合蛋白的结合,促进基因转录。
▮ 增强子-启动子相互作用 (Enhancer-promoter interaction):染色质环和 TADs 限制了增强子和启动子之间的物理距离,影响增强子对靶基因的激活作用。TAD 内的增强子更容易激活 TAD 内的基因,而 TAD 之间的增强子-启动子相互作用受到限制。
▮ 染色质区室化 (Chromatin compartmentalization):染色质区室化将基因组划分为转录活跃的 A 区室和转录沉默的 B 区室,实现了基因组的功能分区。基因在区室之间的定位变化可以影响其表达活性。
▮ 表观遗传调控 (Epigenetic regulation):染色质的高级结构与表观遗传修饰 (如 组蛋白修饰、DNA 甲基化) 相互作用,共同调控基因表达。表观遗传修饰可以影响染色质的结构状态,反过来,染色质结构也可以影响表观遗传修饰的分布和功能。
染色质的高级结构是基因组功能组织的重要层面,它不仅实现了对基因组 DNA 的高级包装,也为基因表达调控提供了结构基础。理解染色质的高级结构及其动态变化,对于深入认识基因组功能和细胞生命活动具有重要意义。
2.2.3 染色质修饰与表观遗传 (Chromatin Modifications and Epigenetics)
染色质修饰 (chromatin modifications) 是指发生在染色质组分 (主要是 组蛋白 和 DNA) 上的化学修饰,包括 组蛋白修饰 (histone modifications) 和 DNA 甲基化 (DNA methylation) 等。这些修饰可以改变染色质的结构状态和功能,进而调控基因表达,是 表观遗传 (epigenetics) 的重要组成部分。
① 组蛋白修饰 (Histone Modifications):
▮ 组蛋白修饰 (histone modifications) 是指发生在组蛋白氨基末端尾巴 (N-terminal tails) 上的多种共价修饰,包括 乙酰化 (acetylation)、甲基化 (methylation)、磷酸化 (phosphorylation)、泛素化 (ubiquitylation) 和 SUMO 化 (SUMOylation) 等。
▮ 组蛋白修饰具有多样性和动态性,不同的修饰类型、修饰位点和修饰程度可以产生不同的生物学效应。
▮ 常见的组蛋白修饰及其功能:
▮ 组蛋白乙酰化 (histone acetylation):主要是发生在赖氨酸残基上的乙酰化修饰,由 组蛋白乙酰转移酶 (histone acetyltransferases, HATs) 催化。组蛋白乙酰化通常与基因激活相关,可以中和组蛋白尾巴的正电荷,减弱组蛋白与 DNA 之间的相互作用,使染色质结构松散,增加 DNA 的可及性,促进基因转录。例如,H3K27ac (组蛋白 H3 第 27 位赖氨酸乙酰化) 和 H3K9ac (组蛋白 H3 第 9 位赖氨酸乙酰化) 是与基因激活相关的修饰标记。
▮ 组蛋白甲基化 (histone methylation):发生在赖氨酸和精氨酸残基上的甲基化修饰,由 组蛋白甲基转移酶 (histone methyltransferases, HMTs) 催化,组蛋白去甲基化酶 (histone demethylases, HDMs) 移除甲基。组蛋白甲基化与基因激活或基因抑制都相关,取决于修饰位点和甲基化程度。例如,H3K4me3 (组蛋白 H3 第 4 位赖氨酸三甲基化) 与基因激活相关,H3K9me3 (组蛋白 H3 第 9 位赖氨酸三甲基化) 和 H3K27me3 (组蛋白 H3 第 27 位赖氨酸三甲基化) 与基因抑制相关。
▮ 组蛋白磷酸化 (histone phosphorylation):主要是发生在丝氨酸和苏氨酸残基上的磷酸化修饰,由 蛋白激酶 (protein kinases) 催化,蛋白磷酸酶 (protein phosphatases) 移除磷酸基团。组蛋白磷酸化参与多种细胞过程的调控,包括染色体凝聚、DNA 修复和基因转录等。例如,H3S10ph (组蛋白 H3 第 10 位丝氨酸磷酸化) 与染色体凝聚和基因转录激活相关。
▮ 组蛋白泛素化 (histone ubiquitylation) 和 SUMO 化 (histone SUMOylation):分别是指将 泛素 (ubiquitin) 和 小泛素样修饰物 (small ubiquitin-like modifier, SUMO) 共价连接到组蛋白上。组蛋白泛素化和 SUMO 化参与基因转录调控、DNA 修复和染色质结构维持等过程。例如,H2Aub (组蛋白 H2A 泛素化) 与基因沉默相关,H2BSUMOylation (组蛋白 H2B SUMO 化) 与基因抑制相关。
② DNA 甲基化 (DNA Methylation):
▮ DNA 甲基化 (DNA methylation) 是指在 DNA 序列的胞嘧啶碱基 (cytosine, C) 上添加甲基基团,形成 5-甲基胞嘧啶 (5-methylcytosine, 5mC) 的修饰。在哺乳动物细胞中,DNA 甲基化主要发生在 CpG 二核苷酸序列 (cytosine-phosphate-guanine dinucleotides) 上。
▮ DNA 甲基化由 DNA 甲基转移酶 (DNA methyltransferases, DNMTs) 催化建立和维持,TET 酶 (ten-eleven translocation enzymes) 催化 5mC 去甲基化。
▮ DNA 甲基化通常与基因抑制和沉默相关。基因启动子区域的 CpG 岛 (CpG islands) 高甲基化通常与基因转录沉默有关。DNA 甲基化可以阻止转录因子结合 DNA,也可以招募 甲基 CpG 结合域蛋白 (methyl-CpG-binding domain proteins, MBDs),MBDs 可以进一步招募染色质重塑复合物和组蛋白修饰酶,导致染色质结构致密化,抑制基因转录。
▮ DNA 甲基化在基因印记 (genomic imprinting)、X 染色体失活 (X-chromosome inactivation)、转座元件沉默和肿瘤发生等过程中发挥重要作用。
③ 表观遗传 (Epigenetics):
▮ 表观遗传 (epigenetics) 是指在 DNA 序列不发生改变的情况下,基因表达和细胞表型发生可遗传的改变。染色质修饰是表观遗传的重要分子机制之一。
▮ 染色质修饰可以影响基因的 可及性 (accessibility)、转录起始 (transcription initiation)、转录延伸 (transcription elongation) 和 RNA 加工 (RNA processing) 等多个环节,从而调控基因表达。
▮ 染色质修饰模式可以跨细胞分裂进行 复制 (replication) 和 传递 (inheritance),使得表观遗传信息能够稳定地遗传给子代细胞。
▮ 表观遗传调控在生物体的发育、分化、衰老、疾病发生和环境适应等方面发挥重要作用。
▮ 表观遗传修饰是 可逆的 (reversible),可以受到内外环境因素的影响而发生改变,这使得细胞能够动态地适应环境变化。
④ 染色质修饰的相互作用与协同作用 (Interactions and Synergies of Chromatin Modifications):
▮ 不同的染色质修饰之间并非孤立存在,而是相互作用、相互影响,形成复杂的 表观遗传调控网络 (epigenetic regulatory network)。
▮ 例如,组蛋白乙酰化和 DNA 去甲基化通常协同作用,促进基因激活。而组蛋白甲基化 (如 H3K9me3、H3K27me3) 和 DNA 甲基化则协同作用,介导基因沉默。
▮ 染色质修饰酶 (如 HATs, HMTs, DNMTs, HDMs, TET 酶) 之间也存在相互作用,形成 染色质修饰复合物 (chromatin modification complexes),协同调控染色质修饰模式的建立和维持。
▮ 染色质修饰与染色质高级结构相互作用,共同调控基因表达。染色质修饰可以影响染色质的结构状态,反过来,染色质结构也可以影响染色质修饰的分布和功能。
染色质修饰是基因组功能调控的重要层面,它通过改变染色质的结构和功能,精细地调控基因表达,参与细胞的各种生命活动。深入研究染色质修饰的机制和功能,对于理解基因调控、发育生物学和疾病发生都具有重要意义。
2.3 基因的结构与功能 (Gene Structure and Function)
本节深入剖析基因的结构组成,包括编码区、非编码区、启动子、增强子等,以及基因的功能和基因家族的概念。
2.3.1 基因的组成元件 (Components of a Gene)
基因 (gene) 是遗传的基本单位,是编码具有特定生物学功能 RNA 或蛋白质的 DNA 序列。理解基因的结构组成元件,是理解基因功能和基因表达调控的基础。一个典型的真核生物基因包含以下主要组成元件:
① 启动子 (Promoter):
▮ 启动子 (promoter) 是位于基因转录起始位点上游的 DNA 序列,是 RNA 聚合酶结合和转录起始的位点。
▮ 启动子区域富含 顺式作用元件 (cis-regulatory elements),如 TATA 盒 (TATA box)、CAAT 盒 (CAAT box) 和 GC 盒 (GC box) 等,这些元件是 转录因子 (transcription factors, TFs) 结合的位点。
▮ 启动子的序列和结构决定了基因的 基础转录水平 (basal transcription level) 和 转录起始位点 (transcription start site, TSS)。
▮ 启动子可以分为 核心启动子 (core promoter) 和 近端启动子 (proximal promoter)。
▮ 核心启动子 (core promoter):紧邻转录起始位点,包含 RNA 聚合酶和 通用转录因子 (general transcription factors, GTFs) 结合的元件,如 TATA 盒。核心启动子是转录起始 machinery 组装和转录起始的平台。
▮ 近端启动子 (proximal promoter):位于核心启动子上游,包含多种顺式作用元件,是 特异性转录因子 (specific transcription factors) 结合的位点,调控基因的转录效率和组织特异性表达。
② 编码区 (Coding Region):
▮ 编码区 (coding region) 是基因中编码蛋白质氨基酸序列的 DNA 序列。在真核生物基因中,编码区是不连续的,由 外显子 (exons) 和 内含子 (introns) 交替排列组成。
▮ 外显子 (exons):是编码蛋白质序列的 DNA 片段,转录后保留在成熟 mRNA 中,用于翻译蛋白质。
▮ 内含子 (introns):是非编码蛋白质序列的 DNA 片段,位于外显子之间,转录后通过 RNA 剪接 (RNA splicing) 过程被去除。
▮ 原核生物基因的编码区通常是连续的,没有内含子。
▮ 编码区的序列决定了蛋白质的氨基酸序列,进而决定了蛋白质的结构和功能。
③ 非翻译区 (Untranslated Regions, UTRs):
▮ 非翻译区 (untranslated regions, UTRs) 是位于 mRNA 编码区两端的非编码序列,包括 5' 非翻译区 (5' UTR) 和 3' 非翻译区 (3' UTR)。
▮ 5' UTR 位于 mRNA 的 5' 端帽子结构和起始密码子之间,3' UTR 位于终止密码子和 poly(A) 尾之间。
▮ UTRs 虽然不编码蛋白质,但含有多种 顺式作用元件 (cis-regulatory elements),调控 mRNA 的 稳定性 (stability)、翻译效率 (translation efficiency) 和 定位 (localization) 等。例如,5' UTR 中的 核糖体结合位点 (ribosome binding site, RBS) (在原核生物中称为 Shine-Dalgarno 序列) 参与翻译起始。3' UTR 中的 AU 富集元件 (AU-rich elements, AREs) 调控 mRNA 的降解。miRNA 结合位点 (miRNA binding sites) 介导 miRNA 对 mRNA 翻译的抑制或降解。
④ 终止子 (Terminator):
▮ 终止子 (terminator) 是位于基因转录终止位点下游的 DNA 序列,是 RNA 聚合酶停止转录和 mRNA 释放的信号。
▮ 原核生物和真核生物的转录终止机制有所不同。原核生物的转录终止可以是 ρ 依赖性 (rho-dependent) 或 ρ 非依赖性 (rho-independent) 的。真核生物的转录终止与 poly(A) 信号 (polyadenylation signal) 和 终止因子 (termination factors) 相关。
▮ 终止子的序列和结构决定了转录终止的效率和 mRNA 的 3' 端形成。
⑤ 增强子和沉默子 (Enhancers and Silencers):
▮ 增强子 (enhancers) 和 沉默子 (silencers) 是位于基因启动子远端 (上游或下游,甚至在内含子中) 的 顺式作用元件 (cis-regulatory elements),调控基因的转录活性。
▮ 增强子 (enhancers) 增加基因的转录效率,沉默子 (silencers) 抑制基因的转录效率。
▮ 增强子和沉默子可以与 激活蛋白 (activators) 和 抑制蛋白 (repressors) 等 转录因子 (transcription factors) 结合,通过 染色质环 (chromatin loops) 等机制与启动子区域相互作用,调控基因的转录。
▮ 增强子和沉默子通常具有 组织特异性 (tissue-specificity) 和 发育阶段特异性 (developmental stage-specificity),介导基因的 时空特异性表达 (spatiotemporal-specific expression)。
⑥ 绝缘子 (Insulators):
▮ 绝缘子 (insulators) 是位于基因组中的 DNA 序列,具有 绝缘 (insulation) 和 屏障 (barrier) 双重功能。
▮ 绝缘功能 (insulation function):绝缘子可以阻止增强子对非靶基因的激活作用,限制增强子的作用范围,防止 基因串扰 (gene crosstalk)。
▮ 屏障功能 (barrier function):绝缘子可以阻止 异染色质 (heterochromatin) 的蔓延,维持 常染色质 (euchromatin) 区域的开放状态,保护基因免受异染色质的沉默效应。
▮ CTCF (CCCTC-binding factor) 是一种重要的绝缘子结合蛋白,参与绝缘子的功能发挥和染色质高级结构的组织。
理解基因的这些组成元件及其功能,有助于我们深入认识基因的结构、基因表达调控和基因功能。基因的精细结构和复杂的调控元件共同决定了基因的表达模式和生物学功能。
2.3.2 基因家族与基因重复 (Gene Families and Gene Duplication)
基因家族 (gene families) 和 基因重复 (gene duplication) 是基因组进化和功能多样化的重要机制。理解基因家族的概念、基因重复的机制和意义,有助于我们认识基因组的动态性和进化可塑性。
① 基因家族的概念 (Concept of Gene Families):
▮ 基因家族 (gene families) 是指在基因组中由 基因重复 (gene duplication) 事件产生的一组具有 序列相似性 (sequence similarity) 和 功能相关性 (functional relatedness) 的基因集合。
▮ 基因家族的成员基因通常起源于同一个 祖先基因 (ancestral gene),通过基因重复、突变和选择等进化过程,逐渐分化形成具有不同功能或表达模式的 旁系同源基因 (paralogs)。
▮ 基因家族的成员基因可以位于同一条染色体上呈 簇状排列 (clustered),也可以分散在不同的染色体上呈 散在排列 (dispersed)。
▮ 基因家族的例子:
▮ 珠蛋白基因家族 (globin gene family):编码不同类型的珠蛋白链,如 α-珠蛋白、β-珠蛋白、γ-珠蛋白、δ-珠蛋白和 ε-珠蛋白等,参与氧气运输和储存。珠蛋白基因家族的成员基因在发育的不同阶段和不同的组织中表达,适应不同的生理需求。
▮ 免疫球蛋白基因家族 (immunoglobulin gene family) 和 T 细胞受体基因家族 (T cell receptor gene family):编码免疫球蛋白和 T 细胞受体的可变区,通过 V(D)J 重组 (V(D)J recombination) 产生巨大的抗体和 T 细胞受体多样性,参与免疫系统的识别和应答。
▮ Hox 基因家族 (Hox gene family):编码 Hox 蛋白,是一类重要的转录因子,在动物的发育过程中调控身体轴向模式的建立和器官的形成。Hox 基因家族的成员基因在染色体上呈线性排列,其在染色体上的顺序与其在身体轴向上的表达顺序相对应,体现了 共线性 (colinearity) 原则。
② 基因重复的机制 (Mechanisms of Gene Duplication):
▮ 基因重复 (gene duplication) 是指基因组中基因拷贝数增加的现象,是基因家族产生的根本原因。基因重复可以通过多种机制发生:
▮ 不等交换 (unequal crossing-over):在 同源重组 (homologous recombination) 过程中,如果发生 错配 (misalignment),可能导致一条染色体上基因拷贝数增加,另一条染色体上基因拷贝数减少。不等交换是基因重复的重要机制之一,尤其容易发生在串联重复序列区域。
▮ 染色体重复 (chromosome duplication) 或 非整倍体化 (aneuploidy):染色体数目增加或部分染色体片段重复,导致染色体上所有基因的拷贝数增加。全基因组重复 (whole-genome duplication, WGD) 是一种特殊的染色体重复事件,导致整个基因组的拷贝数翻倍。全基因组重复在植物和鱼类等生物的进化中起着重要作用。
▮ 转座作用 (transposition):转座子 (transposons) 的转座可以导致基因的重复和散布。一些转座子可以携带基因进行复制性转座,增加基因的拷贝数。
▮ DNA 复制错误 (DNA replication errors):DNA 复制过程中发生错误,导致局部 DNA 片段的重复。
③ 基因重复的意义 (Significance of Gene Duplication):
▮ 功能冗余 (functional redundancy):基因重复产生的基因拷贝,最初可能具有相同或相似的功能,增加基因的功能冗余性。当一个基因拷贝发生突变失活时,另一个拷贝仍然可以维持原有的功能,增强生物体的 稳健性 (robustness)。
▮ 功能分化 (functional divergence) 或 新功能获得 (neofunctionalization):基因重复产生的基因拷贝,在进化过程中可能发生突变,导致功能分化或获得新的功能。一个基因拷贝可能保留原有的功能,称为 亚功能化 (subfunctionalization),另一个拷贝可能获得新的功能,称为 新功能化 (neofunctionalization)。基因重复是基因功能创新的重要来源。
▮ 基因剂量效应 (gene dosage effect):基因拷贝数增加,导致基因表达产物 (RNA 或蛋白质) 的量增加,产生 基因剂量效应 (gene dosage effect)。基因剂量效应在某些情况下可能对生物体有利,例如,增加 rRNA 基因的拷贝数可以提高核糖体的合成效率,促进细胞生长。但在另一些情况下,基因剂量效应可能有害,例如,某些癌基因的过表达会导致肿瘤发生。
▮ 适应性进化 (adaptive evolution):基因重复可以为生物体的适应性进化提供遗传变异。基因重复产生的基因拷贝,在自然选择的作用下,可能发生功能分化或新功能获得,使得生物体能够适应新的环境或生活方式。
④ 基因家族在基因组进化中的作用 (Role of Gene Families in Genome Evolution):
▮ 基因家族的形成和进化是基因组进化的重要驱动力之一。基因家族的扩增、分化和重塑,塑造了基因组的结构和功能,推动了生物多样性的产生。
▮ 基因家族的进化研究可以揭示基因功能的演变历程,理解生物复杂性的起源和进化机制。
▮ 比较不同物种基因家族的组成和进化,可以追溯物种的亲缘关系和进化历史,构建 系统发育树 (phylogenetic tree)。
基因家族和基因重复是基因组动态进化的重要体现,它们不仅增加了基因组的复杂性和功能多样性,也为生物体的适应性进化提供了遗传基础。
2.3.3 假基因与非编码基因 (Pseudogenes and Non-coding Genes)
除了编码蛋白质的基因外,基因组中还存在大量的 假基因 (pseudogenes) 和 非编码基因 (non-coding genes)。这些非编码序列在基因组结构和功能中也发挥着重要作用。
① 假基因 (Pseudogenes):
▮ 假基因 (pseudogenes) 是指基因组中与已知基因序列相似,但由于 突变 (mutations) 积累而丧失了原有功能的基因序列。
▮ 假基因通常起源于 基因重复 (gene duplication) 事件,一个基因拷贝保留了原有功能,另一个拷贝由于突变积累而失去编码蛋白质的能力,成为假基因。
▮ 假基因的形成机制:
▮ 基因重复后突变积累 (mutation accumulation after gene duplication):基因重复产生的基因拷贝,由于不再受到自然选择的压力,容易积累 失活突变 (inactivating mutations),如 移码突变 (frameshift mutations)、提前终止密码子 (premature stop codons) 和 启动子突变 (promoter mutations) 等,最终丧失编码蛋白质的能力,成为假基因。
▮ 逆转录插入 (retrotransposition):mRNA 通过 逆转录酶 (reverse transcriptase) 逆转录成 cDNA,cDNA 随机插入基因组中,形成 加工假基因 (processed pseudogenes)。加工假基因通常缺乏内含子和启动子,不能转录。
▮ 假基因的类型:
▮ 非加工假基因 (non-processed pseudogenes) 或 复制假基因 (duplicated pseudogenes):通过基因重复后突变积累形成的假基因,通常与功能基因并排排列,序列相似性高,但含有失活突变。
▮ 加工假基因 (processed pseudogenes) 或 逆转录假基因 (retrotransposed pseudogenes):通过 mRNA 逆转录插入形成的假基因,通常散布在基因组各处,缺乏内含子和启动子,序列与 mRNA 相似。
▮ Unitary 假基因 (unitary pseudogenes):是指在某些物种中是功能基因,但在另一些物种中由于突变积累而成为假基因的基因。Unitary 假基因反映了基因在进化过程中的功能丧失。
▮ 假基因的功能:
▮ 基因表达调控 (gene expression regulation):一些假基因可以转录产生 RNA,这些 RNA 可以作为 内源竞争 RNA (competing endogenous RNAs, ceRNAs) 或 分子海绵 (molecular sponges),竞争性结合 miRNA (microRNA),解除 miRNA 对靶基因的抑制,从而调控基因表达。
▮ 基因功能进化 (gene function evolution):少数假基因在进化过程中可能重新获得编码蛋白质的能力,成为新的功能基因,称为 复活假基因 (resurrected pseudogenes)。假基因可以作为基因功能创新的潜在来源。
▮ 基因组结构进化 (genome structure evolution):假基因可以参与基因组的重排和进化,影响基因组的结构和稳定性。
② 非编码基因 (Non-coding Genes):
▮ 非编码基因 (non-coding genes) 是指转录产生 RNA,但 RNA 不编码蛋白质,而是直接发挥生物学功能的基因。非编码基因在基因组中广泛存在,约占人类基因组转录本的大部分比例。
▮ 非编码 RNA (non-coding RNAs, ncRNAs) 的类型和功能多样,主要包括:
▮ 核糖体 RNA (ribosomal RNA, rRNA):rRNA 是核糖体的组成成分,参与蛋白质合成。rRNA 基因通常以 串联重复 (tandem repeats) 的形式存在于基因组中,转录产生 rRNA 前体,经过加工成熟后与核糖体蛋白组装成核糖体。
▮ 转移 RNA (transfer RNA, tRNA):tRNA 在蛋白质合成过程中作为 适配器分子 (adaptor molecules),携带氨基酸到核糖体,参与密码子的识别和氨基酸的添加。tRNA 基因也通常以基因簇的形式存在,转录产生 tRNA 前体,经过加工成熟后发挥功能。
▮ 小核 RNA (small nuclear RNA, snRNA):snRNA 参与 RNA 剪接 (RNA splicing)、rRNA 加工 (rRNA processing) 和 端粒酶 (telomerase) 功能。U snRNA (U1, U2, U4, U5, U6 snRNAs) 是 剪接体 (spliceosome) 的组成成分,参与 mRNA 前体的剪接。snoRNA (small nucleolar RNA) 参与 rRNA 的修饰和加工。
▮ 小核仁 RNA (small nucleolar RNA, snoRNA):snoRNA 主要位于核仁中,指导 rRNA 的修饰 (如 甲基化、假尿苷化) 和加工。C/D box snoRNA 和 H/ACA box snoRNA 是两类主要的 snoRNA。
▮ microRNA (miRNA):miRNA 是一类长度约为 22 个核苷酸的 小 RNA (small RNA),参与 转录后基因表达调控 (post-transcriptional gene regulation)。miRNA 通过与靶 mRNA 的 3' UTR 结合,抑制 mRNA 的翻译或促进 mRNA 的降解。miRNA 在发育、分化、细胞生长、凋亡和疾病发生等过程中发挥重要作用。
▮ 小干扰 RNA (small interfering RNA, siRNA):siRNA 是一类长度约为 20-25 个核苷酸的 双链 RNA (double-stranded RNA, dsRNA),参与 RNA 干扰 (RNA interference, RNAi) 途径,介导 基因沉默 (gene silencing)。siRNA 可以通过靶向同源 mRNA,引导 RNA 诱导沉默复合体 (RNA-induced silencing complex, RISC) 降解 mRNA。siRNA 在基因工程和基因治疗中具有重要应用价值。
▮ piwi 相互作用 RNA (piwi-interacting RNA, piRNA):piRNA 是一类主要在生殖细胞中表达的 小 RNA (small RNA),参与 生殖细胞发育 (germline development) 和 转座子沉默 (transposon silencing)。piRNA 与 PIWI 蛋白 (P-element induced wimpy testis proteins) 结合形成 piRNA 诱导沉默复合体 (piRNA-induced silencing complex, piRISC),抑制转座子的转录和转座活性,维持基因组稳定性。
▮ 长非编码 RNA (long non-coding RNA, lncRNA):lncRNA 是一类长度超过 200 个核苷酸的 非编码 RNA (non-coding RNA),功能多样,参与基因表达调控、染色质结构调控、细胞核结构组织和信号转导等多种生物学过程。lncRNA 的作用机制复杂,可以作为 支架 (scaffold)、诱饵 (decoy)、向导 (guide) 和 增强子 (enhancer) 等发挥功能。
假基因和非编码基因是基因组的重要组成部分,它们虽然不编码蛋白质,但在基因组结构、基因表达调控和基因功能进化中发挥着重要作用。深入研究假基因和非编码基因的功能,有助于我们更全面地理解基因组的功能和复杂性。
2.4 基因组的变异与进化 (Genome Variation and Evolution)
本节探讨基因组变异的来源、类型和影响,以及基因组在进化过程中的动态变化和驱动力。基因组的变异是进化的基础,基因组的进化塑造了生物多样性。
2.4.1 突变 (Mutation)
突变 (mutation) 是指基因组 DNA 序列发生的 可遗传的改变 (heritable changes)。突变是基因组变异的根本来源,是进化的原始动力。
① 突变的类型 (Types of Mutations):
▮ 根据突变发生的 DNA 序列类型,可以分为 点突变 (point mutations) 和 染色体畸变 (chromosomal aberrations)。
▮ 点突变 (point mutations):指 DNA 序列中单个碱基或少数几个碱基的改变。点突变主要包括:
▪ 碱基置换 (base substitutions):指 DNA 序列中一个碱基被另一个碱基替换。碱基置换又可分为 转换 (transitions) 和 颠换 (transversions)。转换 (transitions) 是指嘌呤替换为嘌呤 (A↔G) 或嘧啶替换为嘧啶 (C↔T)。颠换 (transversions) 是指嘌呤替换为嘧啶 (A↔C, A↔T, G↔C, G↔T) 或嘧啶替换为嘌呤 (C↔A, C↔G, T↔A, T↔G)。
▪ 插入 (insertions) 和 缺失 (deletions):指 DNA 序列中插入或缺失一个或多个碱基。如果插入或缺失的碱基数目不是 3 的倍数,会导致 移码突变 (frameshift mutations),改变阅读框,导致下游氨基酸序列发生改变,甚至产生提前终止密码子。
▮ 染色体畸变 (chromosomal aberrations):指染色体结构或数目发生的较大规模的改变。染色体畸变主要包括:
▪ 染色体数目畸变 (numerical chromosomal aberrations):指染色体数目异常,如 非整倍体 (aneuploidy) (染色体数目不是整倍数,如 三体综合征 (trisomy)、单体综合征 (monosomy)) 和 多倍体 (polyploidy) (染色体数目是整倍数的增加,如 四倍体 (tetraploidy)、八倍体 (octoploidy))。
▪ 染色体结构畸变 (structural chromosomal aberrations):指染色体结构发生改变,如 缺失 (deletions) (染色体片段丢失)、重复 (duplications) (染色体片段重复)、倒位 (inversions) (染色体片段倒转)、易位 (translocations) (染色体片段转移到非同源染色体上) 和 环状染色体 (ring chromosomes) (染色体末端缺失后环化)。
▮ 根据突变对 基因功能的影响,可以分为:
▮ 有义突变 (missense mutations):碱基置换导致密码子编码的氨基酸发生改变。有义突变对蛋白质功能的影响程度取决于氨基酸替换的性质和位置。
▮ 无义突变 (nonsense mutations):碱基置换导致密码子变为终止密码子 (UAA, UAG, UGA),导致蛋白质翻译提前终止,产生 截短蛋白 (truncated protein)。无义突变通常会导致蛋白质功能丧失。
▮ 沉默突变 (silent mutations):碱基置换导致密码子发生改变,但编码的氨基酸没有改变,对蛋白质序列和功能没有影响。由于 密码子简并性 (codon degeneracy),多个密码子可以编码同一个氨基酸。
▮ 功能获得型突变 (gain-of-function mutations):突变导致基因获得新的功能或增强原有功能。功能获得型突变在癌症发生中常见,如 癌基因 (oncogenes) 的激活突变。
▮ 功能丧失型突变 (loss-of-function mutations):突变导致基因功能丧失或减弱。功能丧失型突变在遗传病中常见,如 抑癌基因 (tumor suppressor genes) 的失活突变。
② 突变的来源和诱变因素 (Sources of Mutations and Mutagens):
▮ 突变可以 自发产生 (spontaneous mutations),也可以由 诱变因素 (mutagens) 诱导产生。
▮ 自发突变 (spontaneous mutations):指在正常细胞代谢过程中自然发生的突变,突变频率较低。自发突变的来源包括:
▪ DNA 复制错误 (DNA replication errors):DNA 聚合酶在复制过程中可能发生碱基错配、插入或缺失等错误。DNA 聚合酶具有一定的 校对功能 (proofreading function),可以减少复制错误率,但仍有少量错误会残留下来。
▪ DNA 自发损伤 (spontaneous DNA damage):DNA 分子在细胞内环境中会自发发生化学损伤,如 脱嘌呤 (depurination)、脱氨基 (deamination) 和 氧化损伤 (oxidative damage) 等。这些自发损伤如果不能及时修复,可能导致突变。
▪ 转座子插入 (transposon insertion):转座子 (transposons) 在基因组中随机插入,可能导致基因突变或基因表达改变。
▮ 诱导突变 (induced mutations):指由 诱变因素 (mutagens) 诱导产生的突变,突变频率较高。诱变因素可以分为 物理诱变因素 (physical mutagens)、化学诱变因素 (chemical mutagens) 和 生物诱变因素 (biological mutagens)。
▪ 物理诱变因素 (physical mutagens):如 紫外线 (ultraviolet radiation, UV)、X 射线 (X-rays) 和 γ 射线 (γ-rays) 等。紫外线可以诱导 嘧啶二聚体 (pyrimidine dimers) 形成,X 射线和 γ 射线可以引起 DNA 单链断裂 (single-strand breaks, SSB) 和 双链断裂 (double-strand breaks, DSB)。
▪ 化学诱变因素 (chemical mutagens):如 碱基类似物 (base analogs) (如 5-溴尿嘧啶)、DNA 嵌入剂 (DNA intercalating agents) (如 吖啶黄)、烷化剂 (alkylating agents) (如 氮芥)、脱氨基剂 (deaminating agents) (如 亚硝酸) 和 氧化剂 (oxidizing agents) (如 过氧化氢) 等。化学诱变因素可以通过多种机制诱导突变,如 碱基错配、DNA 链断裂和 DNA 修饰等。
▪ 生物诱变因素 (biological mutagens):如 病毒 (viruses) 和 转座子 (transposons) 等。病毒感染可以导致基因组 DNA 损伤和突变。转座子转座可以引起插入突变和基因组重排。
③ 突变对生物体的影响 (Effects of Mutations on Organisms):
▮ 突变对生物体的影响可以是 有害的 (deleterious)、有利的 (beneficial) 或 中性的 (neutral),取决于突变的性质、发生的基因和环境条件。
▮ 有害突变 (deleterious mutations):大多数新发生的突变是有害的,会降低生物体的 适应性 (fitness)。有害突变可能导致基因功能丧失、蛋白质功能异常、细胞功能紊乱,甚至导致疾病或死亡。遗传病和癌症等疾病通常与有害突变积累有关。
▮ 有利突变 (beneficial mutations):少数突变可能对生物体有利,提高生物体的适应性。有利突变在进化过程中受到 自然选择 (natural selection) 的青睐,在群体中积累和传播。抗生素抗性细菌的产生、昆虫对杀虫剂的抗性以及人类乳糖耐受性的进化等都是有利突变在自然选择作用下产生的例子。
▮ 中性突变 (neutral mutations):大多数突变是中性的,对生物体的适应性没有明显影响。沉默突变通常是中性突变。中性突变在群体中积累和传播主要受 遗传漂变 (genetic drift) 的影响。
▮ 突变是进化的原始材料,没有突变,就没有遗传变异,也就没有进化。突变与自然选择共同作用,推动了生物进化和多样性的产生。
2.4.2 重组与基因组重排 (Recombination and Genome Rearrangement)
重组 (recombination) 和 基因组重排 (genome rearrangement) 是基因组变异的重要机制,可以产生新的基因组合和基因组结构,增加遗传多样性,驱动基因组进化。
① 同源重组 (Homologous Recombination):
▮ 同源重组 (homologous recombination, HR) 是指发生在 同源 DNA 序列 (homologous DNA sequences) 之间的 DNA 片段交换过程。同源重组在 DNA 修复、减数分裂和基因组进化中发挥重要作用。
▮ 同源重组的分子机制主要包括 双链断裂修复 (double-strand break repair, DSBR) 和 合成依赖性链退火 (synthesis-dependent strand annealing, SDSA) 等途径。
▮ 双链断裂修复 (DSBR) 途径:当 DNA 发生 双链断裂 (DSB) 时,DSBR 途径被激活。DSBR 途径包括以下步骤:
▪ 末端切除 (end resection):DSB 断裂末端被 核酸外切酶 (exonucleases) 切除,产生 3' 单链突出端。
▪ 链入侵 (strand invasion):一条 3' 单链突出端入侵到同源 DNA 双链中,寻找同源序列,形成 D-环 (D-loop)。
▪ DNA 合成 (DNA synthesis):以同源 DNA 为模板,延伸入侵链,修复 DSB 断裂。
▪ Holliday 结构形成 (Holliday junction formation):入侵链和模板链连接,形成 Holliday 结构 (Holliday junction),也称为 交叉臂结构 (crossover junction)。
▪ Holliday 结构移动 (Holliday junction migration):Holliday 结构可以沿着 DNA 分子移动,扩大重组区域。
▪ Holliday 结构解析 (Holliday junction resolution):Holliday 结构被 解析酶 (resolvases) 切开,完成重组。Holliday 结构解析可以产生 交叉 (crossover) 或 非交叉 (non-crossover) 重组产物。交叉 (crossover) 重组产物是指两条同源染色体之间发生 DNA 片段交换,导致 基因重组 (genetic recombination)。非交叉 (non-crossover) 重组产物是指 DNA 修复完成,但没有发生 DNA 片段交换,称为 基因转换 (gene conversion)。
▮ 合成依赖性链退火 (SDSA) 途径:SDSA 途径也是一种 DSBR 途径,但与 DSBR 途径不同的是,SDSA 途径不形成 Holliday 结构,通常只产生 非交叉 (non-crossover) 重组产物,主要用于 DNA 修复,不产生基因重组。
▮ 同源重组在减数分裂中起着重要作用。减数分裂过程中的 交叉互换 (crossing-over) 就是通过同源重组实现的,导致同源染色体之间发生基因重组,产生 重组型配子 (recombinant gametes),增加后代的遗传多样性。
② 非同源末端连接 (Non-homologous End Joining, NHEJ):
▮ 非同源末端连接 (non-homologous end joining, NHEJ) 是另一种主要的 DNA 双链断裂修复途径。与同源重组不同,NHEJ 不需要同源 DNA 序列作为模板,直接将 DNA 断裂末端连接起来。
▮ NHEJ 途径的分子机制相对简单,主要包括以下步骤:
▪ 末端识别和结合 (end recognition and binding):Ku70/Ku80 二聚体 识别并结合 DNA 双链断裂末端。
▪ 末端加工 (end processing):核酸酶 (nucleases) 和 聚合酶 (polymerases) 对 DNA 断裂末端进行加工,去除损伤或不相容的末端,或填补缺失的碱基。
▪ 末端连接 (end ligation):DNA 连接酶 IV (DNA ligase IV) 和 XRCC4 等因子将加工后的 DNA 断裂末端连接起来,完成修复。
▮ NHEJ 途径是一种 易错修复 (error-prone repair) 途径,在末端加工过程中可能发生碱基插入或缺失,导致 插入缺失突变 (indel mutations)。
▮ NHEJ 途径在基因组重排中也发挥作用。V(D)J 重组 (V(D)J recombination) 就是一种特殊的 NHEJ 途径,用于免疫球蛋白基因和 T 细胞受体基因的可变区基因片段的重排,产生抗体和 T 细胞受体的多样性。
③ 转座作用 (Transposition):
▮ 转座作用 (transposition) 是指 转座子 (transposons) 在基因组中移动位置的过程。转座子也称为 可移动遗传元件 (mobile genetic elements) 或 跳跃基因 (jumping genes)。
▮ 转座子可以分为两大类:DNA 转座子 (DNA transposons) 和 逆转录转座子 (retrotransposons)。
▪ DNA 转座子 (DNA transposons):以 DNA 为中间体进行转座,通过 转座酶 (transposase) 介导的 剪切-粘贴 (cut-and-paste) 或 复制性转座 (replicative transposition) 机制进行转座。剪切-粘贴转座是指转座子从基因组一个位置切下,插入到另一个位置,拷贝数不变。复制性转座是指转座子在原位置复制一份拷贝,插入到新位置,拷贝数增加。
▪ 逆转录转座子 (retrotransposons):以 RNA 为中间体进行转座,转座过程需要 逆转录酶 (reverse transcriptase) 将 RNA 逆转录成 cDNA,cDNA 插入到基因组新位置。逆转录转座子通过 复制性转座 (replicative transposition) 机制进行转座,拷贝数增加。逆转录转座子主要包括 长散在核元件 (LINEs) 和 短散在核元件 (SINEs)。
▮ 转座作用对基因组的影响:
▪ 插入突变 (insertional mutagenesis):转座子插入基因编码区或调控区,可能导致基因突变或基因表达改变。
▪ 基因组重排 (genome rearrangement):转座作用可以引起基因组的 缺失 (deletions)、重复 (duplications)、倒位 (inversions) 和 易位 (translocations) 等重排。
▪ 基因组大小增加 (genome size increase):逆转录转座子的复制性转座可以导致基因组大小增加。真核生物基因组大小的差异很大程度上与转座子的含量有关。
▪ 基因表达调控 (gene expression regulation):转座子序列可以作为 顺式作用元件 (cis-regulatory elements),调控基因表达。一些转座子编码的 RNA 可以作为 非编码 RNA (non-coding RNAs),参与基因调控。
④ 基因组重排在进化中的作用 (Role of Genome Rearrangement in Evolution):
▮ 基因组重排是基因组进化的重要驱动力。基因组重排可以产生新的基因组合和基因组结构,改变基因的表达模式和调控网络,为生物体的适应性进化提供遗传变异。
▮ 染色体畸变,如 染色体重复 (chromosome duplication) 和 多倍体化 (polyploidy),可以导致基因组拷贝数增加,为基因功能分化和新功能获得提供遗传基础。
▮ 基因组重排,如 基因融合 (gene fusion) 和 外显子改组 (exon shuffling),可以产生新的基因结构和蛋白质结构域组合,促进蛋白质功能创新。
▮ 转座作用可以引起基因组的动态变化,影响基因组结构和基因表达,参与基因组的进化和多样化。
2.4.3 基因组进化与物种形成 (Genome Evolution and Speciation)
基因组进化 (genome evolution) 是指基因组在时间尺度上的动态变化过程。物种形成 (speciation) 是指新物种产生的过程。基因组进化是物种形成和生物多样性的遗传基础。
① 基因组进化的主要驱动力 (Major Driving Forces of Genome Evolution):
▮ 基因组进化受到多种因素的驱动,主要包括 突变 (mutation)、自然选择 (natural selection)、遗传漂变 (genetic drift) 和 基因流 (gene flow) 等。
▮ 突变 (mutation):突变是基因组变异的原始来源,为基因组进化提供遗传变异。突变的类型、频率和分布模式影响基因组进化的方向和速率。
▮ 自然选择 (natural selection):自然选择是进化的主要驱动力。自然选择作用于表型,通过 差异性生存和繁殖 (differential survival and reproduction),使得有利突变在群体中积累和传播,有害突变被淘汰,中性突变随机漂变。自然选择导致 适应性进化 (adaptive evolution),使得生物体能够适应环境变化。
▮ 遗传漂变 (genetic drift):遗传漂变是指 随机因素 (random chance) 导致的基因频率在群体中发生的波动。遗传漂变在小群体中作用更明显。遗传漂变可以导致中性突变在群体中固定或丢失,也可以影响有利突变和有害突变的命运。遗传漂变是 非适应性进化 (non-adaptive evolution) 的重要机制。
▮ 基因流 (gene flow):基因流是指不同群体之间 基因的交流 (gene exchange)。基因流可以通过 迁徙 (migration)、杂交 (hybridization) 和 水平基因转移 (horizontal gene transfer, HGT) 等方式实现。基因流可以增加群体内的遗传变异,也可以降低群体间的遗传分化。基因流对物种形成和适应性进化具有重要影响。
② 基因组进化在物种形成中的作用 (Role of Genome Evolution in Speciation):
▮ 物种形成 (speciation) 是指一个祖先物种分化成两个或多个子代物种的过程。物种形成需要 生殖隔离 (reproductive isolation) 的建立,即不同物种之间不能或很少进行基因交流。
▮ 基因组进化在物种形成中起着关键作用。基因组的 遗传分化 (genetic divergence) 是物种形成的基础。基因组进化可以通过多种途径导致生殖隔离的产生,最终导致物种形成。
▮ 遗传不兼容性 (genetic incompatibility):不同群体之间基因组的遗传分化,可能导致 杂交后生殖隔离 (postzygotic reproductive isolation),即杂交后代 适应性降低 (reduced fitness) 或 不育 (sterility)。Dobzhansky-Muller 不兼容性 (Dobzhansky-Muller incompatibilities, DMIs) 是遗传不兼容性的重要机制。DMIs 指的是在不同群体中分别固定的两个或多个基因位点的 上位互作 (epistatic interactions),在杂交后代中,这些上位互作被破坏,导致适应性降低。
▮ 基因组重排 (genome rearrangement):染色体畸变,如 染色体易位 (chromosome translocations) 和 倒位 (inversions),可以导致 染色体结构差异 (chromosomal structural differences),在杂交过程中引起 减数分裂障碍 (meiotic drive),降低杂交后代的适应性,促进生殖隔离的形成。
▮ 生殖隔离基因 (speciation genes):一些基因在物种形成过程中起着关键作用,称为 生殖隔离基因 (speciation genes) 或 隔离基因 (isolation genes)。生殖隔离基因的变异可以直接导致生殖隔离的产生。例如,一些生殖隔离基因参与 配子识别 (gamete recognition)、杂交后代存活 (hybrid viability) 或 杂交后代生育力 (hybrid fertility) 等过程。
▮ 适应性分化 (adaptive divergence):不同群体在不同环境条件下受到 趋异选择 (divergent selection) 的作用,导致 适应性分化 (adaptive divergence)。适应性分化可以导致 生态位分化 (ecological niche differentiation) 和 性状分化 (trait divergence),进而促进 生态生殖隔离 (ecological reproductive isolation) 和 交配前生殖隔离 (prezygotic reproductive isolation) 的形成。
③ 基因组进化模式 (Patterns of Genome Evolution):
▮ 基因组进化呈现出多种模式,包括 线性进化 (linear evolution)、网状进化 (reticulate evolution) 和 平行进化 (parallel evolution) 等。
▮ 线性进化 (linear evolution):指物种沿着单一谱系线性演化,一个物种逐渐转变成另一个物种。线性进化模式适用于无性繁殖生物或谱系分化较少的生物。
▮ 网状进化 (reticulate evolution):指不同物种或谱系之间发生 基因交流 (gene flow) 或 杂交 (hybridization),导致基因组融合或基因渗入,形成网状的进化关系。网状进化在植物、微生物和一些动物中普遍存在。内共生 (endosymbiosis) 是一种特殊的网状进化事件,导致线粒体和叶绿体等细胞器的起源。
▮ 平行进化 (parallel evolution):指不同物种或谱系在独立进化过程中,由于相似的环境选择压力,独立地进化出相似的表型或基因型。平行进化反映了自然选择的 可预测性 (predictability) 和 约束性 (constraint)。
基因组进化是一个复杂而动态的过程,受到多种因素的驱动和调控。理解基因组进化的机制和模式,对于认识生物多样性的起源和进化规律,以及理解人类自身的进化历史和健康问题都具有重要意义。
3. DNA 的复制、修复与重组 (DNA Replication, Repair, and Recombination)
摘要
本章详细阐述 DNA 复制 (DNA Replication) 的分子机制、DNA 损伤修复 (DNA Damage and Repair) 的途径,以及 DNA 重组 (DNA Recombination) 的过程和生物学意义,深入理解 基因组 (Genome) 的稳定性和可塑性。
3.1 DNA 复制的分子机制 (Molecular Mechanisms of DNA Replication)
摘要
深入解析 DNA 复制的起始、延伸和终止过程,以及参与复制的关键 酶类 (Enzymes) 和 蛋白因子 (Protein Factors),比较 原核生物 (Prokaryotes) 和 真核生物 (Eukaryotes) 复制的异同。
3.1.1 复制的起始 (Replication Initiation)
复制起始是 DNA 复制过程中的首要步骤,精确地启动复制对于基因组的完整性至关重要。这个过程需要识别 复制起始点 (Origin of Replication, Ori),并组装 复制起始复合物 (Pre-replication Complex, pre-RC)。
① 复制起始点的识别 (Origin Recognition)
▮▮▮▮ⓐ 原核生物的复制起始 (Replication Initiation in Prokaryotes):以 大肠杆菌 (Escherichia coli) 为例,其染色体上只有一个复制起始点,称为 oriC。 oriC 区域包含多个保守的 DNA 序列元件,包括:
▮▮▮▮▮▮▮▮❷ DnaA 盒 (DnaA boxes):是 DnaA 蛋白结合的位点,通常是 9bp 的重复序列。DnaA 蛋白是复制起始的关键蛋白,它是一种 ATP 酶,当结合 ATP 后,能够高亲和力地结合 oriC 区域的 DnaA 盒。
▮▮▮▮▮▮▮▮❸ DNA 解旋区 (DNA unwinding element, DUE):是一个富含 AT 碱基对的区域,容易解链。DnaA 蛋白结合 oriC 后,诱导 DUE 区域的 DNA 双螺旋解开,形成 复制泡 (Replication Bubble)。
\[ \text{DnaA-ATP} + oriC \xrightarrow{} \text{DnaA-ATP-oriC 复合物} \xrightarrow{} \text{DUE 解旋} \]
▮▮▮▮ⓑ 真核生物的复制起始 (Replication Initiation in Eukaryotes):真核生物的基因组庞大且复杂,拥有多个复制起始点,以确保在合理的时间内完成复制。真核生物的复制起始点没有像 oriC 那样的保守序列,但通常与以下特征相关:
▮▮▮▮▮▮▮▮❷ 自主复制序列 (Autonomously Replicating Sequences, ARS):在 酿酒酵母 (Saccharomyces cerevisiae) 中研究得较为清楚,ARS 包含一个核心的 A 区 (A domain) 和周围的 B 区 (B domains)。A 区包含 复制起始点识别复合物 (Origin Recognition Complex, ORC) 的结合位点。
▮▮▮▮▮▮▮▮❸ ORC 结合位点 (ORC binding sites):ORC 是真核生物复制起始的关键复合物,类似于原核生物的 DnaA 蛋白。ORC 由六个亚基组成,能够识别并结合复制起始点。
▮▮▮▮▮▮▮▮❹ 染色质结构 (Chromatin Structure):复制起始点的选择还受到染色质结构的影响。开放的染色质区域通常更容易成为复制起始点。
② 解旋酶和拓扑异构酶的作用 (Roles of Helicase and Topoisomerase)
▮▮▮▮ⓐ 解旋酶 (Helicase):DNA 解旋酶是一类 ATP 酶,利用 ATP 水解提供的能量,解开 DNA 双螺旋,形成单链 DNA,为后续的复制延伸提供模板。
▮▮▮▮▮▮▮▮❷ 原核生物解旋酶 (Prokaryotic Helicase):在 大肠杆菌 (E. coli) 中,主要的解旋酶是 DnaB 解旋酶 (DnaB helicase)。DnaB 解旋酶在 DnaC 蛋白的辅助下装载到单链 DNA 上,并沿着 DNA 链 5'→3' 方向移动,解开双螺旋。
▮▮▮▮▮▮▮▮❸ 真核生物解旋酶 (Eukaryotic Helicase):真核生物中主要的复制解旋酶是 MCM (Mini-Chromosome Maintenance) 复合体。MCM 复合体由六个亚基 (MCM2-7) 组成,在复制起始的早期装载到复制起始点,并在复制叉处解开 DNA 双螺旋。
▮▮▮▮ⓑ 拓扑异构酶 (Topoisomerase):DNA 解旋酶在解开 DNA 双螺旋时,会在 DNA 分子的前方造成 正超螺旋 (Positive Supercoiling),阻碍复制叉的进一步移动。拓扑异构酶能够缓解这种拓扑张力,保证复制的顺利进行。
▮▮▮▮▮▮▮▮❷ I 型拓扑异构酶 (Type I Topoisomerase):切断 DNA 单链,使 DNA 链旋转,然后重新连接断裂的单链,从而释放拓扑张力。
▮▮▮▮▮▮▮▮❸ II 型拓扑异构酶 (Type II Topoisomerase):切断 DNA 双链,允许另一段 DNA 双链通过,然后重新连接断裂的双链,更有效地释放拓扑张力。在 DNA 复制中,DNA 回旋酶 (DNA Gyrase) 是一种 II 型拓扑异构酶,在原核生物中发挥重要作用。真核生物中,拓扑异构酶 IIα (Topoisomerase IIα) 主要负责缓解复制过程中的拓扑张力。
③ 复制起始的调控机制 (Regulation of Replication Initiation)
复制起始是一个受到严格调控的过程,确保基因组只复制一次。调控机制包括:
▮▮▮▮ⓐ 细胞周期调控 (Cell Cycle Regulation):DNA 复制发生在 细胞周期 (Cell Cycle) 的 S 期 (S phase)。细胞周期蛋白激酶 (Cyclin-Dependent Kinases, CDKs) 在调控复制起始中发挥关键作用。
▮▮▮▮▮▮▮▮❷ pre-RC 的组装 (pre-RC Assembly):在细胞周期的 G1 期 (G1 phase),ORC 结合到复制起始点,招募 Cdc6 和 Cdt1,然后装载 MCM 复合体,形成 pre-RC。这个过程发生在 CDK 活性较低时。
▮▮▮▮▮▮▮▮❸ 复制起始的激活 (Replication Origin Activation):进入 S 期后,CDK 活性升高,磷酸化 pre-RC 组件,包括 MCM 复合体、Sld2 和 Sld3 等蛋白,激活复制起始。同时,CDK 磷酸化 Cdc6 和 Cdt1,导致它们被降解或失活,阻止 pre-RC 的再次组装,从而防止 DNA 的重复复制。
▮▮▮▮ⓑ 起始频率的调控 (Regulation of Origin Firing Frequency):并非所有的复制起始点都会在每个 S 期同时激活。复制起始点的激活频率受到多种因素的调控,包括:
▮▮▮▮▮▮▮▮❷ 染色质状态 (Chromatin State):开放染色质区域的复制起始点更容易激活。
▮▮▮▮▮▮▮▮❸ DNA 损伤 (DNA Damage):DNA 损伤可以激活 DNA 损伤检查点 (DNA Damage Checkpoint),抑制复制起始,为 DNA 修复争取时间。
▮▮▮▮▮▮▮▮❹ 营养条件 (Nutritional Conditions):营养匮乏等不利条件会抑制细胞生长和 DNA 复制。
3.1.2 复制的延伸 (Replication Elongation)
复制延伸是指在复制起始后,DNA 聚合酶 (DNA Polymerase) 利用单链 DNA 模板,按照 半保留复制 (Semi-conservative Replication) 的方式,合成新的 DNA 链的过程。
① DNA 聚合酶的作用机制 (Mechanism of DNA Polymerase)
DNA 聚合酶是催化 DNA 合成的核心酶,具有以下共同特点:
▮▮▮▮ⓐ 需要模板 (Template Dependent):DNA 聚合酶只能以已有的 DNA 链为模板,指导新链的合成。
▮▮▮▮ⓑ 需要引物 (Primer Dependent):DNA 聚合酶不能从头合成 DNA 链,只能在已有的 引物 (Primer) 的 3'-OH 末端添加 脱氧核苷三磷酸 (Deoxynucleotide Triphosphates, dNTPs)。引物通常是一小段 RNA 或 DNA 寡核苷酸。
▮▮▮▮ⓒ 5'→3' 合成方向 (5' to 3' Synthesis Direction):DNA 聚合酶只能沿着模板链的 3'→5' 方向读取,合成新链的方向是 5'→3'。
▮▮▮▮ⓓ 高保真性 (High Fidelity):DNA 聚合酶具有校对功能,能够识别并移除合成过程中掺入的错误碱基,保证 DNA 复制的准确性。
不同生物和不同复制过程中,参与复制的 DNA 聚合酶种类有所不同:
▮▮▮▮ⓐ 原核生物 DNA 聚合酶 (Prokaryotic DNA Polymerases):
▮▮▮▮▮▮▮▮❷ DNA 聚合酶 III (DNA Polymerase III, Pol III):是原核生物主要的复制酶,具有高速度和高保真性。Pol III 全酶 (Pol III holoenzyme) 是一个多亚基复合物,包括催化亚基 α、校对亚基 ε、以及过程性因子 β 滑动夹 (β-clamp) 等。β 滑动夹环绕 DNA,增加 Pol III 与 DNA 的结合力,提高其过程性。
▮▮▮▮▮▮▮▮❸ DNA 聚合酶 I (DNA Polymerase I, Pol I):主要参与 DNA 修复和 冈崎片段 (Okazaki Fragments) 的加工。Pol I 具有 5'→3' 外切酶活性,可以移除 RNA 引物,并用 DNA 替换。
▮▮▮▮▮▮▮▮❹ DNA 聚合酶 II, IV, V (DNA Polymerase II, IV, V):主要参与 DNA 修复和 跨损伤合成 (Translesion Synthesis, TLS)。
▮▮▮▮ⓑ 真核生物 DNA 聚合酶 (Eukaryotic DNA Polymerases):
▮▮▮▮▮▮▮▮❷ DNA 聚合酶 α (DNA Polymerase α, Pol α):与 引物酶 (Primase) 结合形成 Pol α-引物酶复合物 (Pol α-primase complex),启动 DNA 复制。Pol α 负责合成 RNA 引物,并延伸一小段 DNA。
▮▮▮▮▮▮▮▮❸ DNA 聚合酶 δ (DNA Polymerase δ, Pol δ):是真核生物主要的 前导链 (Leading Strand) 和 滞后链 (Lagging Strand) 复制酶,具有高过程性和校对功能。PCNA (增殖细胞核抗原, Proliferating Cell Nuclear Antigen) 类似于原核生物的 β 滑动夹,增加 Pol δ 的过程性。
▮▮▮▮▮▮▮▮❹ DNA 聚合酶 ε (DNA Polymerase ε, Pol ε):主要负责前导链的复制。
▮▮▮▮▮▮▮▮❺ DNA 聚合酶 γ (DNA Polymerase γ, Pol γ):负责 线粒体 DNA (Mitochondrial DNA, mtDNA) 的复制。
▮▮▮▮▮▮▮▮❻ DNA 聚合酶 β (DNA Polymerase β, Pol β):主要参与 碱基切除修复 (Base Excision Repair, BER)。
▮▮▮▮▮▮▮▮❼ DNA 聚合酶 η, ι, κ, λ, ζ, θ, ν, μ, Rev1, Pol ζ (DNA Polymerase η, ι, κ, λ, ζ, θ, ν, μ, Rev1, Pol ζ):参与 DNA 修复和跨损伤合成。
② 前导链和滞后链的合成 (Leading and Lagging Strand Synthesis)
由于 DNA 聚合酶只能 5'→3' 合成,而 DNA 双螺旋是反向平行的,因此 DNA 复制过程中,两条子链的合成方式不同:
▮▮▮▮ⓐ 前导链合成 (Leading Strand Synthesis):前导链的合成方向与复制叉的移动方向一致,DNA 聚合酶可以连续地沿着模板链 5'→3' 方向合成新的 DNA 链,只需要一个 RNA 引物。
▮▮▮▮ⓑ 滞后链合成 (Lagging Strand Synthesis):滞后链的合成方向与复制叉的移动方向相反,DNA 聚合酶不能连续合成,只能合成一系列不连续的 DNA 片段,称为 冈崎片段 (Okazaki Fragments)。每个冈崎片段都需要一个 RNA 引物。
③ 冈崎片段的形成和连接 (Formation and Ligation of Okazaki Fragments)
▮▮▮▮ⓐ RNA 引物的合成 (RNA Primer Synthesis):在滞后链合成中,引物酶 (Primase) 合成 RNA 引物,为 DNA 聚合酶提供 3'-OH 末端。
▮▮▮▮ⓑ 冈崎片段的延伸 (Okazaki Fragment Elongation):DNA 聚合酶 δ (真核生物) 或 Pol III (原核生物) 从 RNA 引物的 3'-OH 末端开始,沿着滞后链模板 5'→3' 方向合成 DNA,直到遇到前一个冈崎片段的 5' 端。
▮▮▮▮ⓒ RNA 引物的移除和 DNA 替换 (RNA Primer Removal and DNA Replacement):
▮▮▮▮▮▮▮▮❹ 原核生物 (Prokaryotes):DNA 聚合酶 I (Pol I) 利用其 5'→3' 外切酶活性,移除 RNA 引物,并同时利用其 5'→3' 聚合酶活性,用 DNA 替换 RNA 引物留下的空隙。
▮▮▮▮▮▮▮▮❺ 真核生物 (Eukaryotes):主要通过 核酸外切酶 (Exonuclease) FEN1 (Flap Endonuclease 1) 和 RNA 酶 H (RNase H) 移除 RNA 引物。FEN1 切除 RNA 引物 5' 端的游离 “瓣状” 结构,RNase H 降解 RNA 部分。然后,DNA 聚合酶 δ (Pol δ) 填补空隙。
▮▮▮▮ⓕ DNA 连接 (DNA Ligation):DNA 连接酶 (DNA Ligase) 催化相邻冈崎片段之间的 磷酸二酯键 (Phosphodiester Bond) 的形成,将不连续的冈崎片段连接成完整的 DNA 链。DNA 连接酶利用 ATP 或 NAD+ 作为能量来源。
④ 复制叉的结构和功能 (Structure and Function of Replication Fork)
复制叉 (Replication Fork) 是 DNA 复制过程中 DNA 双螺旋解开和新链合成的部位,是一个动态的结构,包含多种蛋白质复合物协同工作,完成 DNA 复制。
▮▮▮▮ⓐ 复制体 (Replisome):复制叉上的蛋白质复合物,包括:
▮▮▮▮▮▮▮▮❷ 解旋酶 (Helicase):解开 DNA 双螺旋。
▮▮▮▮▮▮▮▮❸ 单链 DNA 结合蛋白 (Single-Stranded DNA-Binding Proteins, SSB):结合单链 DNA,防止单链 DNA 退火和形成二级结构。
▮▮▮▮▮▮▮▮❹ 引物酶 (Primase):合成 RNA 引物。
▮▮▮▮▮▮▮▮❺ DNA 聚合酶 (DNA Polymerase):合成 DNA 新链。
▮▮▮▮▮▮▮▮❻ 滑动夹 (Sliding Clamp):增加 DNA 聚合酶的过程性。
▮▮▮▮▮▮▮▮❼ 滑动夹装载器 (Clamp Loader):将滑动夹装载到 DNA 上。
▮▮▮▮▮▮▮▮❽ 拓扑异构酶 (Topoisomerase):缓解拓扑张力。
▮▮▮▮ⓑ 协同复制模型 (Coordinated Replication Model):前导链和滞后链的合成在复制叉上是协同进行的。一种模型是 “套索模型 (Trombone Model)”,滞后链模板 DNA 形成一个环状结构,使得前导链和滞后链 DNA 聚合酶可以同时沿着复制叉方向移动,实现协同复制。
3.1.3 复制的终止 (Replication Termination)
复制终止是指 DNA 复制过程的最终完成,包括复制叉的停止移动和复制产物的分离。
① 原核生物复制终止 (Prokaryotic Replication Termination)
▮▮▮▮ⓐ 终止位点 (Termination Site, ter):大肠杆菌 (E. coli) 染色体上存在 终止位点 (ter),位于复制起点 oriC 的相对位置。 ter 位点与 终止位点利用物质 (Termination Utilization Substance, Tus) 蛋白结合,形成 Ter-Tus 复合物,阻碍复制叉的移动。
▮▮▮▮ⓑ 复制叉碰撞 (Replication Fork Collision):当两个复制叉分别从相反方向移动,到达 ter 位点区域时,Ter-Tus 复合物会阻止复制叉的进一步移动,导致两个复制叉碰撞并停止复制。
▮▮▮▮ⓒ 解链酶和拓扑异构酶的作用 (Roles of Decatenation and Topoisomerase):复制终止后,两个环状的子代 DNA 分子会相互 缠绕 (Catenation),形成 互锁环 (Catenanes)。拓扑异构酶 II (Topoisomerase II),如 大肠杆菌 (E. coli) 的 拓扑异构酶 IV (Topoisomerase IV),能够解开互锁环,将两个子代 DNA 分子分离。
② 真核生物染色体末端复制 (Replication of Eukaryotic Chromosome Ends)
真核生物染色体是线性的,复制到末端时,滞后链合成会遇到 末端复制问题 (End-Replication Problem)。由于滞后链合成需要 RNA 引物,当移除末端 RNA 引物后,末端会留下一个空隙,导致每次复制后染色体末端缩短。
▮▮▮▮ⓐ 端粒酶 (Telomerase):端粒酶 (Telomerase) 是一种 逆转录酶 (Reverse Transcriptase),能够利用自身携带的 RNA 模板 (RNA Template),以 DNA 为模板合成 DNA,延长染色体末端的 端粒 (Telomere) 序列。端粒是由重复序列 (在人类中是 TTAGGG) 组成的 DNA 保护帽,保护染色体末端免受损伤和融合。
▮▮▮▮ⓑ 端粒酶的作用机制 (Mechanism of Telomerase):
▮▮▮▮▮▮▮▮❸ 端粒酶结合 (Telomerase Binding):端粒酶结合到染色体末端的单链端粒 DNA 突出端。
▮▮▮▮▮▮▮▮❹ RNA 模板杂交 (RNA Template Hybridization):端粒酶 RNA 模板与端粒 DNA 序列互补配对。
▮▮▮▮▮▮▮▮❺ DNA 合成 (DNA Synthesis):端粒酶利用 RNA 模板,以端粒 DNA 为引物,合成端粒重复序列 DNA。
▮▮▮▮▮▮▮▮❻ 移位 (Translocation):端粒酶移位到新合成的 DNA 末端,重复 RNA 模板杂交和 DNA 合成过程,逐步延长端粒。
\[ \text{端粒酶} + \text{端粒 DNA} \xrightarrow{} \text{端粒 DNA 延长} \]
▮▮▮▮ⓒ 端粒与细胞衰老 (Telomeres and Cellular Senescence):在大多数体细胞中,端粒酶活性很低或缺失,端粒会随着细胞分裂而逐渐缩短。当端粒缩短到一定程度时,细胞会停止分裂,进入 细胞衰老 (Cellular Senescence) 或 细胞凋亡 (Apoptosis)。端粒长度与细胞寿命和衰老密切相关。在 干细胞 (Stem Cells) 和 癌细胞 (Cancer Cells) 中,端粒酶活性较高,可以维持端粒长度,实现细胞的持续增殖。
3.1.4 复制的调控 (Regulation of Replication)
DNA 复制是一个高度调控的过程,必须在细胞周期的特定时期发生,并且每个基因组只复制一次。复制调控主要发生在复制起始阶段。
① 细胞周期对 DNA 复制的调控 (Cell Cycle Regulation of DNA Replication)
DNA 复制严格受到细胞周期的调控,发生在 S 期,并与细胞周期的其他事件协调一致。
▮▮▮▮ⓐ pre-RC 的形成与激活 (pre-RC Formation and Activation):如前所述,pre-RC 的形成发生在 G1 期,激活发生在 S 期,受到 细胞周期蛋白依赖性激酶 (Cyclin-Dependent Kinases, CDKs) 的调控。
▮▮▮▮ⓑ 复制起始的抑制与激活 (Inhibition and Activation of Replication Initiation):CDK 活性在 G1 期较低,有利于 pre-RC 的形成;在 S 期升高,激活 pre-RC,启动复制起始。CDK 同时抑制 pre-RC 的再次形成,防止 DNA 的重复复制。
▮▮▮▮ⓒ 检查点调控 (Checkpoint Regulation):DNA 复制检查点 (DNA Replication Checkpoint) 监控 DNA 复制的进程,当复制受阻或 DNA 损伤时,激活检查点信号通路,抑制细胞周期进程,为 DNA 修复争取时间。ATR (Ataxia-Telangiectasia and Rad3-related protein kinase) 激酶是 DNA 复制检查点的关键调控分子。
② 复制起始频率和复制完成的监控机制 (Monitoring Mechanisms of Origin Firing Frequency and Replication Completion)
▮▮▮▮ⓐ 复制起始频率的调控 (Regulation of Origin Firing Frequency):并非所有复制起始点都在每个 S 期同时激活。复制起始点的激活频率受到多种因素的调控,包括染色质状态、DNA 损伤、营养条件等。
▮▮▮▮ⓑ 复制完成的监控 (Monitoring of Replication Completion):细胞需要确保 DNA 复制完全完成后才能进入 有丝分裂 (Mitosis)。复制完成检查点 (Replication Completion Checkpoint) 监控 DNA 复制的完成情况,当复制未完成时,阻止细胞进入有丝分裂。Chk1 (Checkpoint Kinase 1) 激酶是复制完成检查点的关键调控分子。
\[ \text{DNA 复制受阻} \xrightarrow{} \text{复制检查点激活} \xrightarrow{} \text{细胞周期阻滞} \xrightarrow{} \text{DNA 修复} \]
通过这些精细的调控机制,细胞确保 DNA 复制在正确的时间、正确的地点、以高保真性完成,维持基因组的稳定性和完整性。
3.2 DNA 损伤与修复 (DNA Damage and Repair)
摘要
介绍 DNA 损伤的类型和来源,以及细胞应对 DNA 损伤的多种修复途径,包括 直接修复 (Direct Repair)、切除修复 (Excision Repair)、重组修复 (Recombination Repair) 和 跨损伤合成 (Translesion Synthesis) 等。
3.2.1 DNA 损伤的类型与来源 (Types and Sources of DNA Damage)
DNA 损伤 (DNA Damage) 是指 DNA 分子结构上的异常改变,可以由多种内源性和外源性因素引起。DNA 损伤如果不能及时修复,会导致 突变 (Mutation)、基因组不稳定 (Genome Instability),甚至 细胞死亡 (Cell Death) 或 癌症 (Cancer)。
① DNA 损伤的类型 (Types of DNA Damage)
▮▮▮▮ⓐ 碱基修饰 (Base Modifications):
▮▮▮▮▮▮▮▮❷ 氧化损伤 (Oxidative Damage):活性氧 (Reactive Oxygen Species, ROS),如超氧阴离子自由基 (O2•−)、羟自由基 (•OH)、过氧化氢 (H2O2) 等,可以氧化 DNA 碱基,产生 8-oxo-鸟嘌呤 (8-oxoG)、胸腺嘧啶乙二醇 (thymine glycol) 等修饰碱基。8-oxoG 是最常见的氧化损伤碱基,可以导致 G:C → T:A 颠换突变。
\[ \text{鸟嘌呤} + \text{ROS} \xrightarrow{} \text{8-oxo-鸟嘌呤} \]
▮▮▮▮▮▮▮▮❷ 烷基化损伤 (Alkylation Damage):烷基化剂,如 N-甲基-N'-亚硝基脲 (N-methyl-N'-nitrosourea, MNU)、氮芥 (nitrogen mustard) 等,可以将甲基或乙基等烷基基团添加到 DNA 碱基上,产生 O6-甲基鸟嘌呤 (O6-methylguanine)、7-甲基鸟嘌呤 (7-methylguanine) 等修饰碱基。O6-甲基鸟嘌呤可以导致 G:C → A:T 转换突变。
\[ \text{鸟嘌呤} + \text{烷基化剂} \xrightarrow{} \text{O}^6\text{-甲基鸟嘌呤} \]
▮▮▮▮▮▮▮▮❸ 脱氨基损伤 (Deamination Damage):自发或化学诱导的脱氨基作用可以将胞嘧啶 (cytosine) 脱氨基为尿嘧啶 (uracil),腺嘌呤 (adenine) 脱氨基为次黄嘌呤 (hypoxanthine),鸟嘌呤 (guanine) 脱氨基为黄嘌呤 (xanthine),5-甲基胞嘧啶 (5-methylcytosine) 脱氨基为胸腺嘧啶 (thymine)。胞嘧啶脱氨基产生的尿嘧啶在 DNA 中是异常碱基,需要被修复。
\[ \text{胞嘧啶} + \text{H}_2\text{O} \xrightarrow{} \text{尿嘧啶} + \text{NH}_3 \]
▮▮▮▮ⓑ DNA 链断裂 (DNA Strand Breaks):
▮▮▮▮▮▮▮▮❷ 单链断裂 (Single-Strand Breaks, SSB):DNA 单链骨架的磷酸二酯键断裂。SSB 可以由 ROS、电离辐射、DNA 复制错误等引起。
▮▮▮▮▮▮▮▮❸ 双链断裂 (Double-Strand Breaks, DSB):DNA 双链同时断裂。DSB 是最严重的 DNA 损伤类型,可以由电离辐射、化学药物、复制叉塌陷等引起。DSB 如果修复不当,容易导致染色体畸变和基因组不稳定。
▮▮▮▮ⓒ DNA 交联 (DNA Crosslinks):
▮▮▮▮▮▮▮▮❷ 链内交联 (Intrastrand Crosslinks):同一条 DNA 链内的两个碱基之间形成共价连接。例如,嘧啶二聚体 (Pyrimidine Dimers) 是紫外线照射引起的常见链内交联,主要是胸腺嘧啶二聚体 (thymine dimers, T=T) 和胞嘧啶二聚体 (cytosine dimers, C=C)。嘧啶二聚体阻碍 DNA 复制和转录。
\[ \text{胸腺嘧啶} + \text{紫外线} \xrightarrow{} \text{胸腺嘧啶二聚体} \]
▮▮▮▮▮▮▮▮❷ 链间交联 (Interstrand Crosslinks, ICL):两条互补 DNA 链的碱基之间形成共价连接。ICL 阻止 DNA 双螺旋解开,严重阻碍 DNA 复制和转录。丝裂霉素 C (Mitomycin C)、顺铂 (Cisplatin) 等化疗药物可以诱导 ICL。
▮▮▮▮ⓓ DNA 插入和缺失 (DNA Insertions and Deletions):DNA 分子中插入或缺失一段 DNA 序列。插入和缺失可以由 转座子 (Transposons) 插入或 复制滑动 (Replication Slippage) 等机制引起。
② DNA 损伤的来源 (Sources of DNA Damage)
▮▮▮▮ⓐ 内源性损伤 (Endogenous Damage):
▮▮▮▮▮▮▮▮❷ 代谢副产物 (Metabolic Byproducts):细胞代谢过程中产生的 ROS、活性氮 (Reactive Nitrogen Species, RNS) 等可以损伤 DNA。
▮▮▮▮▮▮▮▮❸ 水解作用 (Hydrolysis):DNA 碱基和糖苷键在生理条件下会发生自发水解,导致脱嘌呤 (apurinic) 位点、脱嘧啶 (apyrimidinic) 位点和单链断裂。
▮▮▮▮▮▮▮▮❹ 复制错误 (Replication Errors):DNA 复制过程中,DNA 聚合酶可能掺入错误的碱基,或发生插入、缺失等错误。DNA 聚合酶的校对功能可以纠正大部分复制错误,但仍有少量错误残留。
▮▮▮▮ⓑ 外源性损伤 (Exogenous Damage):
▮▮▮▮▮▮▮▮❷ 物理因素 (Physical Agents):
▮▮▮▮ⓒ 紫外线 (Ultraviolet Radiation, UV):UV 主要是 UVB (280-315 nm) 和 UVC (<280 nm),可以被 DNA 碱基吸收,诱导嘧啶二聚体形成。UVC 波长较短,能量高,但大部分被臭氧层吸收,到达地面的主要是 UVB。UVA (315-400 nm) 波长较长,能量较低,但穿透力强,可以间接产生 ROS,损伤 DNA。
▮▮▮▮ⓓ 电离辐射 (Ionizing Radiation, IR):X 射线、γ 射线、α 粒子、β 粒子等高能辐射可以直接或间接地损伤 DNA,引起单链断裂、双链断裂、碱基损伤等多种类型的 DNA 损伤。
▮▮▮▮▮▮▮▮❺ 化学因素 (Chemical Agents):
▮▮▮▮ⓕ 烷基化剂 (Alkylating Agents):如 MNU、氮芥、甲基磺酸甲酯 (Methyl Methanesulfonate, MMS) 等,可以引起 DNA 碱基烷基化损伤。
▮▮▮▮ⓖ 插入剂 (Intercalating Agents):如 溴化乙锭 (Ethidium Bromide, EB)、吖啶橙 (Acridine Orange) 等,可以插入 DNA 碱基对之间,引起 DNA 构象改变,干扰 DNA 复制和转录。
▮▮▮▮ⓗ 氧化剂 (Oxidizing Agents):如过氧化氢、高锰酸钾等,可以引起 DNA 氧化损伤。
▮▮▮▮▮▮▮▮❾ 生物因素 (Biological Agents):
▮▮▮▮ⓙ 病毒 (Viruses):某些病毒感染可以导致 DNA 损伤,例如 人乳头瘤病毒 (Human Papillomavirus, HPV) 感染与宫颈癌相关。
▮▮▮▮ⓚ 细菌毒素 (Bacterial Toxins):某些细菌毒素可以损伤 DNA,例如 大肠杆菌 (E. coli) 产生的 Colibactin 毒素可以诱导 DNA 链间交联。
3.2.2 直接修复 (Direct Repair)
直接修复 (Direct Repair) 是指直接逆转 DNA 损伤,恢复 DNA 原有结构的修复途径,不需要切除或替换 DNA 碱基或核苷酸。直接修复途径主要针对某些特定的 DNA 损伤类型。
① 光修复酶修复嘧啶二聚体 (Photolyase Repair of Pyrimidine Dimers)
▮▮▮▮ⓐ 光修复酶 (Photolyase):光修复酶是一种 DNA 修复酶,存在于细菌、真菌、植物和动物 (哺乳动物除外) 中。光修复酶能够利用可见光 (300-500 nm) 的能量,直接断裂紫外线引起的 嘧啶二聚体 (Pyrimidine Dimers) 的共价键,恢复正常的嘧啶碱基。
▮▮▮▮ⓑ 光修复酶的作用机制 (Mechanism of Photolyase):
▮▮▮▮▮▮▮▮❸ 光修复酶结合 (Photolyase Binding):光修复酶结合到含有嘧啶二聚体的 DNA 部位。
▮▮▮▮▮▮▮▮❹ 光吸收 (Light Absorption):光修复酶含有 黄素腺嘌呤二核苷酸 (Flavin Adenine Dinucleotide, FAD) 作为 辅酶 (Cofactor),可以吸收可见光。
▮▮▮▮▮▮▮▮❺ 电子传递和二聚体断裂 (Electron Transfer and Dimer Splitting):吸收光能后,FAD 处于激发态,通过电子传递机制,将电子转移到嘧啶二聚体上,断裂二聚体的共价键,恢复正常的嘧啶碱基。
▮▮▮▮▮▮▮▮❻ 酶释放 (Enzyme Release):修复完成后,光修复酶释放,可以继续修复其他嘧啶二聚体。
\[ \text{嘧啶二聚体} + \text{光修复酶} + \text{可见光} \xrightarrow{} \text{正常嘧啶碱基} + \text{光修复酶} \]
② 甲基转移酶修复甲基化碱基 (Methyltransferase Repair of Methylated Bases)
▮▮▮▮ⓐ O6-甲基鸟嘌呤-DNA 甲基转移酶 (O6-Methylguanine-DNA Methyltransferase, MGMT):MGMT 是一种直接修复酶,能够特异性地移除 DNA 碱基 O6-甲基鸟嘌呤上的甲基,恢复正常的鸟嘌呤碱基。O6-甲基鸟嘌呤是由烷基化剂引起的常见 DNA 损伤,可以导致 G:C → A:T 转换突变。
▮▮▮▮ⓑ MGMT 的作用机制 (Mechanism of MGMT):
▮▮▮▮▮▮▮▮❸ MGMT 结合 (MGMT Binding):MGMT 结合到含有 O6-甲基鸟嘌呤的 DNA 部位。
▮▮▮▮▮▮▮▮❹ 甲基转移 (Methyl Transfer):MGMT 将 O6-甲基鸟嘌呤上的甲基基团转移到自身 活性位点 (Active Site) 的 半胱氨酸残基 (Cysteine Residue) 上。
▮▮▮▮▮▮▮▮❺ 酶失活 (Enzyme Inactivation):甲基转移后,MGMT 自身被甲基化修饰,失去酶活性,成为 “自杀酶 (Suicide Enzyme)”。每个 MGMT 分子只能修复一次 O6-甲基鸟嘌呤损伤。
\[ \text{O}^6\text{-甲基鸟嘌呤} + \text{MGMT} \xrightarrow{} \text{鸟嘌呤} + \text{甲基化的 MGMT} \]
直接修复途径简单高效,但只能修复特定的 DNA 损伤类型。对于其他类型的 DNA 损伤,细胞需要依赖切除修复、重组修复等更复杂的修复途径。
3.2.3 切除修复 (Excision Repair)
切除修复 (Excision Repair) 是一类重要的 DNA 修复途径,能够识别并切除 DNA 损伤部位,然后利用另一条链作为模板,重新合成 DNA,填补空隙。切除修复主要包括 碱基切除修复 (Base Excision Repair, BER) 和 核苷酸切除修复 (Nucleotide Excision Repair, NER) 两种途径。
① 碱基切除修复 (Base Excision Repair, BER)
BER 主要修复小的、非螺旋扭曲性的 DNA 碱基损伤,如氧化损伤碱基、烷基化碱基、脱氨基碱基、单链断裂等。BER 途径主要由 DNA 糖基化酶 (DNA Glycosylase)、AP 核酸内切酶 (AP Endonuclease)、DNA 聚合酶 β (Pol β) 和 DNA 连接酶 III (DNA Ligase III) 等酶参与。
▮▮▮▮ⓐ DNA 糖基化酶识别和移除损伤碱基 (DNA Glycosylase Recognition and Removal of Damaged Base):
▮▮▮▮▮▮▮▮❷ DNA 糖基化酶 (DNA Glycosylase):不同类型的 DNA 糖基化酶能够识别并特异性地移除不同类型的损伤碱基。例如,O6-甲基鸟嘌呤-DNA 糖基化酶 (O6-Methylguanine-DNA Glycosylase, MGMT) (注意与甲基转移酶 MGMT 区分,虽然名称相似,但功能不同) 移除 O6-甲基鸟嘌呤,尿嘧啶-DNA 糖基化酶 (Uracil-DNA Glycosylase, UDG) 移除尿嘧啶,8-oxoG-DNA 糖基化酶 (8-oxoG-DNA Glycosylase, OGG1) 移除 8-oxo-鸟嘌呤。
▮▮▮▮▮▮▮▮❸ 糖基化酶作用机制 (Glycosylase Mechanism):DNA 糖基化酶通过 “碱基翻转 (Base Flipping)” 机制,将损伤碱基翻转出 DNA 双螺旋,然后切断损伤碱基与脱氧核糖之间的 N-糖苷键 (N-glycosidic Bond),释放损伤碱基,留下 脱碱基位点 (Abasic Site),也称为 AP 位点 (Apurinic/Apyrimidinic Site)。
\[ \text{损伤碱基} + \text{DNA 糖基化酶} \xrightarrow{} \text{AP 位点} + \text{损伤碱基} \]
▮▮▮▮ⓑ AP 核酸内切酶切开 DNA 链 (AP Endonuclease Cleavage of DNA Strand):
▮▮▮▮▮▮▮▮❷ AP 核酸内切酶 (AP Endonuclease):AP 核酸内切酶识别 AP 位点,切断 AP 位点 5' 端的磷酸二酯键,产生一个 3'-OH 末端和一个 5'-脱氧核糖磷酸 (5'-dRP) 末端。APE1 (AP Endonuclease 1) 是哺乳动物细胞中主要的 AP 核酸内切酶。
\[ \text{AP 位点} + \text{AP 核酸内切酶} \xrightarrow{} \text{3'-OH 末端} + \text{5'-dRP 末端} \]
▮▮▮▮ⓒ DNA 聚合酶 β 填补空隙 (DNA Polymerase β Gap Filling):
▮▮▮▮▮▮▮▮❷ DNA 聚合酶 β (Pol β):Pol β 是一种 BER 途径中特异性的 DNA 聚合酶,具有 5'-dRP 酶活性和 DNA 聚合酶活性。Pol β 可以移除 5'-dRP 末端,并利用 3'-OH 末端作为引物,以另一条链为模板,将正确的核苷酸插入到空隙中,填补单个核苷酸的空隙 (短片段 BER 途径, Short-Patch BER Pathway)。在某些情况下,Pol δ 或 Pol ε 也可以参与填补较长的空隙 (长片段 BER 途径, Long-Patch BER Pathway)。
\[ \text{3'-OH 末端} + \text{5'-dRP 末端} + \text{Pol β} \xrightarrow{} \text{带缺口的 DNA} \]
▮▮▮▮ⓓ DNA 连接酶 III 连接 DNA 链 (DNA Ligase III DNA Ligation):
▮▮▮▮▮▮▮▮❷ DNA 连接酶 III (DNA Ligase III):DNA 连接酶 III 催化 DNA 链的连接,封闭 DNA 骨架上的缺口,完成 BER 修复。XRCC1 (X-Ray Repair Cross-Complementing protein 1) 是 DNA 连接酶 III 的辅助因子,参与 BER 途径的组装和调控。
\[ \text{带缺口的 DNA} + \text{DNA 连接酶 III} \xrightarrow{} \text{修复完成的 DNA} \]
② 核苷酸切除修复 (Nucleotide Excision Repair, NER)
NER 主要修复大的、螺旋扭曲性的 DNA 损伤,如嘧啶二聚体、DNA 交联、大的碱基加合物等。NER 途径比 BER 途径更复杂,需要更多的酶和蛋白因子参与。NER 主要分为 全局基因组 NER (Global Genome NER, GG-NER) 和 转录偶联 NER (Transcription-Coupled NER, TC-NER) 两种亚途径。
▮▮▮▮ⓐ 全局基因组 NER (GG-NER):GG-NER 负责修复基因组中非转录区域的 DNA 损伤。GG-NER 的起始步骤是 损伤识别 (Damage Recognition)。
▮▮▮▮▮▮▮▮❷ 损伤识别蛋白 (Damage Recognition Proteins):在真核生物中,XPC-RAD23B 复合物 (XPC-RAD23B complex) 是主要的 GG-NER 损伤识别蛋白,能够识别 DNA 螺旋结构的扭曲。UV-DDB 复合物 (UV-Damaged DNA-Binding protein complex) (DDB1-DDB2) 可以增强对紫外线诱导的 DNA 损伤的识别,特别是嘧啶二聚体。
▮▮▮▮ⓑ 转录偶联 NER (TC-NER):TC-NER 负责修复基因组中转录活跃区域的 DNA 损伤。TC-NER 的损伤识别与 停滞的 RNA 聚合酶 (Stalled RNA Polymerase) 相关。
▮▮▮▮▮▮▮▮❷ 停滞的 RNA 聚合酶 (Stalled RNA Polymerase):当 RNA 聚合酶在转录过程中遇到 DNA 损伤时,会被阻滞,停留在损伤部位。停滞的 RNA 聚合酶可以作为损伤信号,启动 TC-NER。
▮▮▮▮▮▮▮▮❸ CSA 和 CSB 蛋白 (CSA and CSB Proteins):Cockayne 综合征 (Cockayne Syndrome, CS) 相关蛋白 CSA 和 CSB 参与 TC-NER。CSB 蛋白 (也称为 ERCC6) 是一种 SWI/SNF 家族 ATP 酶,可以帮助 RNA 聚合酶从损伤部位移开,并招募 NER 修复机器。
▮▮▮▮ⓒ NER 修复的共同步骤 (Common Steps of NER Repair):无论是 GG-NER 还是 TC-NER,后续的修复步骤是相同的:
▮▮▮▮▮▮▮▮❷ 解旋酶解开 DNA 双螺旋 (Helicase Unwinding of DNA Duplex):TFIIH (转录因子 II H) 是一种多亚基复合物,参与转录起始和 NER。TFIIH 包含 XPB 和 XPD 亚基,具有 ATP 依赖的 DNA 解旋酶活性,可以解开损伤部位周围的 DNA 双螺旋,形成开放的修复泡。
▮▮▮▮▮▮▮▮❸ 核酸内切酶切开 DNA 链 (Endonuclease Incision of DNA Strand):XPF-ERCC1 复合物 (XPF-ERCC1 complex) 和 XPG 核酸内切酶 (XPG endonuclease) 是 NER 途径中的两个核酸内切酶。XPF-ERCC1 切开损伤部位 5' 端的 DNA 链,XPG 切开损伤部位 3' 端的 DNA 链,在损伤部位两侧产生两个切口。
▮▮▮▮▮▮▮▮❹ 切除损伤 DNA 片段 (Excision of Damaged DNA Fragment):两个切口之间的损伤 DNA 片段 (长度约为 25-30 个核苷酸) 被切除,释放出来。
▮▮▮▮▮▮▮▮❺ DNA 聚合酶填补空隙 (DNA Polymerase Gap Filling):DNA 聚合酶 δ (Pol δ) 或 DNA 聚合酶 ε (Pol ε) 利用另一条链作为模板,填补切除损伤片段留下的空隙。RPA (复制蛋白 A, Replication Protein A) 结合单链 DNA,稳定修复泡结构。
▮▮▮▮▮▮▮▮❻ DNA 连接酶连接 DNA 链 (DNA Ligase Ligation):DNA 连接酶 I (DNA Ligase I) 或 DNA 连接酶 III (DNA Ligase III) 催化 DNA 链的连接,封闭 DNA 骨架上的缺口,完成 NER 修复。
NER 途径能够修复多种类型的 DNA 损伤,对于维持基因组稳定性和预防癌症至关重要。着色性干皮病 (Xeroderma Pigmentosum, XP) 是一种遗传病,由 NER 途径基因突变引起,患者对紫外线高度敏感,容易发生皮肤癌。
3.2.4 重组修复 (Recombination Repair)
重组修复 (Recombination Repair) 是一类利用 同源重组 (Homologous Recombination, HR) 机制修复 DNA 损伤的途径,主要修复 双链断裂 (Double-Strand Breaks, DSB)。重组修复主要包括 同源重组修复 (Homologous Recombination Repair, HRR) 和 非同源末端连接 (Non-Homologous End Joining, NHEJ) 两种途径。
① 同源重组修复 (Homologous Recombination Repair, HRR)
HRR 是一种高保真性的 DSB 修复途径,利用同源染色体或姐妹染色单体上的同源序列作为模板,修复 DSB。HRR 主要发生在细胞周期的 S 期 (S phase) 和 G2 期 (G2 phase),此时姐妹染色单体存在,可以作为理想的同源模板。HRR 途径主要由 Rad51、BRCA1、BRCA2 等蛋白参与。
▮▮▮▮ⓐ DSB 末端切除 (DSB End Resection):
▮▮▮▮▮▮▮▮❷ DSB 识别 (DSB Recognition):MRN 复合物 (MRN complex) (Mre11-Rad50-Nbs1) 是 DSB 早期识别复合物,结合到 DSB 末端。
▮▮▮▮▮▮▮▮❸ 末端切除酶 (End Resection Enzymes):末端切除酶,如 Mre11 核酸外切酶 (Mre11 exonuclease)、CtIP (CtBP-interacting protein)、Exo1 核酸外切酶 (Exo1 exonuclease)、DNA2-Sgs1 复合物 (DNA2-Sgs1 complex) 等,从 DSB 末端 5'→3' 方向切除 DNA 链,产生 3' 单链突出端。
\[ \text{DSB} \xrightarrow{\text{末端切除}} \text{3' 单链突出端} \]
▮▮▮▮ⓑ 单链 DNA 包被 (Single-Stranded DNA Coating):
▮▮▮▮▮▮▮▮❷ RPA 包被 (RPA Coating):RPA (复制蛋白 A, Replication Protein A) 结合到 3' 单链 DNA 上,防止单链 DNA 退火和形成二级结构,稳定单链 DNA。
▮▮▮▮▮▮▮▮❸ 链侵入 (Strand Invasion):Rad51 蛋白 替换 RPA,结合到单链 DNA 上,形成 Rad51-单链 DNA 核蛋白丝 (Rad51-ssDNA nucleoprotein filament)。Rad51 核蛋白丝介导单链 DNA 侵入同源双链 DNA 模板,寻找同源序列,形成 D-环 (Displacement Loop, D-loop) 结构。BRCA2 (乳腺癌易感基因 2, Breast Cancer gene 2) 蛋白辅助 Rad51 的装载和稳定。
\[ \text{3' 单链突出端} + \text{Rad51} \xrightarrow{} \text{Rad51-单链 DNA 核蛋白丝} \xrightarrow{\text{链侵入}} \text{D-环} \]
▮▮▮▮ⓒ DNA 合成和同源序列修复 (DNA Synthesis and Homologous Sequence Repair):
▮▮▮▮▮▮▮▮❷ DNA 合成 (DNA Synthesis):以同源 DNA 模板为指导,DNA 聚合酶 (DNA Polymerase) 利用侵入的 3' 单链 DNA 作为引物,沿着同源模板合成 DNA,延伸 D-环。
▮▮▮▮▮▮▮▮❸ Holliday 结构形成 (Holliday Junction Formation):DNA 合成延伸后,D-环退火,与另一条 DSB 末端单链 DNA 配对,形成 Holliday 结构 (Holliday Junction)。Holliday 结构是一个四路 DNA 连接点,由两条 DNA 链交叉形成。
▮▮▮▮ⓓ Holliday 结构分支迁移和解离 (Holliday Junction Branch Migration and Resolution):
▮▮▮▮▮▮▮▮❷ 分支迁移 (Branch Migration):Holliday 结构可以发生 分支迁移 (Branch Migration),即交叉点沿着 DNA 分子移动,扩大同源序列交换的范围。
▮▮▮▮▮▮▮▮❸ Holliday 结构解离 (Holliday Junction Resolution):Holliday 结构解离酶 (Holliday Junction Resolvase) 切断 Holliday 结构,将 Holliday 结构解离为两个独立的 DNA 分子。根据切断方式的不同,Holliday 结构解离可以导致 交叉 (Crossover) 或 非交叉 (Non-crossover) 重组。交叉重组导致染色体之间发生遗传物质交换,非交叉重组不发生遗传物质交换,只进行 DNA 修复。
HRR 是一种精确的 DSB 修复途径,利用同源模板进行修复,避免了遗传信息的丢失和突变的产生。BRCA1 和 BRCA2 基因突变与乳腺癌、卵巢癌等多种癌症的发生密切相关,因为 BRCA1 和 BRCA2 蛋白在 HRR 途径中发挥重要作用,HRR 功能缺陷会导致基因组不稳定和肿瘤发生。
② 非同源末端连接 (Non-Homologous End Joining, NHEJ)
NHEJ 是一种主要的 DSB 修复途径,可以直接连接 DSB 的两个末端,不需要同源模板。NHEJ 修复速度快,但在连接过程中可能发生小片段的 插入 (Insertion) 或 缺失 (Deletion),导致突变,因此 NHEJ 是一种 易错修复途径 (Error-Prone Repair Pathway)。NHEJ 在细胞周期的各个时期都可发生,但在 G1 期 (G1 phase) 和 早期 S 期 (Early S phase) 更为活跃,此时姐妹染色单体尚未形成,HRR 途径受到限制。NHEJ 途径主要由 Ku70/Ku80 二聚体 (Ku70/Ku80 heterodimer)、DNA-PKcs (DNA-Dependent Protein Kinase catalytic subunit)、Artemis 核酸内切酶 (Artemis endonuclease)、DNA 连接酶 IV-XRCC4 复合物 (DNA Ligase IV-XRCC4 complex) 等蛋白参与。
▮▮▮▮ⓐ DSB 末端识别和结合 (DSB End Recognition and Binding):
▮▮▮▮▮▮▮▮❷ Ku70/Ku80 二聚体 (Ku70/Ku80 heterodimer):Ku70/Ku80 二聚体是 NHEJ 途径的起始蛋白,能够高亲和力地结合到 DSB 末端,形成 Ku-DNA 复合物 (Ku-DNA complex),保护 DSB 末端免受核酸外切酶的降解,并招募其他 NHEJ 修复因子。
\[ \text{DSB} + \text{Ku70/Ku80} \xrightarrow{} \text{Ku-DNA 复合物} \]
▮▮▮▮ⓑ DSB 末端加工 (DSB End Processing):
▮▮▮▮▮▮▮▮❷ DNA-PKcs 招募和激活 (DNA-PKcs Recruitment and Activation):Ku-DNA 复合物招募 DNA-PKcs (DNA-Dependent Protein Kinase catalytic subunit)。DNA-PKcs 是一种 丝氨酸/苏氨酸蛋白激酶 (Serine/Threonine Protein Kinase),属于 PI3K 相关激酶 (PI3K-related Kinase, PIKK) 家族。Ku-DNA 复合物结合 DNA-PKcs,激活 DNA-PKcs 的激酶活性。
▮▮▮▮▮▮▮▮❸ 末端加工酶 (End Processing Enzymes):DNA-PKcs 激活后,可以磷酸化自身和其他 NHEJ 因子,促进 DSB 末端加工。Artemis 核酸内切酶 (Artemis endonuclease),在 DNA-PKcs 磷酸化后被激活,具有 5' 和 3' 单链 DNA 外切酶活性,可以移除 DSB 末端的突出端或损伤的核苷酸,使 DSB 末端变得平齐,有利于连接。核酸外切酶 (Exonucleases) 和 DNA 聚合酶 (DNA Polymerases) (如 Pol μ 和 Pol λ) 也参与 DSB 末端加工,填补空隙或移除突出端。
▮▮▮▮ⓒ DNA 末端连接 (DNA End Ligation):
▮▮▮▮▮▮▮▮❷ DNA 连接酶 IV-XRCC4 复合物 (DNA Ligase IV-XRCC4 complex):DNA 连接酶 IV (DNA Ligase IV) 是 NHEJ 途径中特异性的 DNA 连接酶,与 XRCC4 (X-Ray Repair Cross-Complementing protein 4) 和 XLF/Cernunnos (XRCC4-Like Factor/Cernunnos) 形成复合物,催化 DSB 末端的直接连接。XRCC4 和 XLF/Cernunnos 增强 DNA 连接酶 IV 的活性和稳定性,促进 NHEJ 修复。
\[ \text{DSB 末端} + \text{DNA 连接酶 IV-XRCC4 复合物} \xrightarrow{} \text{连接的 DNA} \]
NHEJ 是一种快速有效的 DSB 修复途径,对于维持基因组稳定性和细胞存活至关重要。然而,NHEJ 的易错性可能导致基因突变和染色体畸变。在某些情况下,NHEJ 修复错误可能导致癌症的发生。
3.2.5 跨损伤合成 (Translesion Synthesis, TLS)
跨损伤合成 (Translesion Synthesis, TLS) 是一种应对严重 DNA 损伤的特殊修复机制。当 DNA 复制叉遇到 DNA 损伤,如嘧啶二聚体、DNA 加合物等,正常的 高保真性 DNA 聚合酶 (High-Fidelity DNA Polymerases) 会被阻滞,复制进程受阻。为了避免复制叉停滞和基因组崩溃,细胞可以利用 跨损伤合成 DNA 聚合酶 (Translesion Synthesis DNA Polymerases, TLS Polymerases) 绕过损伤部位,继续进行 DNA 复制。TLS 聚合酶的活性较低,保真性较差,容易在损伤部位引入错误,因此 TLS 是一种 容错修复机制 (Error-Prone Repair Mechanism)。
① TLS 聚合酶的特点 (Characteristics of TLS Polymerases)
▮▮▮▮ⓐ 低保真性 (Low Fidelity):TLS 聚合酶的活性位点较大,对碱基配对的特异性较低,缺乏 3'→5' 外切酶校对活性,因此容易在 DNA 合成过程中引入错误。
▮▮▮▮ⓑ 绕过损伤能力 (Damage Bypass Ability):TLS 聚合酶能够识别并结合到 DNA 损伤部位,绕过损伤,继续进行 DNA 合成。
▮▮▮▮ⓒ 瞬时性作用 (Transient Action):TLS 聚合酶通常只在损伤部位发挥作用,一旦绕过损伤,就会被高保真性 DNA 聚合酶替换,恢复正常的 DNA 复制。
② TLS 聚合酶的类型 (Types of TLS Polymerases)
真核生物细胞中存在多种 TLS 聚合酶,属于 Y 家族 DNA 聚合酶 (Y-family DNA Polymerases),包括:
▮▮▮▮ⓐ DNA 聚合酶 η (Pol η):主要负责绕过 胸腺嘧啶二聚体 (Thymine Dimers)。Pol η 能够以胸腺嘧啶二聚体为模板,优先插入腺嘌呤 (adenine),大部分情况下能够正确复制胸腺嘧啶二聚体,是一种相对 无错 TLS 聚合酶 (Error-Free TLS Polymerase)。着色性干皮病变异型 (Xeroderma Pigmentosum variant, XP-V) 患者 Pol η 基因突变,对紫外线敏感,容易发生皮肤癌。
▮▮▮▮ⓑ DNA 聚合酶 ι (Pol ι):主要负责绕过 鸟嘌呤加合物 (Guanine Adducts),如 苯并[a]芘-鸟嘌呤加合物 (Benzo[a]pyrene-guanine adducts)。Pol ι 在绕过鸟嘌呤加合物时,容易引入错误,是一种 易错 TLS 聚合酶 (Error-Prone TLS Polymerase)。
▮▮▮▮ⓒ DNA 聚合酶 κ (Pol κ):能够绕过多种类型的 DNA 损伤,包括 顺铂加合物 (Cisplatin Adducts) 和 AP 位点 (AP Sites)。Pol κ 也是一种易错 TLS 聚合酶。
▮▮▮▮ⓓ Rev1 蛋白 (Rev1 protein):Rev1 蛋白是一种 脱氧胞苷转移酶 (Deoxycytidyl Transferase),能够在损伤部位插入胞嘧啶 (cytosine)。Rev1 蛋白本身没有 DNA 聚合酶活性,但可以作为 支架蛋白 (Scaffold Protein),招募其他 TLS 聚合酶,参与 TLS 过程。
▮▮▮▮ⓔ DNA 聚合酶 ζ (Pol ζ):Pol ζ 是一个异二聚体复合物,由 Rev3 和 Rev7 亚基组成,具有延伸 DNA 链的能力,可以延伸 TLS 聚合酶起始的 DNA 合成。Pol ζ 也是一种易错 TLS 聚合酶。
③ TLS 途径的调控 (Regulation of TLS Pathway)
TLS 途径的激活受到严格调控,只有在 DNA 损伤严重,正常的修复途径无法有效修复时,才会启动 TLS 途径。TLS 途径的调控主要通过 复制叉停滞 (Replication Fork Stalling) 和 泛素化修饰 (Ubiquitination Modification) 等机制实现。
▮▮▮▮ⓐ 复制叉停滞信号 (Replication Fork Stalling Signal):当复制叉遇到 DNA 损伤时,复制进程受阻,产生复制叉停滞信号,激活 ATR-Chk1 信号通路 (ATR-Chk1 signaling pathway)。ATR-Chk1 信号通路激活后,可以磷酸化多种 DNA 修复和复制相关蛋白,包括 PCNA (增殖细胞核抗原, Proliferating Cell Nuclear Antigen)。
▮▮▮▮ⓑ PCNA 泛素化修饰 (PCNA Ubiquitination):PCNA 是 DNA 聚合酶 δ 的滑动夹,在 DNA 复制和修复中发挥重要作用。复制叉停滞信号激活后,Rad6-Rad18 泛素连接酶 (Rad6-Rad18 ubiquitin ligase) 催化 PCNA 的 单泛素化修饰 (Mono-ubiquitination)。单泛素化的 PCNA 可以作为 “分子开关 (Molecular Switch)”,促进复制叉从高保真性 DNA 复制模式转换为 TLS 模式,招募 TLS 聚合酶到复制叉,启动 TLS 过程。
▮▮▮▮ⓒ 聚合酶转换 (Polymerase Switching):TLS 聚合酶被招募到复制叉后,替换高保真性 DNA 聚合酶,绕过损伤部位,继续进行 DNA 合成。一旦绕过损伤,TLS 聚合酶会被替换回高保真性 DNA 聚合酶,恢复正常的 DNA 复制。
\[ \text{复制叉停滞} \xrightarrow{} \text{PCNA 泛素化} \xrightarrow{} \text{TLS 聚合酶招募} \xrightarrow{} \text{跨损伤合成} \]
TLS 途径是一种最后的防线,保证在 DNA 损伤严重的情况下,DNA 复制能够继续进行,维持细胞的存活。但 TLS 的易错性也可能导致突变的产生,增加基因组不稳定的风险。细胞需要在基因组稳定性和细胞存活之间取得平衡。
3.3 DNA 重组 (DNA Recombination)
摘要
深入探讨 同源重组 (Homologous Recombination) 和 位点特异性重组 (Site-Specific Recombination) 的分子机制,以及重组在 基因组多样性 (Genome Diversity)、DNA 修复 (DNA Repair) 和 基因工程 (Genetic Engineering) 中的作用。
3.3.1 同源重组 (Homologous Recombination, HR)
同源重组 (Homologous Recombination, HR) 是指两条 DNA 分子之间,在同源序列区域发生的 DNA 片段交换的过程。HR 在基因组多样性产生、DNA 修复、染色体分离等生物学过程中发挥重要作用。HR 的分子机制主要通过 双链断裂修复模型 (Double-Strand Break Repair Model, DSBR Model) 和 合成依赖性链退火模型 (Synthesis-Dependent Strand Annealing Model, SDSA Model) 来解释。
① 双链断裂修复模型 (DSBR Model)
DSBR 模型是经典的 HR 模型,主要用于解释 交叉重组 (Crossover Recombination) 的发生机制。DSBR 模型主要步骤包括:
▮▮▮▮ⓐ DSB 的产生 (DSB Formation):HR 通常起始于 双链断裂 (Double-Strand Break, DSB) 的产生。DSB 可以由电离辐射、化学药物、复制叉塌陷等因素引起。
▮▮▮▮ⓑ 末端切除 (End Resection):DSB 末端被 末端切除酶 (End Resection Enzymes) 切除,产生 3' 单链突出端。
▮▮▮▮ⓒ 链侵入 (Strand Invasion):3' 单链突出端侵入同源双链 DNA 模板,寻找同源序列,形成 D-环 (Displacement Loop, D-loop) 结构。Rad51 蛋白 在链侵入过程中发挥关键作用。
▮▮▮▮ⓓ DNA 合成 (DNA Synthesis):以同源 DNA 模板为指导,DNA 聚合酶 (DNA Polymerase) 利用侵入的 3' 单链 DNA 作为引物,沿着同源模板合成 DNA,延伸 D-环。
▮▮▮▮ⓔ Holliday 结构形成 (Holliday Junction Formation):DNA 合成延伸后,D-环退火,与另一条 DSB 末端单链 DNA 配对,形成 双 Holliday 结构 (Double Holliday Junction, dHJ)。dHJ 包含两个 Holliday 结构。
▮▮▮▮ⓕ Holliday 结构解离 (Holliday Junction Resolution):Holliday 结构解离酶 (Holliday Junction Resolvase) 切断 dHJ,将 dHJ 解离为两个独立的 DNA 分子。dHJ 的解离可以导致 交叉 (Crossover) 或 非交叉 (Non-crossover) 重组。如果两个 Holliday 结构以不同的方式解离,就会发生交叉重组,导致染色体之间发生遗传物质交换。
\[ \text{DSB} \xrightarrow{\text{末端切除}} \text{3' 单链突出端} \xrightarrow{\text{链侵入}} \text{D-环} \xrightarrow{\text{DNA 合成}} \text{dHJ} \xrightarrow{\text{Holliday 结构解离}} \text{重组产物} \]
② 合成依赖性链退火模型 (SDSA Model)
SDSA 模型是另一种 HR 模型,主要用于解释 非交叉重组 (Non-crossover Recombination) 的发生机制。SDSA 模型与 DSBR 模型的前几个步骤相似,但在 Holliday 结构形成和解离步骤有所不同。SDSA 模型主要步骤包括:
▮▮▮▮ⓐ DSB 的产生和末端切除 (DSB Formation and End Resection):与 DSBR 模型相同。
▮▮▮▮ⓑ 链侵入和 DNA 合成 (Strand Invasion and DNA Synthesis):与 DSBR 模型相同。
▮▮▮▮ⓒ 链退火 (Strand Annealing):新合成的 DNA 链从同源模板上退火下来,与 DSB 的另一端单链 DNA 退火配对。
▮▮▮▮ⓓ DNA 连接 (DNA Ligation):DNA 连接酶 (DNA Ligase) 连接 DNA 链的缺口,完成 DNA 修复。SDSA 模型不形成 Holliday 结构,因此只产生非交叉重组产物。
\[ \text{DSB} \xrightarrow{\text{末端切除}} \text{3' 单链突出端} \xrightarrow{\text{链侵入}} \text{D-环} \xrightarrow{\text{DNA 合成}} \xrightarrow{\text{链退火}} \xrightarrow{\text{DNA 连接}} \text{非交叉重组产物} \]
③ Holliday 结构 (Holliday Junction)
Holliday 结构 (Holliday Junction) 是 HR 过程中的一个关键中间体,是一个四路 DNA 连接点,由两条 DNA 链交叉形成。Holliday 结构具有以下特点:
▮▮▮▮ⓐ 异构化 (Isomerization):Holliday 结构可以发生 异构化 (Isomerization),即 Holliday 结构的构象发生改变,但 DNA 链的连接方式不变。Holliday 结构存在两种主要的异构体,称为 共平面异构体 (Co-planar Isomers)。
▮▮▮▮ⓑ 分支迁移 (Branch Migration):Holliday 结构可以发生 分支迁移 (Branch Migration),即交叉点沿着 DNA 分子移动,扩大同源序列交换的范围。分支迁移是由 RuvAB 复合物 (RuvAB complex) 等 分支迁移酶 (Branch Migration Enzymes) 介导的。
▮▮▮▮ⓒ 解离 (Resolution):Holliday 结构需要被 Holliday 结构解离酶 (Holliday Junction Resolvase) 解离,才能产生最终的重组产物。Holliday 结构解离酶切断 Holliday 结构的交叉点,将 Holliday 结构解离为两个独立的 DNA 分子。RuvC 解离酶 (RuvC resolvase) 是 大肠杆菌 (E. coli) 中主要的 Holliday 结构解离酶。真核生物中,GEN1 解离酶 (GEN1 resolvase)、MUS81-EME1 复合物 (MUS81-EME1 complex) 等也具有 Holliday 结构解离活性。
④ 基因转换 (Gene Conversion)
基因转换 (Gene Conversion) 是一种非互反的 HR 事件,指在 HR 过程中,一条 DNA 序列的信息被复制到另一条同源 DNA 序列上,导致一条序列被“转换”为另一条序列。基因转换可以发生在 杂合双链 DNA (Heteroduplex DNA) 修复过程中。杂合双链 DNA 是指在 HR 过程中形成的,两条 DNA 链来自不同来源,可能存在碱基错配的 DNA 双螺旋。错配修复系统 (Mismatch Repair System, MMR) 可以识别并修复杂合双链 DNA 中的碱基错配。在 MMR 修复过程中,可能发生基因转换,导致一条序列被转换为另一条序列。基因转换在基因组进化和基因组多样性产生中发挥重要作用。
3.3.2 位点特异性重组 (Site-Specific Recombination, SSR)
位点特异性重组 (Site-Specific Recombination, SSR) 是一种发生在特定 DNA 序列位点的重组过程,由 位点特异性重组酶 (Site-Specific Recombinases, SSR Recombinases) 介导。SSR 与 HR 的主要区别在于,SSR 不需要长的同源序列,只需要短的、特定的重组位点序列。SSR 在基因组重排、基因表达调控、基因工程等领域具有广泛应用。SSR 主要分为 保守型位点特异性重组 (Conservative Site-Specific Recombination, CSSR) 和 转座重组 (Transpositional Recombination) 两种类型。
① 保守型位点特异性重组 (CSSR)
CSSR 是一种精确的 DNA 片段交换过程,重组位点序列在重组前后保持不变。CSSR 主要由 酪氨酸重组酶家族 (Tyrosine Recombinase Family) 和 丝氨酸重组酶家族 (Serine Recombinase Family) 两大家族重组酶介导。
▮▮▮▮ⓐ 酪氨酸重组酶家族 (Tyrosine Recombinase Family):酪氨酸重组酶利用 酪氨酸残基 (Tyrosine Residue) 的羟基作为催化基团,介导 DNA 链的切断和连接。典型的酪氨酸重组酶包括:
▮▮▮▮▮▮▮▮❷ λ 整合酶 (λ Integrase):噬菌体 λ 整合酶介导噬菌体 λ DNA 整合到 大肠杆菌 (E. coli) 染色体上的过程。λ 整合酶识别噬菌体 DNA 上的 attP 位点 (Attachment site Phage) 和细菌染色体上的 attB 位点 (Attachment site Bacteria),介导 attP 和 attB 位点之间的重组,将噬菌体 DNA 整合到细菌染色体上。
▮▮▮▮▮▮▮▮❸ Cre 重组酶 (Cre Recombinase):Cre 重组酶来自 P1 噬菌体 (P1 Bacteriophage),识别 loxP 位点 (Locus of Crossover P1)。loxP 位点是一个 34bp 的序列,包含两个 13bp 的反向重复序列和一个 8bp 的间隔区。Cre 重组酶介导两个 loxP 位点之间的重组,可以实现 DNA 片段的切除 (Deletion)、插入 (Insertion)、倒位 (Inversion) 等多种重组形式,取决于 loxP 位点的相对位置和方向。Cre-loxP 系统 (Cre-loxP System) 是基因工程中常用的基因操作工具。
▮▮▮▮ⓑ 丝氨酸重组酶家族 (Serine Recombinase Family):丝氨酸重组酶利用 丝氨酸残基 (Serine Residue) 的羟基作为催化基团,介导 DNA 链的切断和连接。典型的丝氨酸重组酶包括:
▮▮▮▮▮▮▮▮❷ γδ 解离酶 (γδ Resolvase):γδ 解离酶来自 转座子 γδ (Transposon γδ),介导转座子 γδ 的解离。
▮▮▮▮▮▮▮▮❸ Flp 重组酶 (Flp Recombinase):Flp 重组酶来自 酿酒酵母 (Saccharomyces cerevisiae) 的 2μm 质粒 (2μm plasmid),识别 FRT 位点 (Flp Recombination Target)。FRT 位点是一个 34bp 的序列,包含两个 13bp 的反向重复序列和一个 8bp 的间隔区。Flp 重组酶介导两个 FRT 位点之间的重组,功能类似于 Cre 重组酶。Flp-FRT 系统 (Flp-FRT System) 也是基因工程中常用的基因操作工具。
② 转座作用 (Transposition)
转座作用 (Transposition) 是一种特殊的 SSR,指 转座子 (Transposons) 在基因组中移动位置的过程。转座子也称为 “跳跃基因 (Jumping Genes)”,是一类能够自主复制和插入到基因组不同位置的 DNA 序列。转座作用可以导致基因突变、基因组重排和基因表达调控。转座作用主要分为 DNA 转座子 (DNA Transposons) 和 逆转录转座子 (Retrotransposons) 两种类型。
▮▮▮▮ⓐ DNA 转座子 (DNA Transposons):DNA 转座子以 DNA 为中间体进行转座,转座机制主要包括 切除-插入转座 (Cut-and-Paste Transposition) 和 复制型转座 (Replicative Transposition)。
▮▮▮▮▮▮▮▮❷ 切除-插入转座 (Cut-and-Paste Transposition):转座子从基因组的一个位置切除下来,然后插入到基因组的另一个位置。转座酶 (Transposase) 介导切除和插入过程。Tn5 转座子 (Tn5 transposon)、Ac/Ds 转座子系统 (Ac/Ds transposon system) 等属于切除-插入型 DNA 转座子。
▮▮▮▮▮▮▮▮❸ 复制型转座 (Replicative Transposition):转座子在基因组中的原始位置保留不变,同时复制出一个新的转座子拷贝,插入到基因组的另一个位置。Tn3 转座子 (Tn3 transposon) 等属于复制型 DNA 转座子。
▮▮▮▮ⓑ 逆转录转座子 (Retrotransposons):逆转录转座子以 RNA 为中间体进行转座,转座机制类似于 逆转录病毒 (Retroviruses) 的复制周期。逆转录转座子首先转录成 RNA,然后通过 逆转录酶 (Reverse Transcriptase) 将 RNA 逆转录成 cDNA,cDNA 插入到基因组的新位置。逆转录转座子主要分为 长末端重复序列逆转录转座子 (Long Terminal Repeat Retrotransposons, LTR Retrotransposons) 和 非长末端重复序列逆转录转座子 (Non-LTR Retrotransposons)。
▮▮▮▮▮▮▮▮❷ LTR 逆转录转座子 (LTR Retrotransposons):LTR 逆转录转座子结构类似于逆转录病毒,两端具有 长末端重复序列 (Long Terminal Repeats, LTRs),编码 逆转录酶 (Reverse Transcriptase)、整合酶 (Integrase) 等蛋白。Ty 转座子 (Ty transposons) (酵母)、Copia 转座子 (Copia transposons) (果蝇)、ERV (内源性逆转录病毒, Endogenous Retroviruses) (哺乳动物) 等属于 LTR 逆转录转座子。
▮▮▮▮▮▮▮▮❸ 非LTR 逆转录转座子 (Non-LTR Retrotransposons):非LTR 逆转录转座子缺乏 LTR 结构,但编码 核酸内切酶 (Endonuclease) 和 逆转录酶 (Reverse Transcriptase)。LINEs (长散在核元件, Long Interspersed Nuclear Elements) 和 SINEs (短散在核元件, Short Interspersed Nuclear Elements) 是哺乳动物基因组中主要的非LTR 逆转录转座子。Alu 元件 (Alu elements) 是人类基因组中最丰富的 SINEs。
3.3.3 重组的应用 (Applications of Recombination)
DNA 重组在生物学和生物技术领域具有广泛的应用价值。
① 基因组多样性产生 (Generation of Genome Diversity)
▮▮▮▮ⓐ 减数分裂重组 (Meiotic Recombination):在 减数分裂 (Meiosis) 过程中,同源染色体 (Homologous Chromosomes) 之间发生 HR,导致 遗传重组 (Genetic Recombination),产生 重组型染色体 (Recombinant Chromosomes)。减数分裂重组是 有性生殖 (Sexual Reproduction) 产生遗传多样性的重要机制,增加后代的遗传变异,有利于物种的进化和适应。
▮▮▮▮ⓑ 免疫球蛋白基因重排 (Immunoglobulin Gene Rearrangement):在 B 细胞 (B cells) 和 T 细胞 (T cells) 发育过程中,免疫球蛋白 (Immunoglobulin, Ig) 基因和 T 细胞受体 (T Cell Receptor, TCR) 基因发生 V(D)J 重组 (V(D)J Recombination),是一种特殊的 SSR。V(D)J 重组将 V (Variable)、D (Diversity)、J (Joining) 基因片段随机组合,产生大量的 Ig 和 TCR 基因变异,形成多样性的 抗体 (Antibodies) 和 TCR,增强免疫系统的识别能力。
② DNA 修复 (DNA Repair)
▮▮▮▮ⓐ 同源重组修复 (HRR):HRR 是修复 双链断裂 (DSB) 的主要途径之一,利用同源染色体或姐妹染色单体作为模板,精确修复 DSB,避免遗传信息的丢失和突变的产生。
▮▮▮▮ⓑ 重组修复复制叉塌陷 (Recombination Repair of Replication Fork Collapse):当复制叉遇到 DNA 损伤或复制受阻时,可能发生 复制叉塌陷 (Replication Fork Collapse),形成 DSB。HR 可以修复复制叉塌陷引起的 DSB,维持基因组的完整性。
③ 基因工程和生物技术 (Genetic Engineering and Biotechnology)
▮▮▮▮ⓐ 基因敲除和基因敲入 (Gene Knockout and Gene Knock-in):Cre-loxP 系统 (Cre-loxP System) 和 Flp-FRT 系统 (Flp-FRT System) 等 SSR 技术可以用于 基因敲除 (Gene Knockout) 和 基因敲入 (Gene Knock-in)。利用 Cre 重组酶或 Flp 重组酶介导 loxP 位点或 FRT 位点之间的重组,可以精确地删除或插入特定的 DNA 片段,实现基因的定点修饰。基因敲除和基因敲入技术广泛应用于基因功能研究、疾病模型构建、基因治疗等领域。
▮▮▮▮ⓑ 转基因生物 (Transgenic Organisms):转座子可以作为 基因载体 (Gene Vectors),用于构建 转基因生物 (Transgenic Organisms)。将外源基因插入到转座子中,然后利用转座酶介导转座子插入到宿主基因组,实现外源基因的稳定表达。转基因技术广泛应用于农业、医药、工业等领域。
▮▮▮▮ⓒ 染色体工程 (Chromosome Engineering):SSR 技术可以用于 染色体工程 (Chromosome Engineering),构建人工染色体、染色体易位、染色体缺失等染色体结构变异,研究染色体结构与功能的关系,以及染色体工程在生物技术中的应用。
DNA 重组是生命活动中不可或缺的重要过程,在基因组多样性、基因组稳定性、基因工程等领域发挥着关键作用。深入理解 DNA 重组的分子机制和生物学意义,对于生命科学研究和生物技术发展具有重要意义。
4. 基因的转录与 RNA 加工 (Gene Transcription and RNA Processing)
本章深入讲解基因转录的详细过程,包括不同 RNA 聚合酶的功能、转录调控机制,以及 RNA 的各种加工方式,如剪接 (splicing)、加帽 (capping) 和加尾 (polyadenylation) 等。转录是将 DNA 上的遗传信息复制到 RNA 分子的关键步骤,而 RNA 加工则确保了 RNA 分子的成熟和功能性,为后续的基因表达奠定基础。理解转录和 RNA 加工的分子机制对于全面认识基因表达调控至关重要。
4.1 转录的分子机制 (Molecular Mechanisms of Transcription)
本节将详细解析转录的起始、延伸和终止过程,以及参与转录的关键酶类和蛋白因子,并比较原核生物和真核生物转录的异同。转录是一个高度复杂且精确的过程,它受到多种因素的调控,以确保基因在正确的时间和地点以正确的水平表达。
4.1.1 RNA 聚合酶 (RNA Polymerases)
RNA 聚合酶 (RNA polymerase, RNAP) 是催化转录过程的核心酶,它以 DNA 为模板,合成 RNA 分子。不同生物体和不同类型的基因使用不同类型的 RNA 聚合酶。
① 原核生物 RNA 聚合酶 (Prokaryotic RNA Polymerase)
原核生物,如细菌,通常只含有一种 RNA 聚合酶,负责合成所有类型的 RNA,包括 mRNA (信使 RNA)、rRNA (核糖体 RNA) 和 tRNA (转运 RNA)。
▮ 结构 (Structure):
原核生物 RNA 聚合酶是一个多亚基复合物,核心酶 (core enzyme) 由五个亚基组成:
▮▮▮▮ⓐ α 亚基 (α subunit):两个 α 亚基 (α₂, 分别为 α¹ 和 α²) 参与酶的组装、与调控蛋白的相互作用以及酶的组装。
▮▮▮▮ⓑ β 亚基 (β subunit):含有核苷三磷酸 (nucleoside triphosphate, NTP) 结合位点,参与 RNA 链的延伸。
▮▮▮▮ⓒ β' 亚基 (β' subunit):参与 DNA 模板的结合。
▮▮▮▮ⓓ σ 因子 (σ factor):并非核心酶的组成部分,但对转录起始至关重要。σ 因子负责识别启动子 (promoter) 区域,指导 RNA 聚合酶结合到 DNA 的特定位点。不同的 σ 因子可以识别不同的启动子序列,从而调控不同基因的转录。常见的 大肠杆菌 (E. coli) σ⁷⁰ 因子识别大多数基因的启动子。[ref]
▮▮▮▮ⓔ ω 亚基 (ω subunit):参与酶的正确组装和稳定,但不是催化活性所必需的。
▮ 功能 (Function):
核心酶本身可以催化 RNA 链的延伸,但不能有效起始转录,也不能特异性地识别启动子。σ 因子与核心酶结合形成全酶 (holoenzyme),全酶能够识别启动子并启动转录。转录起始后,σ 因子通常会从全酶上解离,核心酶继续进行 RNA 链的延伸和终止。[ref]
② 真核生物 RNA 聚合酶 (Eukaryotic RNA Polymerases)
真核生物细胞核内存在三种主要的 RNA 聚合酶,它们结构复杂,功能也更加专一,分别负责转录不同类型的基因:
▮ RNA 聚合酶 I (RNA Polymerase I, Pol I):
▮▮▮▮ⓐ 位置 (Location):主要位于核仁 (nucleolus)。
▮▮▮▮ⓑ 功能 (Function):专门负责转录 rRNA 基因,生成 45S rRNA 前体,后者经过加工成熟为 18S rRNA、5.8S rRNA 和 28S rRNA,是核糖体的重要组成部分。
▮▮▮▮ⓒ α-鹅膏蕈碱敏感性 (α-amanitin sensitivity):对 α-鹅膏蕈碱 (α-amanitin) 不敏感。α-鹅膏蕈碱是一种剧毒的环状肽,可以抑制 RNA 聚合酶的活性。
▮ RNA 聚合酶 II (RNA Polymerase II, Pol II):
▮▮▮▮ⓐ 位置 (Location):位于核质 (nucleoplasm)。
▮▮▮▮ⓑ 功能 (Function):转录 mRNA 前体 (pre-mRNA) 和 snRNA (小核 RNA) 基因。mRNA 编码蛋白质,snRNA 参与 RNA 剪接等过程。RNA 聚合酶 II 是真核生物细胞中转录活动最广泛、调控最复杂的一种 RNA 聚合酶。
▮▮▮▮ⓒ α-鹅膏蕈碱敏感性 (α-amanitin sensitivity):对 α-鹅膏蕈碱高度敏感,在极低浓度下即被抑制。
▮ RNA 聚合酶 III (RNA Polymerase III, Pol III):
▮▮▮▮ⓐ 位置 (Location):位于核质。
▮▮▮▮ⓑ 功能 (Function):转录 tRNA 基因、5S rRNA 基因以及其他一些小 RNA 基因,如 7SL RNA (信号识别粒子,SRP 的 RNA 组件) 和 U6 snRNA (剪接体组件)。tRNA 参与蛋白质翻译,5S rRNA 是核糖体 rRNA 的一种。
▮▮▮▮ⓒ α-鹅膏蕈碱敏感性 (α-amanitin sensitivity):对 α-鹅膏蕈碱在中等浓度下敏感。
真核生物 RNA 聚合酶的结构比原核生物 RNA 聚合酶更为复杂,它们由更多的亚基组成,并且需要多种辅助蛋白,即通用转录因子 (general transcription factors, GTFs),才能在启动子区域正确起始转录。每种 RNA 聚合酶都有其特定的启动子识别机制和调控方式。[ref]
4.1.2 转录的起始 (Transcription Initiation)
转录起始是 RNA 合成的第一步,包括 RNA 聚合酶识别并结合到 DNA 模板的启动子区域,解开 DNA 双螺旋形成转录起始复合物,以及开始 RNA 链的合成。
① 启动子 (Promoter)
启动子是 DNA 序列上 RNA 聚合酶结合和启动转录的区域。启动子序列决定了转录起始的位置和方向,也影响基因转录的效率。
▮ 原核生物启动子 (Prokaryotic Promoters):
典型的原核生物启动子包含两个保守序列元件,位于转录起始位点上游:
▮▮▮▮ⓐ -10 区 ( -10 box ):也称为 Pribnow box,保守序列为 TATAAT,位于转录起始位点上游约 10 个碱基对处。-10 区是 DNA 双螺旋首先解开的区域,富含 AT 碱基对,易于解链。
▮▮▮▮ⓑ -35 区 ( -35 box ):保守序列为 TTGACA,位于转录起始位点上游约 35 个碱基对处。-35 区是 σ 因子识别和结合的主要位点。
▮ 真核生物启动子 (Eukaryotic Promoters):
真核生物启动子结构多样,不同类型的 RNA 聚合酶识别不同的启动子区域。RNA 聚合酶 II 启动子是最复杂和研究最深入的。常见的 RNA 聚合酶 II 启动子元件包括:
▮▮▮▮ⓐ TATA 盒 (TATA box):保守序列为 TATAAA,类似于原核生物的 -10 区,位于转录起始位点上游约 25-30 个碱基对处。TATA 盒是 TATA 结合蛋白 (TATA-binding protein, TBP) 识别和结合的位点,TBP 是通用转录因子 TFIID 的一个亚基。
▮▮▮▮ⓑ 起始子元件 (Initiator element, Inr):位于转录起始位点周围,序列组成相对多样,通常富含嘧啶碱基。Inr 可以独立启动转录,也可以与 TATA 盒协同作用。
▮▮▮▮ⓒ CpG 岛 (CpG islands):富含 CpG 二核苷酸的区域,通常位于管家基因 (housekeeping genes) 和发育调控基因的启动子区域。CpG 岛的胞嘧啶 (cytosine) 可以发生甲基化修饰,影响基因的转录活性。未甲基化的 CpG 岛通常与基因的活性转录相关。
▮▮▮▮ⓓ 上游调控序列 (Upstream regulatory sequences):位于核心启动子 (core promoter, 包括 TATA 盒和 Inr) 上游的序列,包含多种顺式作用元件 (cis-acting elements),如 GC 盒、CAAT 盒等,是转录因子结合的位点,参与基因表达的调控。
② 转录起始复合物 (Transcription Initiation Complex)
转录起始需要 RNA 聚合酶和多种辅助蛋白因子的协同作用,形成转录起始复合物,才能在启动子区域正确起始 RNA 合成。
▮ 原核生物转录起始复合物 (Prokaryotic Transcription Initiation Complex):
转录起始主要依赖于 σ 因子。σ 因子与核心酶结合形成全酶后,全酶通过 σ 因子识别启动子 -35 区和 -10 区序列,结合到启动子区域。结合后,RNA 聚合酶解开 -10 区附近的 DNA 双螺旋,形成开放复合物 (open complex)。开放复合物形成后,RNA 聚合酶开始以 DNA 为模板,NTP 为原料,合成 RNA 链。最初合成的几个核苷酸通常较短且不稳定,称为起始 RNA (abortive transcripts)。当 RNA 链达到一定长度 (约 10 个核苷酸) 后,转录进入延伸阶段,σ 因子通常会解离,核心酶继续进行转录。[ref]
▮ 真核生物转录起始复合物 (Eukaryotic Transcription Initiation Complex):
真核生物 RNA 聚合酶 II 的转录起始过程更为复杂,需要多种通用转录因子 (GTFs) 的参与,在启动子区域逐步组装形成转录前起始复合物 (preinitiation complex, PIC)。主要的 GTFs 包括:
▮▮▮▮ⓐ TFIID (Transcription Factor II D):由 TATA 结合蛋白 (TBP) 和 TBP 相关因子 (TBP-associated factors, TAFs) 组成。TFIID 是第一个结合到启动子的 GTF,TBP 亚基识别并结合 TATA 盒,或者通过 TAFs 识别其他启动子元件,启动 PIC 的组装。
▮▮▮▮ⓑ TFIIB (Transcription Factor II B):结合到 TFIID 结合的 DNA 和 RNA 聚合酶 II,稳定 PIC,并参与转录起始位点的选择。
▮▮▮▮ⓒ TFIIF (Transcription Factor II F):与 RNA 聚合酶 II 结合,引导 RNA 聚合酶 II 正确结合到 PIC,并参与转录延伸的早期阶段。
▮▮▮▮ⓓ TFIIE (Transcription Factor II E):参与募集 TFIIH 到 PIC,并调控 TFIIH 的活性。
▮▮▮▮ⓔ TFIIH (Transcription Factor II H):具有多种酶活性,包括 ATP 依赖的 DNA 解旋酶活性,可以解开启动子区域的 DNA 双螺旋,形成转录泡 (transcription bubble),以及激酶活性,可以磷酸化 RNA 聚合酶 II 的 C 端结构域 (C-terminal domain, CTD),启动转录起始和延伸转换 (promoter clearance)。
⚝ Mediator 复合物 (Mediator complex):是一个巨大的多亚基复合物,作为转录激活因子和 RNA 聚合酶 II 之间的桥梁,传递激活信号,调控转录起始。
PIC 的组装是一个有序的过程,通常按照 TFIID → TFIIB → RNA 聚合酶 II/TFIIF → TFIIE → TFIIH 的顺序逐步组装到启动子区域。PIC 组装完成后,TFIIH 的解旋酶活性解开 DNA 双螺旋,形成转录泡,RNA 聚合酶 II 开始转录 RNA 链。RNA 聚合酶 II 的 CTD 磷酸化是转录起始向延伸转换的关键步骤。[ref]
③ 转录起始的调控机制 (Regulation of Transcription Initiation)
转录起始是基因表达调控的主要环节。多种调控机制参与转录起始的调控,包括激活因子 (activators)、抑制因子 (repressors)、染色质重塑 (chromatin remodeling) 和增强子 (enhancers)、沉默子 (silencers) 等。
▮ 激活因子和抑制因子 (Activators and Repressors):
转录因子 (transcription factors, TFs) 是调控基因转录的关键蛋白。激活因子结合到 DNA 上的特定序列 (如增强子) 后,可以增强转录起始,促进基因表达。抑制因子结合到 DNA 上的特定序列 (如沉默子) 后,可以抑制转录起始,降低基因表达。激活因子和抑制因子可以通过多种机制调控转录起始,如直接与 GTFs 或 RNA 聚合酶相互作用,影响 PIC 的组装和活性,或者通过改变染色质结构,影响启动子的可及性。
▮ 染色质重塑 (Chromatin Remodeling):
在真核生物细胞中,DNA 与组蛋白 (histones) 结合形成染色质 (chromatin)。染色质的结构状态 (开放或紧密) 显著影响基因的转录活性。染色质重塑复合物 (chromatin remodeling complexes) 利用 ATP 水解的能量,改变核小体 (nucleosome) 的位置和结构,使启动子区域的 DNA 更容易接近转录 machinery,促进转录起始。组蛋白修饰 (histone modifications),如乙酰化 (acetylation) 和甲基化 (methylation),也可以改变染色质的结构状态,调控基因转录。组蛋白乙酰化通常与基因的激活转录相关,而某些组蛋白甲基化则与基因的沉默相关。
▮ 增强子和沉默子 (Enhancers and Silencers):
增强子是 DNA 上一类顺式作用元件,可以增强基因的转录活性,通常位于启动子远端,甚至可以位于基因的下游或内含子区域。增强子结合激活因子后,通过 DNA 环化 (DNA looping) 的方式与启动子区域相互作用,促进转录起始。沉默子与增强子功能相反,结合抑制因子后,可以抑制基因的转录活性。增强子和沉默子是基因表达远程调控的重要元件,它们与启动子共同作用,精细调控基因的转录起始。[ref]
4.1.3 转录的延伸与终止 (Transcription Elongation and Termination)
转录延伸是指 RNA 聚合酶沿着 DNA 模板移动,不断合成 RNA 链的过程。转录终止是指 RNA 聚合酶在到达转录终止信号后,停止 RNA 合成,并从 DNA 模板上释放 RNA 分子的过程。
① 转录延伸 (Transcription Elongation)
转录起始后,RNA 聚合酶进入延伸阶段,沿着 DNA 模板 3'→5' 方向移动,以前导链 (template strand) 为模板,按照碱基互补配对原则,将 NTP 逐个添加到 RNA 链的 3' 端,合成 RNA 分子。
▮ RNA 聚合酶的移动 (RNA Polymerase Movement):
RNA 聚合酶在延伸过程中,需要解开 DNA 双螺旋,形成转录泡,暴露出 DNA 模板链。转录泡内包含约 17 个碱基对的单链 DNA 区段,RNA 聚合酶在转录泡内移动,同时催化 RNA 链的合成。转录泡随着 RNA 聚合酶的移动而移动,转录完成后,DNA 双螺旋在 RNA 聚合酶的后方重新形成。
▮ 校对功能 (Proofreading):
RNA 聚合酶在延伸过程中,也具有一定的校对功能,可以识别并纠正 RNA 合成过程中的错误掺入的核苷酸。RNA 聚合酶的校对功能不如 DNA 聚合酶的校对功能高效,因此 RNA 合成的错误率比 DNA 复制的错误率略高。
▮ 延伸因子 (Elongation Factors):
转录延伸过程受到多种延伸因子的调控。一些延伸因子可以促进 RNA 聚合酶的延伸效率,克服 DNA 序列中的转录障碍,如核小体阻碍。一些延伸因子可以与 RNA 加工 machinery 相互作用,协调转录和 RNA 加工过程。例如,真核生物 RNA 聚合酶 II 的 CTD 磷酸化后,可以作为支架,募集 RNA 加帽、剪接和 polyadenylation 等 RNA 加工因子,实现转录与 RNA 加工的偶联 (transcription-coupled RNA processing)。[ref]
② 转录终止 (Transcription Termination)
转录终止是 RNA 合成的最后一步,RNA 聚合酶在到达转录终止信号后,停止 RNA 合成,释放 RNA 分子,并从 DNA 模板上解离。原核生物和真核生物的转录终止机制有所不同。
▮ 原核生物转录终止 (Prokaryotic Transcription Termination):
原核生物转录终止主要有两种机制:
▮▮▮▮ⓐ ρ 依赖性终止 (Rho-dependent termination):依赖于 ρ 因子 (Rho factor) 参与。ρ 因子是一种 ATP 依赖的解旋酶,可以结合到新生 RNA 分子的特定序列 (rut 位点,rho utilization site),沿着 RNA 分子 5'→3' 方向移动,追赶 RNA 聚合酶。当 RNA 聚合酶在转录终止位点附近停顿 (pause) 时,ρ 因子追上 RNA 聚合酶,利用解旋酶活性,解开 RNA-DNA 杂合链,导致 RNA 分子和 RNA 聚合酶从 DNA 模板上释放,终止转录。
▮▮▮▮ⓑ ρ 非依赖性终止 (Rho-independent termination):也称为内源性终止 (intrinsic termination),不依赖于 ρ 因子。这类终止信号通常包含一个富含 GC 碱基对的倒状重复序列 (inverted repeat sequence),以及其后紧跟的一段富含 U 的序列。转录到 RNA 后,富含 GC 的倒状重复序列可以形成发夹结构 (hairpin structure),发夹结构的形成导致 RNA 聚合酶停顿。同时,RNA-DNA 杂合链中富含 AU 碱基对的区域稳定性较弱,容易解离,最终导致转录终止。
▮ 真核生物转录终止 (Eukaryotic Transcription Termination):
真核生物 RNA 聚合酶 II 的转录终止机制较为复杂,尚未完全阐明。一种主要的模型是 鱼雷模型 (torpedo model):
▮▮▮▮ⓐ RNA 聚合酶 II 转录超过 poly(A) 加尾信号序列后,新生 RNA 分子 3' 端被核酸外切酶 (如 Rat1 或 Xrn2) 识别并结合。
▮▮▮▮ⓑ 核酸外切酶沿着 RNA 分子 5'→3' 方向降解 RNA,像鱼雷一样追赶 RNA 聚合酶 II。
▮▮▮▮ⓒ 当核酸外切酶追上 RNA 聚合酶 II 时,导致 RNA 聚合酶 II 从 DNA 模板上解离,终止转录。
▮▮▮▮ⓓ Poly(A) 加尾信号序列 (AAUAAA) 和下游序列在转录终止过程中发挥重要作用,它们参与 RNA 分子的切割和 poly(A) 尾的添加,并可能影响核酸外切酶的活性和转录终止效率。[ref]
4.1.4 转录的调控 (Regulation of Transcription)
基因转录的调控是基因表达调控的核心环节。细胞通过精细调控基因的转录,响应内外环境的变化,维持细胞的正常功能和生命活动。转录调控涉及多种调控元件和调控因子,以及染色质结构的影响。
① 转录因子 (Transcription Factors)
转录因子 (TFs) 是一类能够结合到 DNA 特定序列,调控基因转录的蛋白质。转录因子是基因表达调控网络的核心组成部分,参与调控几乎所有细胞过程。
▮ 结构域 (Domains):
转录因子通常具有模块化的结构,包含多个功能域 (domains),主要包括:
▮▮▮▮ⓐ DNA 结合域 (DNA-binding domain, DBD):负责识别并结合 DNA 上的特定序列,如启动子、增强子等。常见的 DNA 结合域类型包括锌指结构 (zinc finger)、螺旋-转角-螺旋结构 (helix-turn-helix, HTH)、螺旋-环-螺旋结构 (helix-loop-helix, HLH)、同源异型域 (homeodomain) 等。不同类型的 DNA 结合域识别不同的 DNA 序列。
▮▮▮▮ⓑ 激活域 (Activation domain, AD):也称为转录激活结构域 (transcriptional activation domain, TAD),负责与其他蛋白因子相互作用,激活基因转录。激活域通常富含酸性氨基酸、谷氨酰胺或脯氨酸。激活域可以与通用转录因子 (GTFs)、Mediator 复合物、染色质重塑复合物等相互作用,促进 PIC 的组装和活性,或者改变染色质结构,增强转录起始。
▮▮▮▮ⓒ 抑制域 (Repression domain, RD):也称为转录抑制结构域 (transcriptional repression domain, TRD),负责抑制基因转录。抑制域可以通过多种机制抑制转录,如竞争性结合启动子,阻碍激活因子结合;与激活因子相互作用,抑制其激活功能;募集共抑制因子 (corepressors),如组蛋白去乙酰化酶 (histone deacetylases, HDACs) 和 DNA 甲基转移酶 (DNA methyltransferases, DNMTs),导致染色质结构紧密化,抑制转录。
▮▮▮▮ⓓ 配体结合域 (Ligand-binding domain, LBD):一些转录因子,如核受体 (nuclear receptors),具有配体结合域,可以结合激素、维生素等小分子配体。配体结合可以改变转录因子的构象和活性,调控基因转录。
▮ 转录因子家族 (Transcription Factor Families):
根据 DNA 结合域的类型,转录因子可以分为不同的家族,如锌指转录因子家族、HLH 转录因子家族、核受体家族等。同一家族的转录因子通常具有相似的 DNA 结合域结构,识别相似的 DNA 序列,但可能具有不同的激活域或抑制域,调控不同的靶基因。
② 顺式作用元件 (Cis-regulatory Elements)
顺式作用元件是 DNA 序列上调控基因转录的元件,位于被调控基因的附近,包括启动子、增强子、沉默子、绝缘子 (insulators) 和 Locus Control Regions (LCRs) 等。顺式作用元件是转录因子结合的位点,介导转录因子的调控作用。
▮ 增强子 (Enhancers):
增强子是 DNA 上一类顺式作用元件,可以增强基因的转录活性,通常位于启动子远端,甚至可以位于基因的下游或内含子区域。增强子可以结合多种激活因子,协同增强基因转录。增强子的作用具有位置和方向的灵活性,可以在启动子上游或下游,也可以反向作用。增强子通过 DNA 环化 (DNA looping) 的方式与启动子区域相互作用,将激活信号传递到启动子,促进转录起始。
▮ 沉默子 (Silencers):
沉默子与增强子功能相反,是 DNA 上一类顺式作用元件,可以抑制基因的转录活性。沉默子通常结合抑制因子,抑制基因转录。沉默子的作用机制与增强子类似,也可能通过 DNA 环化与启动子区域相互作用,传递抑制信号。
▮ 绝缘子 (Insulators):
绝缘子是 DNA 上一类顺式作用元件,可以阻断增强子对启动子的激活作用,或者阻止染色质高级结构的蔓延。绝缘子可以将基因组划分为独立的调控区域,防止不同基因之间的调控信号相互干扰。绝缘子通常结合 CTCF (CCCTC-binding factor) 等蛋白因子,形成染色质环,介导染色质的组织和基因表达的调控。
▮ Locus Control Regions (LCRs):
LCRs 是一类特殊的顺式作用元件,通常位于基因簇 (gene clusters) 的上游,可以调控整个基因簇的基因表达。LCRs 具有强大的增强子活性,可以开放染色质结构,促进基因簇内所有基因的转录。LCRs 在调控基因簇的组织和表达中发挥重要作用,如珠蛋白基因簇 (globin gene cluster) 的 LCR 调控珠蛋白基因在发育过程中的时序性表达。[ref]
③ 染色质结构与转录调控 (Chromatin Structure and Transcriptional Regulation)
染色质结构状态 (开放或紧密) 是基因转录调控的重要层面。开放的染色质结构 (euchromatin) 允许转录 machinery 接近 DNA,促进基因转录;紧密的染色质结构 (heterochromatin) 阻碍转录 machinery 接近 DNA,抑制基因转录。染色质结构受到多种因素的调控,包括组蛋白修饰、DNA 甲基化和染色质重塑复合物等。
▮ 常染色质与异染色质 (Euchromatin and Heterochromatin):
▮▮▮▮ⓐ 常染色质 (Euchromatin):染色质结构相对疏松,DNA 可及性高,基因转录活跃的区域。常染色质通常富含组蛋白乙酰化修饰,DNA 甲基化水平较低。
▮▮▮▮ⓑ 异染色质 (Heterochromatin):染色质结构高度紧密,DNA 可及性低,基因转录沉默的区域。异染色质通常富含组蛋白甲基化修饰 (如 H3K9me3, H3K27me3),DNA 甲基化水平较高。异染色质可以分为组成型异染色质 (constitutive heterochromatin) 和兼性异染色质 (facultative heterochromatin)。组成型异染色质在所有细胞类型中都高度紧密,包含重复序列和结构基因,如着丝粒 (centromere) 和端粒 (telomere) 区域。兼性异染色质在不同细胞类型或发育阶段可以发生结构状态的转变,参与基因表达的动态调控,如 X 染色体失活 (X-chromosome inactivation) 形成的 Barr 小体。
▮ 组蛋白修饰 (Histone Modifications):
组蛋白修饰是指组蛋白氨基酸残基发生的共价修饰,如乙酰化、甲基化、磷酸化、泛素化等。组蛋白修饰可以改变组蛋白的电荷和结构,影响核小体的组装和染色质的结构状态,从而调控基因转录。
▮▮▮▮ⓐ 组蛋白乙酰化 (Histone Acetylation):通常与基因的激活转录相关。组蛋白乙酰化酶 (histone acetyltransferases, HATs) 催化组蛋白赖氨酸残基的乙酰化,中和赖氨酸残基的正电荷,减弱组蛋白与 DNA 之间的相互作用,使染色质结构疏松化,促进转录起始。组蛋白去乙酰化酶 (histone deacetylases, HDACs) 催化组蛋白乙酰基的去除,使染色质结构紧密化,抑制转录。
▮▮▮▮ⓑ 组蛋白甲基化 (Histone Methylation):对基因转录的调控作用复杂,取决于甲基化的位点和程度。例如,组蛋白 H3 赖氨酸 4 位点三甲基化 (H3K4me3) 通常与基因的激活转录相关,而组蛋白 H3 赖氨酸 9 位点三甲基化 (H3K9me3) 和组蛋白 H3 赖氨酸 27 位点三甲基化 (H3K27me3) 通常与基因的沉默相关。组蛋白甲基转移酶 (histone methyltransferases, HMTs) 催化组蛋白甲基化,组蛋白去甲基化酶 (histone demethylases, HDMs) 催化组蛋白去甲基化。
▮ DNA 甲基化 (DNA Methylation):
在哺乳动物细胞中,DNA 甲基化主要发生在 CpG 二核苷酸的胞嘧啶残基的 5 位碳原子上,形成 5-甲基胞嘧啶 (5-methylcytosine, 5mC)。DNA 甲基化通常与基因的沉默相关。启动子区域 CpG 岛的甲基化可以抑制基因的转录起始。DNA 甲基转移酶 (DNMTs) 催化 DNA 甲基化,DNA 去甲基化酶 (DNA demethylases) 催化 DNA 去甲基化。DNA 甲基化在基因印记 (genomic imprinting)、X 染色体失活和肿瘤发生等过程中发挥重要作用。
▮ 染色质重塑复合物 (Chromatin Remodeling Complexes):
染色质重塑复合物是一类 ATP 依赖的酶复合物,可以利用 ATP 水解的能量,改变核小体的位置和结构,使 DNA 更容易接近转录 machinery。染色质重塑复合物可以滑动 (slide)、弹出 (eject) 或替换 (replace) 核小体,改变染色质的结构状态,调控基因转录。常见的染色质重塑复合物家族包括 SWI/SNF 家族、ISWI 家族、NuRD/Mi-2/CHD 家族和 INO80 家族等。不同家族的染色质重塑复合物具有不同的结构和功能,参与不同的转录调控过程。[ref]
4.2 RNA 的加工与修饰 (RNA Processing and Modification)
本节将详细介绍 mRNA、rRNA 和 tRNA 的加工过程,包括 RNA 剪接 (splicing)、RNA 编辑 (editing)、RNA 加帽 (capping)、RNA 加尾 (polyadenylation) 等。RNA 加工是 RNA 分子从转录产物 (初级转录本,primary transcript) 成熟为功能性 RNA 分子的必要步骤。RNA 加工过程确保了 RNA 分子的稳定性、翻译效率和正确的功能。
4.2.1 mRNA 的加工 (mRNA Processing)
mRNA 是携带遗传信息,指导蛋白质合成的 RNA 分子。真核生物 mRNA 前体 (pre-mRNA) 需要经过一系列加工步骤,才能成为成熟的 mRNA,包括 RNA 剪接、5' 端加帽和 3' 端加 poly(A) 尾。
① RNA 剪接 (RNA Splicing)
真核生物基因的编码区通常被不编码蛋白质的内含子 (introns) 分隔,编码蛋白质的外显子 (exons) 被内含子间隔开。RNA 剪接是指从 pre-mRNA 分子中精确切除内含子,并将外显子连接起来,形成连续编码序列的过程。
▮ 剪接体 (Spliceosome):
RNA 剪接主要由剪接体 (spliceosome) 催化完成。剪接体是一个巨大的 RNA-蛋白质复合物,由约 150 种蛋白质和 5 种 snRNA (U1, U2, U4, U5, U6 snRNA) 组成。snRNA 与蛋白质结合形成 snRNP (small nuclear ribonucleoprotein particles),snRNP 是剪接体的核心组分。
▮ 剪接位点 (Splice Sites):
RNA 剪接需要识别 pre-mRNA 分子上的剪接位点,包括:
▮▮▮▮ⓐ 5' 剪接位点 (5' splice site, 5'SS):位于外显子-内含子边界的 5' 端,保守序列为 GU。
▮▮▮▮ⓑ 3' 剪接位点 (3' splice site, 3'SS):位于内含子-外显子边界的 3' 端,保守序列为 AG。
▮▮▮▮ⓒ 分支点 (Branch point):位于内含子内部,靠近 3' 剪接位点上游,保守序列为 A。
▮ 剪接机制 (Splicing Mechanism):
RNA 剪接是一个两步转酯反应 (two-step transesterification reaction) 过程:
▮▮▮▮ⓐ 第一步转酯反应:U1 snRNP 和 U2 snRNP 分别识别 5' 剪接位点和分支点。U2 snRNP 结合分支点腺嘌呤 (adenine, A) 核苷酸,使分支点 A 的 2'-OH 基团活化。活化的 2'-OH 基团攻击 5' 剪接位点的磷酸二酯键,切断 5' 外显子与内含子之间的连接,同时 5' 内含子的 G 与分支点 A 的 2'-OH 基团形成 2'-5' 磷酸二酯键,形成套索结构 (lariat structure)。
▮▮▮▮ⓑ 第二步转酯反应:5' 外显子 3'-OH 基团攻击 3' 剪接位点的磷酸二酯键,切断 3' 外显子与内含子之间的连接,同时将 5' 外显子和 3' 外显子连接起来,形成剪接后的 mRNA 分子,并释放套索结构的内含子。
▮ 可变剪接 (Alternative Splicing):
可变剪接是指同一个 pre-mRNA 可以通过不同的剪接方式,产生多种不同的 mRNA 异构体 (isoforms) 的现象。可变剪接是真核生物基因表达多样性的重要来源。可变剪接主要有以下几种类型:
▮▮▮▮ⓐ 外显子跳跃 (Exon skipping):某个外显子被跳过,不包含在成熟 mRNA 中。
▮▮▮▮ⓑ 内含子保留 (Intron retention):某个内含子被保留在成熟 mRNA 中。
▮▮▮▮ⓒ 可变 5' 剪接位点 (Alternative 5' splice site):同一个 5' 剪接位点可以与不同的 3' 剪接位点配对。
▮▮▮▮ⓓ 可变 3' 剪接位点 (Alternative 3' splice site):同一个 3' 剪接位点可以与不同的 5' 剪接位点配对。
▮▮▮▮ⓔ 互斥外显子 (Mutually exclusive exons):多个外显子中只能选择一个包含在成熟 mRNA 中。
可变剪接受到多种因素的调控,包括剪接因子 (splicing factors)、RNA 结构和染色质结构等。可变剪接在发育、细胞分化和疾病发生中发挥重要作用。[ref]
② 5' 端加帽 (5' Capping)
5' 端加帽是指在 mRNA 分子 5' 端添加一个 7-甲基鸟苷 (7-methylguanosine) 帽结构的过程。加帽反应发生在转录起始后不久,通常在 RNA 链长度达到约 20-30 个核苷酸时进行。
▮ 加帽酶 (Capping Enzymes):
加帽反应由一系列酶催化完成,包括:
▮▮▮▮ⓐ RNA 三磷酸酶 (RNA triphosphatase):去除 mRNA 5' 端第一个核苷酸的 γ-磷酸基团。
▮▮▮▮ⓑ 鸟苷转移酶 (Guanylyltransferase):将鸟苷单磷酸 (GMP) 从鸟苷三磷酸 (GTP) 转移到 mRNA 5' 端的二磷酸基团上,形成 5'-5' 三磷酸键。
▮▮▮▮ⓒ 鸟苷-7-甲基转移酶 (Guanine-7-methyltransferase):将甲基从 S-腺苷甲硫氨酸 (S-adenosylmethionine, SAM) 转移到 鸟苷的 7 位氮原子上,形成 7-甲基鸟苷帽结构。
▮ 帽结构 (Cap Structure):
成熟 mRNA 的 5' 端帽结构为 7-甲基鸟苷通过 5'-5' 三磷酸键与 mRNA 的第一个核苷酸连接,通常表示为 m⁷GpppN,其中 N 代表 mRNA 的第一个核苷酸。在某些真核生物中,帽结构还可以进一步甲基化,如 mRNA 第一个或第二个核苷酸的 2'-OH 基团甲基化。
▮ 加帽的功能 (Functions of Capping):
5' 端加帽对 mRNA 的稳定性、翻译效率和剪接等过程都具有重要作用:
▮▮▮▮ⓐ 保护 mRNA 免受核酸外切酶降解 (Protection from exonuclease degradation):5' 端帽结构可以阻止 5'→3' 核酸外切酶对 mRNA 的降解,提高 mRNA 的稳定性。
▮▮▮▮ⓑ 促进 mRNA 翻译起始 (Promotion of translation initiation):5' 端帽结构可以被核糖体小亚基和翻译起始因子 eIF4E 识别,促进核糖体与 mRNA 的结合,启动翻译。
▮▮▮▮ⓒ 参与 mRNA 剪接 (Participation in mRNA splicing):5' 端帽结构可以促进某些内含子的剪接。
▮▮▮▮ⓓ 促进 mRNA 转运 (Promotion of mRNA transport):5' 端帽结构可以促进 mRNA 从细胞核转运到细胞质。
③ 3' 端加 poly(A) 尾 (3' Polyadenylation)
3' 端加 poly(A) 尾是指在 mRNA 分子 3' 端添加一段由多个腺嘌呤核苷酸组成的 poly(A) 尾巴的过程。poly(A) 尾的长度在不同 mRNA 分子和不同物种中有所差异,通常为 100-250 个核苷酸。
▮ poly(A) 加尾信号 (Polyadenylation Signal):
poly(A) 加尾反应由 pre-mRNA 分子 3' 端的 poly(A) 加尾信号序列指导。典型的 poly(A) 加尾信号序列包括:
▮▮▮▮ⓐ AAUAAA 序列:位于 poly(A) 加尾位点上游约 10-30 个核苷酸处,是 poly(A) 加尾信号的核心序列,高度保守。
▮▮▮▮ⓑ 下游序列元件 (Downstream sequence elements, DSE):位于 poly(A) 加尾位点下游,富含 GU 或 U 序列,增强 poly(A) 加尾效率。
▮ poly(A) 加尾酶 (Poly(A) Polymerase, PAP):
poly(A) 加尾反应由多蛋白复合物催化完成,主要包括:
▮▮▮▮ⓐ CstF (Cleavage stimulation factor):结合到富含 GU 或 U 的下游序列元件。
▮▮▮▮ⓑ CPSF (Cleavage and polyadenylation specificity factor):结合到 AAUAAA 序列,并识别 poly(A) 加尾位点。
▮▮▮▮ⓒ CF I 和 CF II (Cleavage factors I and II):参与 RNA 分子的切割。
▮▮▮▮ⓓ poly(A) 聚合酶 (PAP):催化 poly(A) 尾的合成,以 ATP 为底物,将腺嘌呤核苷酸逐个添加到 RNA 分子 3' 端。
▮ poly(A) 加尾的机制 (Mechanism of Polyadenylation):
▮▮▮▮ⓐ CPSF 识别并结合 AAUAAA 序列,CstF 结合下游序列元件,形成复合物。
▮▮▮▮ⓑ CF I 和 CF II 参与 RNA 分子的切割,在 poly(A) 加尾位点切割 pre-mRNA 分子。
▮▮▮▮ⓒ poly(A) 聚合酶 (PAP) 以 ATP 为底物,将腺嘌呤核苷酸逐个添加到切割后的 RNA 分子 3' 端,合成 poly(A) 尾。poly(A) 尾的长度受到 poly(A) 结合蛋白 (poly(A)-binding protein, PABP) 的调控。PABP 结合到 poly(A) 尾上,促进 poly(A) 尾的延伸,并保护 poly(A) 尾免受核酸外切酶降解。
▮ poly(A) 加尾的功能 (Functions of Polyadenylation):
3' 端 poly(A) 尾对 mRNA 的稳定性、翻译效率和转运等过程都具有重要作用:
▮▮▮▮ⓐ 保护 mRNA 免受核酸外切酶降解 (Protection from exonuclease degradation):3' 端 poly(A) 尾可以阻止 3'→5' 核酸外切酶对 mRNA 的降解,提高 mRNA 的稳定性。
▮▮▮▮ⓑ 促进 mRNA 翻译起始 (Promotion of translation initiation):poly(A) 尾可以与 5' 端帽结构协同作用,环化 mRNA 分子,促进核糖体与 mRNA 的结合,启动翻译。PABP 结合到 poly(A) 尾上,可以与翻译起始因子 eIF4G 相互作用,促进翻译起始复合物的组装。
▮▮▮▮ⓒ 促进 mRNA 转运 (Promotion of mRNA transport):poly(A) 尾可以促进 mRNA 从细胞核转运到细胞质。
▮▮▮▮ⓓ 参与 mRNA 剪接 (Participation in mRNA splicing):poly(A) 加尾过程可以影响某些内含子的剪接。[ref]
4.2.2 rRNA 和 tRNA 的加工 (rRNA and tRNA Processing)
rRNA 和 tRNA 是细胞中重要的功能性 RNA 分子,它们也需要经过转录后加工才能成熟。rRNA 和 tRNA 的加工过程主要包括 RNA 的切割、修饰和折叠。
① rRNA 的加工 (rRNA Processing)
rRNA 是核糖体的组成成分,真核生物细胞核仁中存在 rRNA 基因的串联重复序列,转录生成 45S rRNA 前体 (pre-rRNA)。45S pre-rRNA 需要经过一系列切割和修饰,才能成熟为 18S rRNA、5.8S rRNA 和 28S rRNA。5S rRNA 基因位于核质,由 RNA 聚合酶 III 转录,其加工过程相对简单。
▮ rRNA 基因与转录 (rRNA Genes and Transcription):
真核生物 rRNA 基因 (除了 5S rRNA 基因) 位于核仁组织区 (nucleolar organizer region, NOR),以串联重复的方式排列。RNA 聚合酶 I 在 rRNA 基因启动子区域起始转录,生成 45S pre-rRNA。45S pre-rRNA 包含 18S rRNA、5.8S rRNA 和 28S rRNA 的序列,以及间隔转录区 (internal transcribed spacers, ITS1 和 ITS2) 和外部转录区 (external transcribed spacers, ETS)。
▮ rRNA 加工酶 (rRNA Processing Enzymes):
rRNA 加工主要由核仁中的 snoRNP (small nucleolar ribonucleoprotein particles) 催化完成。snoRNP 包含 snoRNA (small nucleolar RNA) 和蛋白质。snoRNA 通过碱基配对,识别 pre-rRNA 分子上的特定位点,指导 rRNA 的切割和修饰。主要的 snoRNA 包括 C/D box snoRNA 和 H/ACA box snoRNA。
▮▮▮▮ⓐ C/D box snoRNA:指导 rRNA 的 2'-O-甲基化修饰。C/D box snoRNA 包含 C box (RUGAUGA) 和 D box (CUGA),以及 C' 和 D' box。C/D box snoRNP 通过 C/D box 序列与 pre-rRNA 形成 RNA-RNA 杂合链,将甲基转移酶定位到 rRNA 的特定位点,催化 rRNA 的 2'-O-甲基化。
▮▮▮▮ⓑ H/ACA box snoRNA:指导 rRNA 的假尿嘧啶化 (pseudouridylation) 修饰。H/ACA box snoRNA 包含 H box (ANANNA) 和 ACA box (ACA)。H/ACA box snoRNP 通过 H/ACA box 序列与 pre-rRNA 形成 RNA-RNA 杂合链,将假尿嘧啶合成酶定位到 rRNA 的特定位点,催化尿嘧啶核苷酸的异构化,形成假尿嘧啶。
▮ rRNA 切割与成熟 (rRNA Cleavage and Maturation):
45S pre-rRNA 经过一系列切割步骤,逐步成熟为 18S rRNA、5.8S rRNA 和 28S rRNA。主要的切割酶包括核糖核酸酶 III (RNase III) 家族的酶,如 酿酒酵母 (Saccharomyces cerevisiae) 的 Rnt1p 和 哺乳动物 的 Drosha (在 rRNA 加工中的作用相对较小,主要参与 miRNA 加工)。切割过程通常按照 45S pre-rRNA → 30S pre-rRNA + 32S pre-rRNA → 18S rRNA + 5.8S rRNA + 28S rRNA 的顺序进行。5.8S rRNA 和 28S rRNA 通常在核仁中与核糖体蛋白组装形成核糖体大亚基前体,18S rRNA 与核糖体蛋白组装形成核糖体小亚基前体。核糖体亚基前体从核仁转运到核质,进一步成熟,最终形成成熟的核糖体亚基。[ref]
② tRNA 的加工 (tRNA Processing)
tRNA 是蛋白质翻译过程中的适配分子,将 mRNA 上的密码子翻译成氨基酸。tRNA 前体 (pre-tRNA) 需要经过一系列加工步骤,才能成熟为功能性 tRNA 分子,包括 5' 端前导序列的去除、3' 端尾随序列的去除、内含子的剪接 (在某些生物中)、碱基修饰和 3' 端 CCA 序列的添加。
▮ tRNA 基因与转录 (tRNA Genes and Transcription):
tRNA 基因由 RNA 聚合酶 III 转录生成 pre-tRNA。pre-tRNA 通常包含 5' 端前导序列、3' 端尾随序列和内含子 (在某些 tRNA 基因中)。
▮ tRNA 加工酶 (tRNA Processing Enzymes):
▮▮▮▮ⓐ RNase P:是一种核酶 (ribozyme),即具有酶活性的 RNA 分子。RNase P 催化去除 pre-tRNA 5' 端的前导序列。RNase P 由 RNA 亚基 (催化亚基) 和蛋白质亚基组成。RNA 亚基负责识别 pre-tRNA 的结构,催化 RNA 分子的切割。
▮▮▮▮ⓑ RNase D 和 RNase T:核酸外切酶,催化去除 pre-tRNA 3' 端的尾随序列。
▮▮▮▮ⓒ tRNA 剪接酶 (tRNA Splicing Endonuclease):在某些生物 (如 酵母 和 植物) 中,部分 tRNA 基因包含内含子。tRNA 剪接酶催化去除 pre-tRNA 中的内含子,并将外显子连接起来。tRNA 剪接机制与 mRNA 剪接机制不同,不依赖于剪接体,而是一种酶促切割-连接反应。
▮▮▮▮ⓓ tRNA 修饰酶 (tRNA Modification Enzymes):tRNA 分子包含多种碱基修饰,如甲基化、异戊烯基化、硫代尿苷化等。tRNA 修饰酶催化 tRNA 分子中特定碱基的修饰,修饰后的碱基可以影响 tRNA 的结构、稳定性、密码子识别和翻译效率。
▮▮▮▮ⓔ tRNA 核苷酸转移酶 (tRNA Nucleotidyltransferase):催化在 tRNA 3' 端添加 CCA 序列。CCA 序列是所有成熟 tRNA 分子 3' 端的共同序列,是氨基酸连接位点。如果 tRNA 基因编码的 pre-tRNA 分子 3' 端缺少 CCA 序列,tRNA 核苷酸转移酶会将其添加上去。
▮ tRNA 折叠与成熟 (tRNA Folding and Maturation):
tRNA 分子转录和加工过程中,会折叠形成特征性的三叶草结构 (cloverleaf structure) 和 L 形三维结构。tRNA 的正确折叠对于其功能至关重要。一些蛋白质因子,如分子伴侣 (molecular chaperones),参与辅助 tRNA 的正确折叠。成熟的 tRNA 分子可以与氨基酰 tRNA 合成酶 (aminoacyl-tRNA synthetases) 结合,被氨基酰化,携带特定的氨基酸参与蛋白质翻译。[ref]
4.2.3 RNA 编辑 (RNA Editing)
RNA 编辑是指在 RNA 分子转录后,对其序列进行修饰,改变 RNA 分子编码信息的过程。RNA 编辑可以导致 RNA 分子的碱基序列与 DNA 模板序列不一致。RNA 编辑主要有插入/缺失编辑 (insertion/deletion editing) 和替换编辑 (substitution editing) 两种类型。
① RNA 编辑的类型 (Types of RNA Editing)
▮ 插入/缺失编辑 (Insertion/Deletion Editing):
在 RNA 分子中插入或缺失核苷酸,主要发生在线粒体和叶绿体 RNA 中,以及某些病毒 RNA 中。例如,锥虫 (trypanosomes) 线粒体 mRNA 的 RNA 编辑非常广泛,可以插入或缺失大量的尿嘧啶核苷酸,改变 mRNA 的阅读框,产生功能性蛋白质。
▮ 替换编辑 (Substitution Editing):
将 RNA 分子中的一个碱基替换为另一个碱基。主要的替换编辑类型包括:
▮▮▮▮ⓐ A-to-I 编辑 (A-to-I editing):将腺嘌呤 (A) 脱氨基,转化为肌苷 (inosine, I)。肌苷在翻译过程中被识别为鸟嘌呤 (G),因此 A-to-I 编辑相当于 A→G 替换。A-to-I 编辑由 ADAR (adenosine deaminase acting on RNA) 酶家族催化。ADAR 酶识别双链 RNA 结构,催化双链 RNA 中的腺嘌呤脱氨基。A-to-I 编辑广泛存在于真核生物 mRNA 和非编码 RNA 中,可以改变 mRNA 的剪接、翻译和 RNA 结构,调控基因表达。
▮▮▮▮ⓑ C-to-U 编辑 (C-to-U editing):将胞嘧啶 (C) 脱氨基,转化为尿嘧啶 (U)。C-to-U 编辑由 APOBEC (apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like) 酶家族催化。APOBEC 酶催化单链 RNA 或 DNA 中的胞嘧啶脱氨基。C-to-U 编辑在 mRNA 和 tRNA 中都有发现,可以改变 mRNA 的密码子,调控蛋白质的表达,也可以影响 tRNA 的功能。[ref]
② RNA 编辑的机制 (Mechanisms of RNA Editing)
▮ 导向 RNA (Guide RNA, gRNA):
在锥虫线粒体 RNA 编辑中,导向 RNA (gRNA) 发挥重要作用。gRNA 是一类小 RNA 分子,与需要编辑的 mRNA 分子部分互补配对。gRNA 通过配对区锚定到 mRNA 分子上,其 3' 端包含一段寡聚尿嘧啶序列,作为 RNA 编辑酶的结合位点。RNA 编辑酶复合物 (RNA editing complex) 结合到 gRNA 和 mRNA 复合物上,根据 gRNA 的序列信息,在 mRNA 分子中插入或缺失尿嘧啶核苷酸。
▮ ADAR 酶 (ADAR Enzymes):
A-to-I 编辑由 ADAR 酶家族催化。ADAR 酶包含 RNA 结合域 (如 dsRBD, double-stranded RNA-binding domain) 和催化域 (脱氨酶结构域)。RNA 结合域识别双链 RNA 结构,催化域催化腺嘌呤脱氨基。ADAR 酶通常作用于 pre-mRNA 分子的内含子区域或非编码区,形成双链 RNA 结构,进行 A-to-I 编辑。A-to-I 编辑可以改变 mRNA 的剪接位点,影响可变剪接;也可以改变 mRNA 的密码子,影响蛋白质的氨基酸序列;还可以改变 RNA 结构,影响 RNA 的稳定性、翻译和相互作用。
▮ APOBEC 酶 (APOBEC Enzymes):
C-to-U 编辑由 APOBEC 酶家族催化。APOBEC 酶催化单链 RNA 或 DNA 中的胞嘧啶脱氨基。APOBEC 酶在免疫应答和病毒防御中发挥重要作用。例如,APOBEC3G 酶可以抑制逆转录病毒的复制,通过催化病毒基因组 RNA 的 C-to-U 编辑,导致病毒基因突变失活。[ref]
③ RNA 编辑的功能与疾病 (Functions and Diseases of RNA Editing)
RNA 编辑在基因表达调控、生物多样性和疾病发生中发挥重要作用。
▮ 扩展遗传信息 (Expanding Genetic Information):
RNA 编辑可以改变 RNA 分子的编码信息,使 RNA 分子的功能多样化,扩展了基因组的编码潜力。例如,A-to-I 编辑可以改变 mRNA 的剪接模式,产生不同的蛋白质异构体;C-to-U 编辑可以改变 mRNA 的密码子,产生不同的蛋白质氨基酸序列。
▮ 调控基因表达 (Regulating Gene Expression):
RNA 编辑可以调控基因的表达水平和表达模式。例如,A-to-I 编辑可以改变 miRNA 前体的加工,影响成熟 miRNA 的生成和靶基因的调控;C-to-U 编辑可以改变 mRNA 的稳定性,影响 mRNA 的降解速率。
▮ 疾病相关性 (Disease Relevance):
RNA 编辑异常与多种疾病的发生发展相关,包括神经系统疾病、免疫系统疾病和肿瘤等。例如,ADAR 酶功能异常与神经退行性疾病、癫痫和精神分裂症等相关;APOBEC 酶功能异常与肿瘤发生和病毒感染相关。RNA 编辑酶可以作为疾病治疗的潜在靶点。[ref]
4.2.4 RNA 转运 (RNA Transport)
RNA 转运是指 RNA 分子从细胞核合成后,转运到细胞质的过程。真核生物细胞核是 RNA 合成和加工的主要场所,细胞质是蛋白质合成的场所。mRNA、rRNA 和 tRNA 等功能性 RNA 分子需要在细胞质中发挥作用,因此需要高效的 RNA 转运机制。
① mRNA 转运 (mRNA Transport)
mRNA 从细胞核转运到细胞质,需要穿过核孔复合体 (nuclear pore complex, NPC)。NPC 是核膜上的巨大通道,允许小分子自由扩散,并介导大分子 (如 RNA 和蛋白质) 的主动转运。
▮ 核孔复合体 (Nuclear Pore Complex, NPC):
NPC 是一个巨大的蛋白质复合物,由约 30 种不同的核孔蛋白 (nucleoporins, Nups) 组成。NPC 具有中央通道,直径约为 40 nm,可以允许直径小于 9 nm 的小分子自由扩散。大分子需要通过主动转运机制穿过 NPC。NPC 的中央通道内衬有 FG-Nups (phenylalanine-glycine repeat nucleoporins),FG-Nups 包含大量的苯丙氨酸-甘氨酸重复序列,形成一个疏水性的栅栏,阻止大分子自由通过。
▮ mRNA 输出因子 (mRNA Export Factors):
mRNA 转运需要 mRNA 输出因子 (mRNA export factors) 的辅助。mRNA 输出因子与成熟的 mRNA 分子结合,形成 mRNA-蛋白质复合物 (mRNP, messenger ribonucleoprotein particle),介导 mRNP 主动转运穿过 NPC。主要的 mRNA 输出因子包括:
▮▮▮▮ⓐ TAP/NXF1 (TAP/Nuclear export factor 1):是主要的 mRNA 输出受体,可以与 FG-Nups 相互作用,介导 mRNP 穿过 NPC。
▮▮▮▮ⓑ p15/NXT1 (p15/Nuclear transport factor 2-related export protein 1):与 TAP/NXF1 形成异二聚体,增强 TAP/NXF1 的活性。
▮▮▮▮ⓒ Aly/REF (Aly/RNA export factor):结合到 mRNA 分子上,作为 mRNA 输出适配器,连接 mRNA 和 TAP/NXF1。
▮▮▮▮ⓓ TREX 复合物 (Transcription/export complex):是一个多蛋白复合物,与 mRNA 转录和加工偶联,参与 mRNA 输出。TREX 复合物包含 Aly/REF、UAP56 (RNA 解旋酶) 和其他蛋白质因子。
▮ mRNP 重塑 (mRNP Remodeling):
mRNA 在转运过程中,需要经历 mRNP 重塑。在细胞核内,mRNA 与多种 RNA 结合蛋白 (RNA-binding proteins, RBPs) 结合,形成 mRNP。在转运过程中,一些核内 RBP 需要被替换为细胞质 RBP,才能顺利穿过 NPC,并在细胞质中发挥功能。RNA 解旋酶 (如 DDX19) 参与 mRNP 重塑,利用 ATP 水解的能量,解开 RNA-蛋白质相互作用,促进 mRNP 的转运和重塑。mRNA 转运是一个能量依赖、主动运输的过程,需要 GTP 水解提供能量。[ref]
② rRNA 和 tRNA 转运 (rRNA and tRNA Transport)
rRNA 和 tRNA 也需要从细胞核转运到细胞质。rRNA 主要以核糖体亚基的形式转运,tRNA 以成熟 tRNA 分子的形式转运。rRNA 和 tRNA 的转运机制与 mRNA 转运机制有所不同,主要依赖于特定的输出蛋白 (exportins)。
▮ rRNA 转运 (rRNA Transport):
核糖体亚基 (40S 和 60S 亚基) 在核仁中组装完成后,需要分别转运到细胞质,在细胞质中结合形成成熟的 80S 核糖体。rRNA 转运主要依赖于特定的输出蛋白,如 Exportin 1 (XPO1, 也称为 CRM1)。Exportin 1 可以识别核糖体亚基上的核输出信号 (nuclear export signal, NES),介导核糖体亚基穿过 NPC。
▮ tRNA 转运 (tRNA Transport):
成熟的 tRNA 分子也需要从细胞核转运到细胞质,参与蛋白质翻译。tRNA 转运也主要依赖于特定的输出蛋白,如 Exportin-t (Exp-t)。Exportin-t 可以识别 tRNA 分子上的结构特征,介导 tRNA 穿过 NPC。
▮ 输出蛋白 (Exportins):
输出蛋白是一类核转运受体,属于核转运蛋白家族 (karyopherins)。输出蛋白可以识别货物分子 (如 RNA 和蛋白质) 上的核输出信号 (NES),与货物分子结合,介导货物分子从细胞核转运到细胞质。输出蛋白的活性受到 Ran GTPase 循环的调控。在细胞核内,Ran-GTP 浓度较高,输出蛋白与货物分子和 Ran-GTP 形成三元复合物,穿过 NPC。在细胞质中,Ran-GTP 水解为 Ran-GDP,导致三元复合物解离,货物分子释放到细胞质,输出蛋白返回细胞核,完成转运循环。[ref]
4.3 非编码 RNA (Non-coding RNAs)
非编码 RNA (non-coding RNA, ncRNA) 是指不编码蛋白质的 RNA 分子。早期研究认为 RNA 的主要功能是作为 mRNA 的中间体,传递遗传信息。然而,随着研究的深入,人们发现细胞中存在大量的非编码 RNA,它们在基因表达调控、细胞功能和疾病发生中发挥重要作用。非编码 RNA 可以根据大小和功能分为不同类型,如 rRNA、tRNA、小 RNA (miRNA, siRNA)、长非编码 RNA (lncRNA) 等。
4.3.1 小 RNA (Small RNAs): miRNA 和 siRNA
小 RNA 是一类长度约为 20-30 个核苷酸的非编码 RNA 分子,主要包括 miRNA (microRNA) 和 siRNA (small interfering RNA)。miRNA 和 siRNA 在基因沉默和 RNA 干扰 (RNA interference, RNAi) 中发挥重要作用。
① miRNA (microRNA)
miRNA 是一类内源性小 RNA 分子,由内源基因编码,参与调控基因表达。miRNA 通过与靶 mRNA 分子结合,抑制靶 mRNA 的翻译或促进靶 mRNA 的降解,实现基因沉默。
▮ miRNA 的生物合成途径 (Biogenesis of miRNA):
miRNA 的生物合成是一个多步骤的过程,主要在细胞核和细胞质中进行:
▮▮▮▮ⓐ 初级 miRNA 转录本 (pri-miRNA):miRNA 基因由 RNA 聚合酶 II 转录生成初级 miRNA 转录本 (pri-miRNA)。pri-miRNA 通常长度较长,包含一个或多个发夹结构 (hairpin structure)。
▮▮▮▮ⓑ pre-miRNA 加工 (Processing of pre-miRNA):pri-miRNA 在细胞核内被 RNase III 酶 Drosha 和双链 RNA 结合蛋白 DGCR8 (DiGeorge syndrome critical region 8) 加工,切除发夹结构两侧的序列,释放出约 70 个核苷酸的 pre-miRNA (precursor miRNA)。pre-miRNA 仍然具有发夹结构。
▮▮▮▮ⓒ pre-miRNA 输出 (Export of pre-miRNA):pre-miRNA 被输出蛋白 Exportin-5 转运到细胞质。
▮▮▮▮ⓓ 成熟 miRNA 加工 (Processing of mature miRNA):在细胞质中,pre-miRNA 被 RNase III 酶 Dicer 加工,切除发夹结构的环状区域,产生约 22 个核苷酸的双链 miRNA。双链 miRNA 由成熟 miRNA 链 (guide strand) 和互补链 (passenger strand, 也称为 miRNA) 组成。
▮▮▮▮ⓔ RISC 组装 (RISC assembly):双链 miRNA 与 RNA 诱导沉默复合物 (RNA-induced silencing complex, RISC) 结合。RISC 核心组分是 Argonaute (Ago) 蛋白。在 RISC 组装过程中,通常成熟 miRNA 链被保留在 RISC 中,作为 guide strand,指导 RISC 识别靶 mRNA 分子;互补链 (miRNA) 通常被降解。
▮ miRNA 的作用机制 (Mechanisms of miRNA Action):
成熟 miRNA 组装到 RISC 后,通过碱基配对,识别靶 mRNA 分子 3' 非翻译区 (3'UTR) 的互补序列。miRNA 与靶 mRNA 的结合程度决定了基因沉默的机制:
▮▮▮▮ⓐ 完全互补配对 (Perfect complementarity):如果 miRNA 与靶 mRNA 3'UTR 序列完全互补配对,RISC 激活 RNA 酶活性,切割靶 mRNA 分子,导致 mRNA 降解。这种机制类似于 siRNA 介导的 RNA 干扰。
▮▮▮▮ⓑ 不完全互补配对 (Imperfect complementarity):如果 miRNA 与靶 mRNA 3'UTR 序列不完全互补配对 (通常在 miRNA 的 5' 端种子区,seed region,2-7 位核苷酸完全互补配对),RISC 抑制靶 mRNA 的翻译,降低蛋白质的表达水平。miRNA 介导的翻译抑制机制较为复杂,可能涉及阻碍核糖体起始复合物的组装,或促进核糖体提前终止翻译等。
▮ miRNA 的功能 (Functions of miRNA):
miRNA 参与调控细胞生长、发育、分化、凋亡、代谢等多种生物学过程。miRNA 调控的基因范围广泛,估计人类基因组中超过 60% 的基因受到 miRNA 的调控。miRNA 在疾病发生中也发挥重要作用,miRNA 表达异常与癌症、心血管疾病、神经系统疾病等多种疾病相关。miRNA 可以作为疾病诊断和治疗的潜在靶点。[ref]
② siRNA (small interfering RNA)
siRNA 是一类外源性小 RNA 分子,通常由外源双链 RNA (double-stranded RNA, dsRNA) 来源,如病毒感染或人工导入的 dsRNA。siRNA 介导 RNA 干扰 (RNAi) 途径,特异性沉默与 siRNA 序列互补的基因。
▮ siRNA 的生物合成途径 (Biogenesis of siRNA):
siRNA 的生物合成主要在细胞质中进行:
▮▮▮▮ⓐ dsRNA 导入或产生 (dsRNA introduction or production):外源 dsRNA 可以通过病毒感染或人工转染等方式导入细胞。细胞内也可以通过 RNA 依赖的 RNA 聚合酶 (RNA-dependent RNA polymerase, RdRP) 将单链 RNA 复制成 dsRNA。
▮▮▮▮ⓑ Dicer 加工 (Dicer processing):细胞质中的 RNase III 酶 Dicer 识别并切割 dsRNA,产生约 21-25 个核苷酸的双链 siRNA。双链 siRNA 具有 3' 端突出 (3' overhang) 的结构特征。
▮▮▮▮ⓒ RISC 组装 (RISC assembly):双链 siRNA 与 RNA 诱导沉默复合物 (RISC) 结合。RISC 核心组分也是 Argonaute (Ago) 蛋白。在 RISC 组装过程中,通常选择热力学稳定性较低的 siRNA 链作为 guide strand,指导 RISC 识别靶 mRNA 分子;另一条链 (passenger strand) 被降解。
▮ siRNA 的作用机制 (Mechanism of siRNA Action):
成熟 siRNA 组装到 RISC 后,通过碱基配对,识别靶 mRNA 分子的完全互补序列。RISC 激活 RNA 酶活性,切割靶 mRNA 分子,导致 mRNA 降解,实现基因沉默。siRNA 介导的 RNA 干扰途径具有高度的序列特异性,可以精确沉默目标基因。
▮ siRNA 的应用 (Applications of siRNA):
siRNA 介导的 RNA 干扰技术已成为基因功能研究和基因治疗的重要工具。
▮▮▮▮ⓐ 基因沉默工具 (Gene silencing tool):siRNA 可以用于在细胞或动物模型中特异性沉默目标基因,研究基因的功能。RNA 干扰技术具有高效、特异、可逆等优点,广泛应用于基因功能分析、药物靶点筛选和疾病机制研究。
▮▮▮▮ⓑ 治疗应用 (Therapeutic applications):siRNA 可以作为治疗药物,用于治疗基因表达异常相关的疾病,如癌症、病毒感染和遗传病等。siRNA 药物可以通过靶向致病基因的 mRNA,抑制致病基因的表达,达到治疗疾病的目的。目前,一些 siRNA 药物已进入临床试验,并在某些疾病治疗中取得进展。[ref]
4.3.2 长非编码 RNA (Long Non-coding RNAs, lncRNAs)
长非编码 RNA (lncRNA) 是一类长度超过 200 个核苷酸的非编码 RNA 分子。lncRNA 种类繁多,功能复杂,参与调控基因表达、染色质结构、细胞核结构和多种细胞过程。
① lncRNA 的种类与功能 (Types and Functions of lncRNAs)
lncRNA 可以根据其基因组位置和作用机制分为不同类型,主要的 lncRNA 类型包括:
▮ 信号 lncRNA (Signal lncRNAs):
作为分子信号,响应细胞内外信号刺激,调控基因表达。例如,HSR1 lncRNA 在热休克应激条件下表达上调,激活热休克反应。
▮ 诱饵 lncRNA (Decoy lncRNAs):
作为分子诱饵,竞争性结合转录因子或其他 RNA 结合蛋白,阻止其与靶基因或 RNA 分子结合,调控基因表达。例如,HOTAIR lncRNA 可以结合 PRC2 (Polycomb Repressive Complex 2) 复合物,阻止 PRC2 复合物结合到靶基因,抑制靶基因的转录。
▮ 指导 lncRNA (Guide lncRNAs):
作为分子向导,引导蛋白质复合物定位到基因组特定位点,调控基因表达或染色质修饰。例如,Xist lncRNA 可以引导 PRC2 复合物和 DNA 甲基转移酶定位到 X 染色体,介导 X 染色体失活。
▮ 支架 lncRNA (Scaffold lncRNAs):
作为分子支架,连接多个蛋白质分子,形成 RNA-蛋白质复合物,介导蛋白质之间的相互作用,调控基因表达或细胞过程。例如,MALAT1 lncRNA 可以作为支架,连接剪接因子 SR 蛋白,调控基因的可变剪接。
lncRNA 的功能多样,参与调控基因表达的各个层面,包括转录调控、转录后调控和表观遗传调控。lncRNA 在细胞发育、分化、稳态维持和疾病发生中发挥重要作用。[ref]
② lncRNA 的作用机制 (Mechanisms of lncRNA Action)
lncRNA 通过多种机制发挥调控作用,主要包括:
▮ 转录调控 (Transcriptional Regulation):
lncRNA 可以调控基因的转录起始、延伸和终止。
▮▮▮▮ⓐ 顺式作用 (Cis-acting):lncRNA 可以作用于其转录位点附近的基因,调控邻近基因的表达。例如,启动子相关的 lncRNA (promoter-associated lncRNA) 可以调控邻近基因的转录起始;终止子相关的 lncRNA (terminator-associated lncRNA) 可以调控邻近基因的转录终止。
▮▮▮▮ⓑ 反式作用 (Trans-acting):lncRNA 可以作用于远离其转录位点的基因,调控远端基因的表达。lncRNA 可以通过与转录因子、染色质修饰复合物等相互作用,调控远端基因的转录。
▮ 转录后调控 (Post-transcriptional Regulation):
lncRNA 可以调控 mRNA 的加工、稳定性、翻译和定位。
▮▮▮▮ⓐ mRNA 加工调控 (Regulation of mRNA processing):lncRNA 可以调控 mRNA 的剪接、加帽和 poly(A) 加尾。例如,MALAT1 lncRNA 可以调控 pre-mRNA 的可变剪接。
▮▮▮▮ⓑ mRNA 稳定性调控 (Regulation of mRNA stability):lncRNA 可以调控 mRNA 的降解速率,影响 mRNA 的稳定性。例如,NORAD lncRNA 可以竞争性结合 RNA 结合蛋白 PUMILIO,保护靶 mRNA 免受降解。
▮▮▮▮ⓒ 翻译调控 (Translational regulation):lncRNA 可以调控 mRNA 的翻译效率,影响蛋白质的表达水平。例如,lncRNA 可以与核糖体结合,调控 mRNA 的翻译起始或延伸。
▮▮▮▮ⓓ mRNA 定位调控 (Regulation of mRNA localization):lncRNA 可以调控 mRNA 在细胞内的定位,影响局部翻译。例如,lncRNA 可以将 mRNA 定位到特定的细胞区域,如细胞膜或细胞器。
▮ 染色质结构调控 (Chromatin Structure Regulation):
lncRNA 可以参与调控染色质结构,影响基因的可及性和转录活性。
▮▮▮▮ⓐ 染色质修饰 (Chromatin modification):lncRNA 可以引导染色质修饰复合物 (如 PRC2, LSD1) 定位到基因组特定位点,调控组蛋白修饰和 DNA 甲基化,改变染色质结构状态。
▮▮▮▮ⓑ 染色质重塑 (Chromatin remodeling):lncRNA 可以与染色质重塑复合物相互作用,调控核小体的位置和结构,改变染色质的可及性。
▮▮▮▮ⓒ 染色质高级结构调控 (Regulation of higher-order chromatin structure):lncRNA 可以参与调控染色质的高级结构,如染色质环和染色质区室,影响基因的远程调控。
lncRNA 的作用机制多样,通常通过与蛋白质、DNA 或 RNA 相互作用,形成 RNA-蛋白质复合物、RNA-DNA 三螺旋或 RNA-RNA 双链等,发挥调控功能。lncRNA 的作用机制研究仍处于起步阶段,许多 lncRNA 的功能和作用机制尚不清楚。[ref]
③ lncRNA 与疾病 (lncRNAs and Diseases)
lncRNA 表达异常与多种疾病的发生发展相关,包括癌症、神经系统疾病、心血管疾病和免疫系统疾病等。lncRNA 可以作为疾病诊断的生物标志物和治疗的潜在靶点。
▮ 癌症 (Cancer):
许多 lncRNA 在肿瘤发生发展中发挥重要作用,可以作为癌基因 (oncogenes) 或抑癌基因 (tumor suppressor genes)。例如,HOTAIR lncRNA 在多种癌症中高表达,促进肿瘤转移和侵袭;PTENP1 lncRNA 作为 PTEN 基因的假基因,可以竞争性结合 miRNA,解除 miRNA 对 PTEN mRNA 的抑制,发挥抑癌作用。lncRNA 可以作为肿瘤诊断的生物标志物和靶向治疗的潜在靶点。
▮ 神经系统疾病 (Neurological Diseases):
lncRNA 在神经发育和神经功能维持中发挥重要作用。lncRNA 表达异常与多种神经系统疾病相关,如阿尔茨海默病 (Alzheimer's disease)、帕金森病 (Parkinson's disease) 和亨廷顿病 (Huntington's disease) 等。例如,BACE1-AS lncRNA 可以上调 β-分泌酶 BACE1 的表达,促进 β-淀粉样蛋白的生成,参与阿尔茨海默病的发生。lncRNA 可以作为神经系统疾病的诊断标志物和治疗靶点。
▮ 心血管疾病 (Cardiovascular Diseases):
lncRNA 在心血管发育和心血管功能调控中发挥重要作用。lncRNA 表达异常与多种心血管疾病相关,如心肌肥厚、心力衰竭和动脉粥样硬化等。例如,MIAT lncRNA 在心肌梗死中表达上调,促进心肌细胞凋亡和心肌损伤。lncRNA 可以作为心血管疾病的诊断标志物和治疗靶点。
▮ 免疫系统疾病 (Immune System Diseases):
lncRNA 在免疫细胞发育和免疫应答调控中发挥重要作用。lncRNA 表达异常与多种免疫系统疾病相关,如自身免疫性疾病和炎症性疾病等。例如,NEAT1 lncRNA 在炎症反应中表达上调,促进炎症因子的释放,参与炎症性疾病的发生。lncRNA 可以作为免疫系统疾病的诊断标志物和治疗靶点。[ref]
4.3.3 其他非编码 RNA (Other Non-coding RNAs)
除了 miRNA、siRNA 和 lncRNA,细胞中还存在其他类型的非编码 RNA,如 snoRNA (small nucleolar RNA)、snRNA (small nuclear RNA)、piRNA (PIWI-interacting RNA) 等。
① snoRNA (small nucleolar RNA)
snoRNA 是一类主要位于核仁的小 RNA 分子,长度约为 60-300 个核苷酸。snoRNA 主要功能是指导 rRNA 和 snRNA 的修饰,包括 2'-O-甲基化和假尿嘧啶化。snoRNA 通过与蛋白质结合形成 snoRNP,snoRNP 通过 snoRNA 的序列特异性,识别 rRNA 和 snRNA 的特定位点,将修饰酶定位到修饰位点,催化 rRNA 和 snRNA 的修饰。snoRNA 主要分为 C/D box snoRNA 和 H/ACA box snoRNA 两大类,分别指导 2'-O-甲基化和假尿嘧啶化修饰。snoRNA 在核糖体生物发生和剪接体功能中发挥重要作用。[ref]
② snRNA (small nuclear RNA)
snRNA 是一类主要位于细胞核的小 RNA 分子,长度约为 100-200 个核苷酸。snRNA 是剪接体的组成成分,参与 mRNA 剪接过程。主要的 snRNA 包括 U1, U2, U4, U5, U6 snRNA。snRNA 与蛋白质结合形成 snRNP,snRNP 通过 snRNA 的序列特异性,识别 pre-mRNA 分子上的剪接位点,催化 mRNA 剪接反应。不同的 snRNA 在剪接过程中发挥不同的作用,如 U1 snRNA 识别 5' 剪接位点,U2 snRNA 识别分支点,U5 snRNA 参与外显子的连接,U6 snRNA 催化转酯反应。snRNA 在基因表达调控中发挥重要作用。[ref]
③ piRNA (PIWI-interacting RNA)
piRNA 是一类主要在生殖细胞中表达的小 RNA 分子,长度约为 24-32 个核苷酸。piRNA 与 PIWI (P-element induced wimpy testis) 亚家族的 Argonaute 蛋白结合,形成 piRNA 诱导沉默复合物 (piRISC)。piRNA 主要功能是抑制转座子 (transposons) 的活性,维持基因组稳定性,保护生殖细胞的遗传信息。piRNA 的生物合成途径与 miRNA 和 siRNA 不同,不依赖于 Drosha 和 Dicer 酶,而主要通过一种称为 "乒乓" 循环 (ping-pong cycle) 的机制生成。piRNA 在生殖细胞发育和配子发生中发挥重要作用。[ref]
④ 其他 ncRNA (Other ncRNAs)
除了上述几类主要的非编码 RNA,细胞中还存在其他类型的非编码 RNA,如:
▮▮▮▮ⓐ circRNA (circular RNA):环状 RNA 分子,由 mRNA 的外显子或内含子环化形成。circRNA 具有环状结构,不易被核酸外切酶降解,稳定性较高。circRNA 可以作为 miRNA 海绵 (miRNA sponge),竞争性结合 miRNA,解除 miRNA 对靶 mRNA 的抑制;也可以与 RNA 结合蛋白相互作用,调控基因表达;一些 circRNA 还可以翻译蛋白质。circRNA 在基因表达调控和疾病发生中发挥重要作用。
▮▮▮▮ⓑ tRFs (tRNA-derived fragments):tRNA 来源的片段,由成熟 tRNA 或 pre-tRNA 分裂产生的小 RNA 分子。tRFs 可以分为 5'-tRFs 和 3'-tRFs,根据 tRNA 的不同区域来源又可以细分为多种类型。tRFs 参与调控基因表达、细胞应激反应和细胞凋亡等过程。
▮▮▮▮ⓒ rRNA-derived fragments (rRFs):rRNA 来源的片段,由 rRNA 分裂产生的小 RNA 分子。rRFs 的功能尚不完全清楚,可能参与调控基因表达和细胞应激反应。
▮▮▮▮ⓓ srpRNA (signal recognition particle RNA):信号识别粒子 (signal recognition particle, SRP) 的 RNA 组件,参与蛋白质的靶向定位。SRP 识别新生肽链上的信号序列,将核糖体-mRNA-肽链复合物靶向内质网膜,介导分泌蛋白和膜蛋白的合成和转运。
▮▮▮▮ⓔ 7SK RNA:与 P-TEFb (positive transcription elongation factor b) 复合物结合,调控 RNA 聚合酶 II 的延伸活性。7SK RNA 可以抑制 P-TEFb 的活性,使 RNA 聚合酶 II 停留在启动子近端区域,阻碍转录延伸;在信号刺激下,7SK RNA 解离,P-TEFb 激活,促进转录延伸。
非编码 RNA 是基因表达调控网络的重要组成部分,它们种类繁多,功能复杂,参与调控细胞的各种生命活动。非编码 RNA 的研究是当前分子生物学研究的热点领域,深入研究非编码 RNA 的功能和作用机制,将有助于更全面地理解基因表达调控的复杂性,并为疾病的诊断和治疗提供新的思路和靶点。[ref]
5. 基因的翻译与蛋白质合成 (Gene Translation and Protein Synthesis)
本章深入探讨了基因的翻译 (gene translation) 与 蛋白质合成 (protein synthesis) 的分子机制,这是 中心法则 (central dogma) 中至关重要的最后一步。从 信使 RNA (messenger RNA, mRNA) 携带的遗传信息如何被解码,到最终形成具有生物活性的 蛋白质 (protein),本章将详细解析这一复杂而精密的生物过程。内容涵盖了 核糖体 (ribosome) 的精细结构与功能、转移 RNA (transfer RNA, tRNA) 在密码子识别中的作用、翻译起始、延伸和终止的分子机制,以及 蛋白质折叠 (protein folding)、翻译后修饰 (post-translational modification, PTM) 与 蛋白质转运 (protein transport) 等关键环节。通过本章的学习,读者将全面理解基因如何通过翻译过程最终指导蛋白质的合成,并认识到蛋白质合成调控在细胞生命活动中的核心作用。
5.1 翻译的分子机制 (Molecular Mechanisms of Translation)
翻译 (translation) 是将 mRNA 上的 遗传密码 (genetic code) 解读为 氨基酸序列 (amino acid sequence) 的过程,最终合成蛋白质分子。这一过程在细胞质中的 核糖体 (ribosome) 上进行,需要多种 蛋白质因子 (protein factors) 和 能量分子 (energy molecules) 的参与。本节将详细解析翻译的起始、延伸和终止这三个主要阶段,以及参与翻译的关键组分,如核糖体、tRNA、mRNA 和翻译因子。
5.1.1 核糖体结构与功能 (Ribosome Structure and Function)
核糖体 (ribosome) 是蛋白质合成的分子机器,普遍存在于所有生物细胞中。它由 核糖体 RNA (ribosomal RNA, rRNA) 和 核糖体蛋白 (ribosomal protein) 组成,分为大小两个亚基:大亚基 (large subunit) 和 小亚基 (small subunit)。
① 核糖体的组成 (Ribosome Composition):
▮▮▮▮ⓐ rRNA: 核糖体的主要骨架成分是 rRNA,它不仅构成核糖体的结构支架,还具有重要的 催化活性 (catalytic activity)。在原核生物中,核糖体 rRNA 主要有 16S rRNA、23S rRNA 和 5S rRNA;在真核生物中,则有 18S rRNA、28S rRNA、5.8S rRNA 和 5S rRNA。其中,rRNA 的序列和结构在不同物种间高度保守,是系统发育研究的重要分子标记。
▮▮▮▮ⓑ 核糖体蛋白 (Ribosomal Proteins):核糖体蛋白分布在 rRNA 周围,与 rRNA 相互作用,共同维持核糖体的三维结构,并参与 mRNA 和 tRNA 的结合以及核糖体的组装。原核生物核糖体包含约 50 多种不同的蛋白质,真核生物核糖体则包含约 80 多种。
② 核糖体的亚基结构 (Ribosome Subunit Structure):
▮▮▮▮ⓐ 小亚基 (Small Subunit):小亚基主要负责 mRNA 的结合和密码子的识别。它包含一个 mRNA 结合位点和一个 tRNA 的 氨基酰-tRNA 位点 (Aminoacyl-tRNA site, A-site)。在原核生物中为 30S 亚基,主要由 16S rRNA 和约 21 种蛋白质组成;在真核生物中为 40S 亚基,主要由 18S rRNA 和约 33 种蛋白质组成。
▮▮▮▮ⓑ 大亚基 (Large Subunit):大亚基主要负责肽键的形成。它包含 tRNA 的 肽酰-tRNA 位点 (Peptidyl-tRNA site, P-site) 和 释放-tRNA 位点 (Exit site, E-site)。在原核生物中为 50S 亚基,主要由 23S rRNA、5S rRNA 和约 34 种蛋白质组成;在真核生物中为 60S 亚基,主要由 28S rRNA、5.8S rRNA、5S rRNA 和约 49 种蛋白质组成。
③ 核糖体 RNA 的催化活性 (Catalytic Activity of Ribosomal RNA):
▮▮▮▮ⓐ 核酶 (Ribozyme):早期研究认为蛋白质是细胞内主要的催化分子。然而,随着对 rRNA 结构和功能研究的深入,发现 rRNA 具有 核酶 (ribozyme) 的活性,即 rRNA 能够催化 肽键 (peptide bond) 的形成。23S rRNA (在真核生物中是 28S rRNA) 是大亚基中催化肽键形成的核心成分,被称为 肽基转移酶中心 (peptidyl transferase center)。这一发现颠覆了传统的 “蛋白质是唯一生物催化剂” 的观念,揭示了 RNA 在生命起源和进化中的重要作用。
④ 核糖体在蛋白质合成中的作用 (Role of Ribosome in Protein Synthesis):
▮▮▮▮ⓐ mRNA 的结合与解码 (mRNA Binding and Decoding):核糖体小亚基结合 mRNA,并沿着 mRNA 移动,读取 mRNA 上的密码子序列。
▮▮▮▮ⓑ tRNA 的结合与氨基酸的递送 (tRNA Binding and Amino Acid Delivery):核糖体通过 A-site、P-site 和 E-site 与 tRNA 相互作用。tRNA 携带特定的氨基酸进入核糖体,根据 mRNA 密码子的指令,将氨基酸添加到正在合成的肽链上。
▮▮▮▮ⓒ 肽键的形成 (Peptide Bond Formation):核糖体 rRNA 催化相邻氨基酸之间形成肽键,将氨基酸连接成多肽链。
▮▮▮▮ⓓ 核糖体的移位 (Ribosome Translocation):核糖体沿着 mRNA 移动,将 mRNA 密码子逐个解码,并不断延伸肽链。
▮▮▮▮ⓔ 蛋白质的释放 (Protein Release):当核糖体遇到 mRNA 上的 终止密码子 (stop codon) 时,翻译过程终止,核糖体释放合成完成的蛋白质和 mRNA。
总之,核糖体作为一个复杂的分子机器,在蛋白质合成中发挥着核心作用,它协调 mRNA、tRNA 和各种蛋白质因子之间的相互作用,高效、准确地完成基因的翻译过程。
5.1.2 tRNA 的作用 (Role of tRNA)
转移 RNA (transfer RNA, tRNA) 是一种小分子 RNA,在蛋白质合成中扮演着 适配器 (adaptor) 的角色。它一端携带特定的 氨基酸 (amino acid),另一端具有能够识别 mRNA 上 密码子 (codon) 的 反密码子 (anticodon) 序列。tRNA 的作用主要体现在以下几个方面:
① tRNA 的结构 (tRNA Structure):
▮▮▮▮ⓐ 三叶草结构 (Cloverleaf Structure):tRNA 的二级结构通常呈现为经典的三叶草形状,包含四个臂:氨基酸臂 (acceptor arm)、反密码子臂 (anticodon arm)、D 臂 (D arm) 和 TΨC 臂 (TΨC arm)。
▮▮▮▮ⓑ L 形三维结构 (L-shaped 3D Structure):tRNA 的三级结构折叠成 L 形,这种结构对于 tRNA 正确结合核糖体和参与翻译过程至关重要。
▮▮▮▮ⓒ 氨基酸臂 (Acceptor Arm):tRNA 的 3' 端 CCA 序列是 氨基酸 (amino acid) 的结合位点。特定的氨基酸通过 酯键 (ester bond) 连接到 tRNA 3' 端的腺苷酸 (adenosine) 的 2' 或 3' 羟基上。
▮▮▮▮ⓓ 反密码子臂 (Anticodon Arm):反密码子臂包含 反密码子 (anticodon) 序列,这是一个三核苷酸序列,能够与 mRNA 上的 密码子 (codon) 序列进行碱基配对,从而实现密码子的识别。
② 氨基酰-tRNA 合成酶的作用 (Role of Aminoacyl-tRNA Synthetases):
▮▮▮▮ⓐ 氨基酰-tRNA 合成酶 (Aminoacyl-tRNA synthetases, aaRS) 是一类酶,负责将特定的氨基酸正确连接到相应的 tRNA 上,形成 氨基酰-tRNA (aminoacyl-tRNA),也称为 带电 tRNA (charged tRNA)。这一过程称为 tRNA 的氨基酰化 (aminoacylation of tRNA) 或 tRNA 的充电 (charging of tRNA)。
▮▮▮▮ⓑ 高度特异性 (High Specificity):每种氨基酰-tRNA 合成酶只能识别一种氨基酸和一种或几种与之对应的 tRNA。氨基酰-tRNA 合成酶的 校对功能 (proofreading function) 能够确保氨基酸和 tRNA 之间配对的高度准确性,从而保证蛋白质合成的精确性。
▮▮▮▮ⓒ 两步反应 (Two-step Reaction):氨基酰-tRNA 合成酶催化的氨基酰化反应通常分为两步:
▮▮▮▮▮▮▮▮❷ 氨基酸首先与 ATP 反应,形成 氨基酰腺苷酸 (aminoacyl-AMP) 中间体,并释放焦磷酸 (pyrophosphate, PPi)。
\[ \text{Amino acid} + \text{ATP} + \text{aaRS} \rightleftharpoons \text{Aminoacyl-AMP-aaRS} + \text{PPi} \]
▮▮▮▮▮▮▮▮❷ 氨基酰-AMP 将氨基酸转移到 tRNA 的 3' 端,形成氨基酰-tRNA,并释放 AMP 和氨基酰-tRNA 合成酶。
\[ \text{Aminoacyl-AMP-aaRS} + \text{tRNA} \rightleftharpoons \text{Aminoacyl-tRNA} + \text{AMP} + \text{aaRS} \]
③ 密码子的识别 (Codon Recognition):
▮▮▮▮ⓐ 密码子-反密码子互作 (Codon-Anticodon Interaction):tRNA 通过其反密码子臂上的反密码子序列与 mRNA 上的密码子序列进行碱基配对,实现密码子的识别。这种配对通常遵循 沃森-克里克碱基配对原则 (Watson-Crick base pairing rule),即 A-U 配对,G-C 配对。
▮▮▮▮ⓑ 遗传密码的简并性 (Degeneracy of Genetic Code):由于 遗传密码 (genetic code) 具有 简并性 (degeneracy),即多个密码子可以编码同一个氨基酸,因此,细胞内 tRNA 的种类通常少于 61 种密码子的数量。
④ tRNA 的摆动性 (Wobble):
▮▮▮▮ⓐ 摆动碱基配对 (Wobble Base Pairing):摆动假说 (wobble hypothesis) 解释了 tRNA 如何识别多个简并密码子。该假说指出,密码子的前两个碱基与反密码子的配对严格遵循沃森-克里克碱基配对原则,而密码子的第三个碱基 (即 摆动位置 (wobble position)) 与反密码子的第一个碱基之间的配对可以有一定的灵活性,允许一些非标准的碱基配对,称为 摆动碱基配对 (wobble base pairing)。
▮▮▮▮ⓑ 常见的摆动碱基对 (Common Wobble Base Pairs):常见的摆动碱基对包括:
▮▮▮▮▮▮▮▮❷ G-U 配对:反密码子中的 G 可以与密码子中的 U 配对。
▮▮▮▮▮▮▮▮❸ 次黄嘌呤核苷 (Inosine, I) 配对:反密码子中的 I 可以与密码子中的 U、C 或 A 配对。次黄嘌呤核苷是 tRNA 中常见的修饰碱基。
通过摆动碱基配对,少量的 tRNA 种类就能够识别多种密码子,从而有效地完成蛋白质的翻译过程。tRNA 在蛋白质合成中起着至关重要的桥梁作用,它连接了遗传信息和蛋白质序列,保证了基因表达的准确实现。
5.1.3 翻译的起始 (Translation Initiation)
翻译起始 (translation initiation) 是蛋白质合成的第一个阶段,其主要任务是组装 翻译起始复合物 (translation initiation complex),将 起始 tRNA (initiator tRNA) 定位到 起始密码子 (start codon),并使核糖体准备好进行肽链的延伸。翻译起始是一个高度调控的过程,对基因表达的调控至关重要。
① 翻译起始复合物的形成 (Formation of Translation Initiation Complex):
▮▮▮▮ⓐ 原核生物的翻译起始 (Prokaryotic Translation Initiation):在原核生物中,翻译起始需要 起始因子 (initiation factors, IFs) 的辅助,主要包括 IF1、IF2 和 IF3。
▮▮▮▮▮▮▮▮❷ 30S 起始复合物 (30S initiation complex) 的形成:
▮▮▮▮▮▮▮▮⚝ IF1 和 IF3 结合到 30S 核糖体亚基上,防止 30S 亚基与 50S 亚基过早结合,并促进 mRNA 的结合。
▮▮▮▮▮▮▮▮⚝ mRNA 通过 核糖体结合序列 (ribosome binding site, RBS),也称为 Shine-Dalgarno 序列 (SD sequence),与 30S 亚基结合。SD 序列位于起始密码子 AUG 上游,与 16S rRNA 的 3' 端序列互补,引导核糖体正确识别起始位点。
▮▮▮▮▮▮▮▮⚝ 起始 tRNA (initiator tRNA),在原核生物中是 甲酰甲硫氨酰-tRNAfMet (fMet-tRNAfMet),与 IF2-GTP 复合物结合,进入 30S 亚基的 P-site。
▮▮▮▮▮▮▮▮❷ 70S 起始复合物 (70S initiation complex) 的形成:
▮▮▮▮▮▮▮▮⚝ 当 30S 起始复合物形成后,50S 核糖体亚基加入,形成完整的 70S 核糖体。
▮▮▮▮▮▮▮▮⚝ GTP 水解,IF1、IF2 和 IF3 释放,70S 起始复合物 (70S initiation complex) 组装完成,mRNA 和 fMet-tRNAfMet 正确就位,准备进入延伸阶段。
▮▮▮▮ⓑ 真核生物的翻译起始 (Eukaryotic Translation Initiation):真核生物的翻译起始过程更为复杂,需要更多的起始因子,统称为 eIFs (eukaryotic initiation factors),例如 eIF1、eIF1A、eIF2、eIF2B、eIF3、eIF4A、eIF4B、eIF4E、eIF4G、eIF5、eIF5B 和 eIF6 等。
▮▮▮▮▮▮▮▮❷ 43S 预起始复合物 (43S pre-initiation complex) 的形成:
▮▮▮▮▮▮▮▮⚝ eIF1、eIF1A 和 eIF3 结合到 40S 核糖体亚基上,防止 40S 亚基与 60S 亚基过早结合,并促进 mRNA 的结合。
▮▮▮▮▮▮▮▮⚝ 起始 tRNA (initiator tRNA),在真核生物中是 甲硫氨酰-tRNAMet (Met-tRNAMet),与 eIF2-GTP 复合物结合,形成 eIF2-GTP-Met-tRNAMet 三元复合物 (ternary complex)。
▮▮▮▮▮▮▮▮⚝ 三元复合物加入 40S 亚基,形成 43S 预起始复合物 (43S pre-initiation complex)。
▮▮▮▮▮▮▮▮❷ mRNA 的激活与 48S 起始复合物 (48S initiation complex) 的形成:
▮▮▮▮▮▮▮▮⚝ mRNA 的 5' 端 帽结构 (5' cap) 被 帽结合蛋白 (cap-binding protein) eIF4E 识别,eIF4G 作为支架蛋白,与 eIF4E、eIF4A 和 eIF4B 形成 eIF4F 复合物 (eIF4F complex)。eIF4F 复合物结合 mRNA,解开 mRNA 5' 端二级结构,激活 mRNA。
▮▮▮▮▮▮▮▮⚝ 43S 预起始复合物结合到 mRNA 的 5' 端,通过 核糖体扫描 (ribosomal scanning) 机制,沿着 mRNA 5'→3' 方向移动,寻找 起始密码子 AUG (start codon AUG)。
▮▮▮▮▮▮▮▮⚝ Kozak 序列 (Kozak sequence):真核生物 mRNA 起始密码子 AUG 周围的序列,符合 Kozak 共有序列 (5'-GCCRCCAUGG-3'),能够增强起始密码子 AUG 的识别效率。
▮▮▮▮▮▮▮▮⚝ 当 43S 预起始复合物扫描到起始密码子 AUG 时,eIF2 水解 GTP,43S 预起始复合物停留在起始密码子 AUG 位置,形成 48S 起始复合物 (48S initiation complex)。
▮▮▮▮▮▮▮▮❸ 60S 亚基的加入与 80S 起始复合物 (80S initiation complex) 的形成:
▮▮▮▮▮▮▮▮⚝ 60S 核糖体亚基在 eIF5B-GTP 的辅助下加入 48S 起始复合物,形成完整的 80S 核糖体。
▮▮▮▮▮▮▮▮⚝ GTP 水解,eIF5B 和其他起始因子释放,80S 起始复合物 (80S initiation complex) 组装完成,mRNA 和 Met-tRNAMet 正确就位,准备进入延伸阶段。
② 起始密码子 AUG 的识别 (Recognition of Start Codon AUG):
▮▮▮▮ⓐ 起始密码子 (Start Codon):起始密码子 (start codon) 通常是 AUG,编码 甲硫氨酸 (methionine, Met)。在 mRNA 序列中,第一个 AUG 通常被认为是起始密码子,决定了蛋白质的翻译起始位点和阅读框 (reading frame)。
▮▮▮▮ⓑ 起始 tRNA (Initiator tRNA):起始 tRNA (initiator tRNA) 与延伸阶段使用的 tRNAMet 不同。起始 tRNA 能够特异性地识别起始密码子 AUG,并在翻译起始阶段进入核糖体的 P-site。在原核生物中,起始 tRNA 是 fMet-tRNAfMet;在真核生物中,起始 tRNA 是 Met-tRNAMet。
▮▮▮▮ⓒ 起始密码子上下文序列 (Start Codon Context Sequence):起始密码子 AUG 周围的序列环境,如原核生物的 SD 序列和真核生物的 Kozak 序列,能够影响起始密码子 AUG 的识别效率和翻译起始的效率。
③ 起始 tRNA 的作用 (Role of Initiator tRNA):
▮▮▮▮ⓐ P-site 的占据 (P-site Occupancy):起始 tRNA 是唯一能够直接进入核糖体 P-site 的 tRNA。在翻译起始阶段,起始 tRNA 定位在 P-site,携带第一个氨基酸 (甲硫氨酸),为后续氨基酰-tRNA 进入 A-site 和肽链的延伸奠定基础。
▮▮▮▮ⓑ 阅读框的确定 (Reading Frame Determination):起始密码子 AUG 的正确识别和起始 tRNA 的正确就位,决定了 mRNA 的 阅读框 (reading frame)。阅读框一旦确定,后续的密码子将按照三联体的方式被连续读取,直至终止密码子出现。
④ 翻译起始的调控机制 (Regulation of Translation Initiation):
▮▮▮▮ⓐ eIF2α 磷酸化 (eIF2α Phosphorylation):eIF2α 的磷酸化是翻译起始调控的重要机制。当细胞处于应激状态,如营养缺乏、病毒感染等,eIF2α 激酶 (eIF2α kinase) 磷酸化 eIF2α,导致 eIF2-GTP-Met-tRNAMet 三元复合物的形成受阻,从而抑制整体翻译起始。
▮▮▮▮ⓑ 4E-BP 磷酸化 (4E-BP Phosphorylation):4E-BP (eIF4E-binding protein) 是一类抑制蛋白,能够结合 eIF4E,阻止 eIF4F 复合物的形成,从而抑制帽依赖性翻译起始。mTOR 信号通路 (mTOR signaling pathway) 激活时,磷酸化 4E-BP,使其与 eIF4E 解离,释放 eIF4E,促进帽依赖性翻译起始。
▮▮▮▮ⓒ uORF (Upstream Open Reading Frame):mRNA 5' 前导区 (5' UTR) 中存在的 上游开放阅读框 (upstream open reading frame, uORF) 能够影响下游主要开放阅读框 (main ORF) 的翻译起始。一些 uORF 的翻译可以抑制主 ORF 的翻译,从而实现翻译起始的调控。
翻译起始是一个复杂而精密的调控过程,确保了蛋白质合成在正确的时间、正确的地点、以正确的速率进行,对细胞的生长、发育和应激反应至关重要。
5.1.4 翻译的延伸 (Translation Elongation)
翻译延伸 (translation elongation) 是蛋白质合成的核心阶段,其主要任务是按照 mRNA 密码子的顺序,将氨基酸逐个添加到正在合成的肽链上,直至遇到终止密码子。翻译延伸是一个循环重复的过程,主要包括三个步骤:氨基酰-tRNA 的进入 (aminoacyl-tRNA entry)、肽键的形成 (peptide bond formation) 和 核糖体的移位 (ribosome translocation)。翻译延伸需要 延伸因子 (elongation factors, EFs) 的辅助。
① 氨基酰-tRNA 的进入 (Aminoacyl-tRNA Entry):
▮▮▮▮ⓐ EF-Tu (Elongation Factor Tu):在原核生物中,延伸因子 EF-Tu (elongation factor Tu) 结合 GTP,形成 EF-Tu-GTP 复合物。氨基酰-tRNA 与 EF-Tu-GTP 复合物结合,形成 氨基酰-tRNA-EF-Tu-GTP 三元复合物。
▮▮▮▮ⓑ eEF1A (Eukaryotic Elongation Factor 1A):在真核生物中,真核延伸因子 eEF1A (eukaryotic elongation factor 1A) 功能类似于 EF-Tu。氨基酰-tRNA-eEF1A-GTP 三元复合物将氨基酰-tRNA 递送到核糖体的 A-site。
▮▮▮▮ⓒ 密码子-反密码子匹配 (Codon-Anticodon Matching):当氨基酰-tRNA-EF-Tu-GTP (或氨基酰-tRNA-eEF1A-GTP) 进入核糖体 A-site 后,tRNA 的反密码子与 mRNA 的密码子进行碱基配对。如果配对正确,EF-Tu (或 eEF1A) 水解 GTP,变为 EF-Tu-GDP (或 eEF1A-GDP),并从核糖体上解离。如果配对不正确,氨基酰-tRNA 从 A-site 释放,等待下一个正确的氨基酰-tRNA 进入。
② 肽键的形成 (Peptide Bond Formation):
▮▮▮▮ⓐ 肽基转移酶中心 (Peptidyl Transferase Center):当正确的氨基酰-tRNA 进入 A-site 后,核糖体 rRNA (23S rRNA 或 28S rRNA) 的 肽基转移酶中心 (peptidyl transferase center) 催化肽键的形成。
▮▮▮▮ⓑ 肽基转移反应 (Peptidyl Transfer Reaction):肽基转移反应是指 P-site 上肽酰-tRNA 所携带的肽链 (或起始 tRNA 携带的甲硫氨酸) 的羧基与 A-site 上氨基酰-tRNA 所携带的氨基酸的氨基之间形成肽键。肽键形成后,P-site 上的肽链转移到 A-site 的 tRNA 上,A-site 上的 tRNA 变成肽酰-tRNA,而 P-site 上的 tRNA 变成去酰基 tRNA (deacylated tRNA)。
③ 核糖体的移位 (Ribosome Translocation):
▮▮▮▮ⓐ EF-G (Elongation Factor G):在原核生物中,延伸因子 EF-G (elongation factor G) 结合 GTP,参与核糖体的移位。
▮▮▮▮ⓑ eEF2 (Eukaryotic Elongation Factor 2):在真核生物中,真核延伸因子 eEF2 (eukaryotic elongation factor 2) 功能类似于 EF-G。EF-G-GTP (或 eEF2-GTP) 结合核糖体,GTP 水解,提供能量,驱动核糖体沿着 mRNA 移动一个密码子的距离。
▮▮▮▮ⓒ 移位过程 (Translocation Process):核糖体移位后,原来位于 A-site 的肽酰-tRNA 移动到 P-site,原来位于 P-site 的去酰基 tRNA 移动到 E-site,并最终从核糖体上释放,mRNA 上的下一个密码子进入 A-site,准备迎接下一个氨基酰-tRNA 的进入。
④ 延伸因子的作用 (Role of Elongation Factors):
▮▮▮▮ⓐ EF-Tu/eEF1A: 负责将氨基酰-tRNA 递送到核糖体 A-site,并参与密码子-反密码子配对的校对。
▮▮▮▮ⓑ EF-G/eEF2: 负责驱动核糖体在 mRNA 上的移位。
▮▮▮▮ⓒ EF-Ts/eEF1B: 负责 EF-Tu/eEF1A 的 GDP-GTP 交换,使其能够循环利用。
翻译延伸是一个高效、准确的循环过程,每完成一个循环,肽链就延伸一个氨基酸残基。延伸因子在这一过程中发挥着重要的辅助作用,保证了翻译的快速和精确进行。
5.1.5 翻译的终止 (Translation Termination)
翻译终止 (translation termination) 是蛋白质合成的最后一个阶段,当核糖体沿着 mRNA 移动到 终止密码子 (stop codon) 时,翻译过程终止,合成完成的蛋白质从核糖体上释放,核糖体解离,mRNA 也被释放。翻译终止需要 释放因子 (release factors, RFs) 的参与。
① 终止密码子的识别 (Recognition of Stop Codons):
▮▮▮▮ⓐ 终止密码子 (Stop Codons):终止密码子 (stop codons) 是 mRNA 上不编码氨基酸的三种密码子:UAA、UAG 和 UGA。当核糖体 A-site 上出现终止密码子时,没有 tRNA 能够识别并结合终止密码子。
② 释放因子的作用 (Role of Release Factors):
▮▮▮▮ⓐ 原核生物释放因子 (Prokaryotic Release Factors):原核生物中有三种释放因子:RF1、RF2 和 RF3。
▮▮▮▮▮▮▮▮❷ RF1: 识别终止密码子 UAA 和 UAG。
▮▮▮▮▮▮▮▮❸ RF2: 识别终止密码子 UAA 和 UGA。
▮▮▮▮▮▮▮▮❹ RF3-GTP: 促进 RF1 或 RF2 与核糖体的结合,并在肽链释放后促进 RF1 和 RF2 的释放。
▮▮▮▮ⓑ 真核生物释放因子 (Eukaryotic Release Factors):真核生物中有两种释放因子:eRF1 和 eRF3。
▮▮▮▮▮▮▮▮❷ eRF1: 识别所有三种终止密码子 UAA、UAG 和 UGA。eRF1 的结构模拟 tRNA,能够进入核糖体 A-site,识别终止密码子。
▮▮▮▮▮▮▮▮❸ eRF3-GTP: 促进 eRF1 的活性,并在肽链释放后促进核糖体的解离。
③ 肽链的释放 (Peptide Chain Release):
▮▮▮▮ⓐ 水解反应 (Hydrolysis Reaction):当释放因子 (RF1 或 RF2 或 eRF1) 结合到核糖体 A-site 的终止密码子时,肽基转移酶中心 (peptidyl transferase center) 的活性发生改变,催化水分子攻击 P-site 上肽酰-tRNA 的酯键,导致肽链从 tRNA 上水解释放。
④ 核糖体的解离和 mRNA 的释放 (Ribosome Dissociation and mRNA Release):
▮▮▮▮ⓐ 核糖体循环利用因子 (Ribosome Recycling Factor, RRF):在原核生物中,核糖体循环利用因子 RRF (ribosome recycling factor) 和 EF-G-GTP 参与核糖体的解离。RRF 模拟 tRNA 进入核糖体 A-site,与 EF-G-GTP 协同作用,促进 70S 核糖体解离成 30S 和 50S 亚基,释放 mRNA 和去酰基 tRNA,为下一轮翻译起始做准备。
▮▮▮▮ⓑ 真核生物核糖体解离 (Eukaryotic Ribosome Dissociation):真核生物核糖体的解离机制相对复杂,eRF3 和 ATP 酶 ABCE1 等因子参与 80S 核糖体的解离。
翻译终止标志着蛋白质合成的完成。释放因子的作用、肽链的水解释放以及核糖体的解离,确保了翻译过程的准确终止和核糖体的循环利用。
5.2 蛋白质的折叠、修饰与转运 (Protein Folding, Modification, and Transport)
新合成的多肽链从核糖体释放后,并不立即具有生物活性,还需要经历 蛋白质折叠 (protein folding)、翻译后修饰 (post-translational modification, PTM) 和 蛋白质转运 (protein transport) 等过程,才能形成正确的三维结构,获得特定的功能,并被运送到细胞内的正确位置。
5.2.1 蛋白质的折叠 (Protein Folding)
蛋白质折叠 (protein folding) 是指新合成的多肽链从无序的 随机卷曲 (random coil) 状态,通过一系列构象变化,最终形成具有特定三维结构的 天然构象 (native conformation) 的过程。蛋白质的天然构象通常是热力学上最稳定的构象,也是蛋白质发挥生物学功能的必要条件。
① 蛋白质的自发折叠 (Spontaneous Protein Folding):
▮▮▮▮ⓐ 热力学驱动 (Thermodynamic Driving Force):蛋白质的折叠过程主要由热力学驱动,目标是达到能量最低的天然构象。蛋白质的天然构象通常具有最低的 自由能 (free energy),体系趋向于自发地降低自由能。
▮▮▮▮ⓑ 疏水相互作用 (Hydrophobic Interactions):疏水相互作用 (hydrophobic interactions) 是蛋白质折叠的主要驱动力。疏水性氨基酸残基倾向于聚集在蛋白质内部,形成疏水核心,避免与水分子接触,从而降低体系的自由能。
▮▮▮▮ⓒ 氢键、离子键和范德华力 (Hydrogen Bonds, Ionic Bonds, and van der Waals Forces):氢键 (hydrogen bonds)、离子键 (ionic bonds) 和 范德华力 (van der Waals forces) 等非共价相互作用也参与稳定蛋白质的二级结构、三级结构和四级结构。
▮▮▮▮ⓓ 信息蕴含在氨基酸序列中 (Information Encoded in Amino Acid Sequence):蛋白质的氨基酸序列决定了其三维结构。Anfinsen 实验 (Anfinsen's experiment) 证明,在体外条件下,变性的核糖核酸酶 A (Ribonuclease A) 可以自发地重新折叠并恢复活性,表明蛋白质的天然构象完全由其氨基酸序列决定。
② 分子伴侣辅助折叠 (Chaperone-Assisted Protein Folding):
▮▮▮▮ⓐ 分子伴侣 (Molecular Chaperones):分子伴侣 (molecular chaperones) 是一类辅助蛋白质正确折叠的蛋白质,它们并不参与最终的天然构象的形成,而是通过与未折叠或错误折叠的蛋白质结合,防止蛋白质聚集和错误折叠,促进蛋白质正确折叠。
▮▮▮▮ⓑ Hsp70 系统 (Hsp70 System):Hsp70 (Heat shock protein 70) 是一类重要的分子伴侣,广泛存在于各种生物中。Hsp70 结合 ATP,能够与未折叠或部分折叠的蛋白质疏水区结合,防止蛋白质聚集。ATP 水解后,Hsp70 构象改变,促进蛋白质释放,并允许蛋白质尝试重新折叠。Hsp70 系统通常与 Hsp40 (Heat shock protein 40) 协同作用,Hsp40 负责将底物蛋白递送到 Hsp70。
▮▮▮▮ⓒ 伴侣蛋白 (Chaperonins):伴侣蛋白 (chaperonins) 是一类形成桶状结构的分子伴侣,为蛋白质折叠提供一个隔离的环境。GroEL/ES 系统 (GroEL/ES system) 是原核生物中典型的伴侣蛋白系统,TRiC/CCT 系统 (TRiC/CCT system) 是真核生物细胞质中的伴侣蛋白系统。未折叠的蛋白质进入伴侣蛋白的空腔中,在 ATP 水解的驱动下,伴侣蛋白经历构象变化,促进蛋白质在隔离环境中正确折叠。
③ 蛋白质错误折叠与疾病的关系 (Protein Misfolding and Diseases):
▮▮▮▮ⓐ 蛋白质错误折叠 (Protein Misfolding):在某些情况下,蛋白质可能无法正确折叠,形成 错误折叠蛋白 (misfolded protein)。错误折叠蛋白通常具有暴露的疏水区,容易发生聚集,形成 蛋白质聚集体 (protein aggregates)。
▮▮▮▮ⓑ 聚集相关疾病 (Aggregation-Associated Diseases):许多疾病与蛋白质错误折叠和聚集有关,称为 聚集相关疾病 (aggregation-associated diseases) 或 构象疾病 (conformational diseases)。例如:
▮▮▮▮▮▮▮▮❷ 阿尔茨海默病 (Alzheimer's disease):与 β-淀粉样蛋白 (β-amyloid) 和 tau 蛋白 (tau protein) 的错误折叠和聚集有关。
▮▮▮▮▮▮▮▮❸ 帕金森病 (Parkinson's disease):与 α-突触核蛋白 (α-synuclein) 的错误折叠和聚集有关。
▮▮▮▮▮▮▮▮❹ 亨廷顿病 (Huntington's disease):与 亨廷顿蛋白 (huntingtin protein) 的错误折叠和聚集有关。
▮▮▮▮▮▮▮▮❺ 朊病毒病 (Prion diseases):与 朊病毒蛋白 (prion protein, PrP) 的错误折叠和聚集有关。
细胞内存在 蛋白质质量控制系统 (protein quality control system),包括分子伴侣、泛素-蛋白酶体系统 (ubiquitin-proteasome system, UPS) 和 自噬-溶酶体途径 (autophagy-lysosome pathway) 等,负责监测蛋白质的折叠状态,辅助蛋白质正确折叠,清除错误折叠蛋白,维持细胞内蛋白质稳态。
5.2.2 蛋白质的翻译后修饰 (Post-translational Modifications, PTMs)
翻译后修饰 (post-translational modifications, PTMs) 是指蛋白质合成后,在氨基酸残基上发生的化学修饰。PTMs 能够改变蛋白质的结构、功能、定位和相互作用,是调控蛋白质功能和细胞信号通路的重要机制。PTMs 的种类繁多,常见的 PTMs 类型包括:
① 磷酸化 (Phosphorylation):
▮▮▮▮ⓐ 磷酸化酶 (Kinases) 和磷酸酶 (Phosphatases):磷酸化 (phosphorylation) 是最常见的 PTM 类型之一,指 蛋白激酶 (protein kinases) 催化 ATP 的 γ-磷酸基转移到蛋白质的 丝氨酸 (serine, Ser)、苏氨酸 (threonine, Thr) 或 酪氨酸 (tyrosine, Tyr) 残基的羟基上,形成磷酸酯键。蛋白磷酸酶 (protein phosphatases) 则催化磷酸基的水解去除,使蛋白质去磷酸化。磷酸化和去磷酸化是动态可逆的过程,调控蛋白质的活性和功能。
▮▮▮▮ⓑ 调控蛋白质活性 (Regulation of Protein Activity):磷酸化可以改变蛋白质的构象、电荷分布和相互作用,从而调控蛋白质的活性、酶活性、结合能力和定位。例如,许多酶的活性受磷酸化调控,信号转导通路 (signal transduction pathways) 中的许多关键蛋白都通过磷酸化进行调控。
② 糖基化 (Glycosylation):
▮▮▮▮ⓐ 糖基转移酶 (Glycosyltransferases) 和糖苷酶 (Glycosidases):糖基化 (glycosylation) 是指将 糖链 (glycan) 连接到蛋白质上的过程。糖基转移酶 (glycosyltransferases) 催化糖基的添加,糖苷酶 (glycosidases) 催化糖基的去除。糖基化主要分为 N-糖基化 (N-glycosylation) 和 O-糖基化 (O-glycosylation)。
▮▮▮▮ⓑ N-糖基化 (N-Glycosylation):糖链连接到 天冬酰胺 (asparagine, Asn) 残基的酰胺氮原子上,通常发生在内质网和高尔基体中。N-糖基化对蛋白质的折叠、稳定性、细胞识别和免疫应答等方面具有重要作用。
▮▮▮▮ⓒ O-糖基化 (O-Glycosylation):糖链连接到 丝氨酸 (Ser) 或 苏氨酸 (Thr) 残基的羟基上,发生在内质网、高尔基体和细胞质中。O-糖基化参与蛋白质的折叠、细胞信号转导和细胞间相互作用等过程。
③ 泛素化 (Ubiquitination):
▮▮▮▮ⓐ 泛素连接酶 (Ubiquitin Ligases) 和去泛素化酶 (Deubiquitinases):泛素化 (ubiquitination) 是指将 泛素 (ubiquitin, Ub) 小分子蛋白共价连接到 赖氨酸 (lysine, Lys) 残基上的过程。泛素连接酶 (ubiquitin ligases) 催化泛素的添加,去泛素化酶 (deubiquitinases, DUBs) 催化泛素的去除。泛素化是一个多步骤酶促反应,通常需要 E1 泛素激活酶 (E1 ubiquitin-activating enzyme)、E2 泛素结合酶 (E2 ubiquitin-conjugating enzyme) 和 E3 泛素连接酶 (E3 ubiquitin ligase) 的协同作用。
▮▮▮▮ⓑ 单泛素化和多泛素化 (Monoubiquitination and Polyubiquitination):泛素化可以是 单泛素化 (monoubiquitination),即只添加一个泛素分子;也可以是 多泛素化 (polyubiquitination),即连接多个泛素分子形成泛素链。不同类型的泛素化修饰具有不同的生物学功能。
▮▮▮▮ⓒ 蛋白质降解信号 (Signal for Protein Degradation):K48-连接的多泛素链 (K48-linked polyubiquitin chain) 是 泛素-蛋白酶体系统 (ubiquitin-proteasome system, UPS) 识别和降解靶蛋白的信号。泛素化是蛋白质降解的主要调控机制。
④ 乙酰化 (Acetylation) 和甲基化 (Methylation):
▮▮▮▮ⓐ 乙酰转移酶 (Acetyltransferases) 和去乙酰化酶 (Deacetylases):乙酰化 (acetylation) 是指将 乙酰基 (acetyl group) 添加到 赖氨酸 (Lys) 残基的氨基上的过程。乙酰转移酶 (acetyltransferases) 催化乙酰基的添加,去乙酰化酶 (deacetylases) 催化乙酰基的去除。组蛋白乙酰化 (histone acetylation) 是表观遗传调控的重要机制,影响染色质结构和基因表达。
▮▮▮▮ⓑ 甲基转移酶 (Methyltransferases) 和去甲基化酶 (Demethylases):甲基化 (methylation) 是指将 甲基 (methyl group) 添加到 赖氨酸 (Lys) 或 精氨酸 (arginine, Arg) 残基上的过程。甲基转移酶 (methyltransferases) 催化甲基的添加,去甲基化酶 (demethylases) 催化甲基的去除。组蛋白甲基化 (histone methylation) 也是表观遗传调控的重要机制,甲基化修饰可以激活或抑制基因表达,取决于修饰的氨基酸残基和甲基化的程度。
⑤ 其他 PTMs 类型 (Other PTM Types):除了上述常见的 PTMs 类型外,还有 酰基化 (acylation)、异戊烯化 (prenylation)、棕榈酰化 (palmitoylation)、肉豆蔻酰化 (myristoylation)、SUMO 化 (SUMOylation)、磷酸核糖基化 (ADP-ribosylation)、二硫键形成 (disulfide bond formation)、蛋白水解切割 (proteolytic cleavage) 等多种 PTMs 类型,每种 PTMs 类型都具有特定的酶催化机制和生物学功能。
PTMs 极大地扩展了蛋白质的功能多样性,使得有限的基因编码信息能够产生丰富多彩的蛋白质功能,参与调控细胞的各种生命活动。
5.2.3 蛋白质的转运 (Protein Transport)
蛋白质转运 (protein transport) 是指将新合成的蛋白质从合成部位 (细胞质核糖体或内质网核糖体) 运送到细胞内的正确位置,使其发挥功能的过程。蛋白质的目的地可以是细胞质、细胞核、内质网、高尔基体、溶酶体、线粒体、叶绿体、过氧化物酶体或细胞外。蛋白质的转运通常需要 信号肽 (signal peptide) 或 信号序列 (signal sequence) 的指导,以及 转运蛋白 (transporter proteins) 或 转运通道 (translocation channels) 的辅助。
① 蛋白质进入内质网 (Protein Transport into Endoplasmic Reticulum, ER):
▮▮▮▮ⓐ 内质网信号肽 (ER Signal Peptide):分泌蛋白、膜蛋白和溶酶体蛋白通常含有 内质网信号肽 (ER signal peptide),位于蛋白质 N-端,富含疏水性氨基酸残基。ER 信号肽是引导蛋白质进入内质网的信号。
▮▮▮▮ⓑ 信号识别颗粒 (Signal Recognition Particle, SRP):信号识别颗粒 (signal recognition particle, SRP) 是一种 RNA-蛋白质复合物,能够识别核糖体上正在合成的蛋白质的 ER 信号肽,并暂停翻译过程。
▮▮▮▮ⓒ SRP 受体 (SRP Receptor):SRP-核糖体-多肽链复合物与内质网膜上的 SRP 受体 (SRP receptor) 结合。
▮▮▮▮ⓓ 蛋白质转运通道 (Protein Translocation Channel):SRP 受体将核糖体递送到内质网膜上的 蛋白质转运通道 (protein translocation channel),也称为 Sec61 通道 (Sec61 channel)。Sec61 通道是一个由 Sec61α、Sec61β 和 Sec61γ 亚基组成的异三聚体复合物。
▮▮▮▮ⓔ 协同转运 (Cotranslational Translocation):翻译在内质网膜上继续进行,多肽链通过 Sec61 通道 协同转运 (cotranslational translocation) 进入内质网腔。ER 信号肽在进入内质网腔后通常被 信号肽酶 (signal peptidase) 切除。
▮▮▮▮ⓕ 膜蛋白的插入 (Membrane Protein Insertion):对于膜蛋白,Sec61 通道能够侧向打开,将膜蛋白的跨膜区 (transmembrane domain) 插入到内质网膜中。
② 蛋白质进入高尔基体 (Protein Transport into Golgi Apparatus):
▮▮▮▮ⓐ 从内质网到高尔基体的转运 (ER-to-Golgi Transport):从内质网进入高尔基体的蛋白质,通常先被包装到 COPII 囊泡 (COPII vesicles) 中,COPII 囊泡从内质网出芽,运输到 顺面高尔基网络 (cis-Golgi network, CGN),与 CGN 融合,将蛋白质释放到高尔基体。
▮▮▮▮ⓑ 高尔基体内的转运 (Intra-Golgi Transport):蛋白质在高尔基体内的不同 高尔基体囊泡 (Golgi cisternae) 之间转运,通常通过 顺向转运 (anterograde transport) 和 逆向转运 (retrograde transport) 两种方式。顺向转运从 CGN 到 反面高尔基网络 (trans-Golgi network, TGN),逆向转运从 TGN 到 CGN 或从高尔基体到内质网。高尔基体内的转运主要通过 COPI 囊泡 (COPI vesicles) 和 网格蛋白囊泡 (clathrin vesicles) 介导。
▮▮▮▮ⓒ 高尔基体的功能 (Functions of Golgi Apparatus):高尔基体是蛋白质加工和分选的重要场所,蛋白质在高尔基体中进行糖基化修饰、蛋白水解切割等加工,并根据不同的信号被分选到不同的目的地,如溶酶体、细胞膜或细胞外。
③ 蛋白质进入线粒体和叶绿体 (Protein Transport into Mitochondria and Chloroplasts):
▮▮▮▮ⓐ 线粒体前导序列 (Mitochondrial Presequence) 和叶绿体转运肽 (Chloroplast Transit Peptide):线粒体蛋白和叶绿体蛋白通常含有位于 N-端的 线粒体前导序列 (mitochondrial presequence) 或 叶绿体转运肽 (chloroplast transit peptide),富含正电荷氨基酸残基。这些信号序列引导蛋白质进入线粒体或叶绿体。
▮▮▮▮ⓑ TOM 和 TIM 复合物 (TOM and TIM Complexes):线粒体外膜上的 转运酶外膜 (translocase of the outer membrane, TOM) 复合物 和线粒体内膜上的 转运酶内膜 (translocase of the inner membrane, TIM) 复合物 协同作用,将蛋白质转运到线粒体基质或线粒体内膜。
▮▮▮▮ⓒ TOC 和 TIC 复合物 (TOC and TIC Complexes):叶绿体外膜上的 叶绿体外膜转运酶 (translocon at the outer chloroplast membrane, TOC) 复合物 和叶绿体内膜上的 叶绿体内膜转运酶 (translocon at the inner chloroplast membrane, TIC) 复合物 协同作用,将蛋白质转运到叶绿体基质、叶绿体内膜、类囊体膜或类囊体腔。
▮▮▮▮ⓓ 解折叠转运 (Unfolded Translocation):进入线粒体和叶绿体的蛋白质通常需要 解折叠 (unfolded) 状态才能通过转运通道。分子伴侣 (molecular chaperones) 如 Hsp70 参与维持蛋白质的解折叠状态,并在蛋白质进入目的细胞器后辅助蛋白质重新折叠。
④ 蛋白质进入细胞核 (Protein Transport into Nucleus):
▮▮▮▮ⓐ 核定位序列 (Nuclear Localization Signal, NLS):进入细胞核的蛋白质通常含有 核定位序列 (nuclear localization signal, NLS),富含碱性氨基酸残基,如赖氨酸和精氨酸。NLS 可以位于蛋白质的任何位置。
▮▮▮▮ⓑ 核孔复合物 (Nuclear Pore Complex, NPC):核孔复合物 (nuclear pore complex, NPC) 是细胞核膜上的大型通道,介导蛋白质和 RNA 等大分子进出细胞核。
▮▮▮▮ⓒ 核转运受体 (Nuclear Transport Receptors):核转运受体 (nuclear transport receptors),也称为 核输入蛋白 (importins) 和 核输出蛋白 (exportins),识别蛋白质的 NLS 或 核输出序列 (nuclear export signal, NES),介导蛋白质通过 NPC 的转运。核转运受体与 Ran GTP 酶 (Ran GTPase) 循环系统协同作用,驱动蛋白质的定向转运。
⑤ 蛋白质进入过氧化物酶体 (Protein Transport into Peroxisomes):
▮▮▮▮ⓐ 过氧化物酶体靶向信号 (Peroxisomal Targeting Signals, PTS):进入过氧化物酶体的蛋白质通常含有 过氧化物酶体靶向信号 (peroxisomal targeting signals, PTS),主要有 PTS1 (位于 C-端,序列为 Ser-Lys-Leu-COOH) 和 PTS2 (位于 N-端)。
▮▮▮▮ⓑ Pex 蛋白 (Peroxins):Pex 蛋白 (peroxins) 是一类参与过氧化物酶体生物发生和蛋白质转运的蛋白质。Pex5 受体识别 PTS1 信号,Pex7 受体识别 PTS2 信号,将蛋白质递送到过氧化物酶体膜上的 转运通道 (translocation channel)。
⑥ 蛋白质的细胞外分泌 (Protein Secretion):
▮▮▮▮ⓐ 经典分泌途径 (Classical Secretory Pathway):分泌蛋白通过 经典分泌途径 (classical secretory pathway),即 ER-Golgi 途径,转运到细胞外。分泌蛋白在内质网核糖体上合成,进入内质网腔,经过高尔基体的加工和分选,最终通过囊泡运输到细胞膜,与细胞膜融合,释放到细胞外。
▮▮▮▮ⓑ 非经典分泌途径 (Non-classical Secretory Pathway):一些蛋白质不含有 ER 信号肽,不能通过经典分泌途径分泌,而是通过 非经典分泌途径 (non-classical secretory pathway),也称为 非常规分泌途径 (unconventional secretory pathway),分泌到细胞外。非经典分泌途径的机制尚不完全清楚,可能涉及特殊的转运蛋白或膜转运机制。
蛋白质的转运是一个高度精确和复杂的细胞过程,确保了每种蛋白质能够到达其正确的作用位点,发挥特定的生物学功能。
5.2.4 蛋白质的降解 (Protein Degradation)
蛋白质降解 (protein degradation) 是细胞内清除不需要的、错误折叠的或受损蛋白质的过程,是维持细胞内蛋白质稳态 (proteostasis) 的重要组成部分。蛋白质降解主要通过两条途径进行:泛素-蛋白酶体系统 (ubiquitin-proteasome system, UPS) 和 自噬-溶酶体途径 (autophagy-lysosome pathway)。
① 泛素-蛋白酶体系统 (Ubiquitin-Proteasome System, UPS):
▮▮▮▮ⓐ 泛素化标记 (Ubiquitination Tagging):泛素-蛋白酶体系统 (ubiquitin-proteasome system, UPS) 主要负责降解细胞质和细胞核中的短寿命蛋白质和错误折叠蛋白。靶蛋白首先被 泛素化 (ubiquitination) 标记,即通过 E1、E2 和 E3 酶的协同作用,将泛素分子共价连接到靶蛋白的赖氨酸残基上,形成多泛素链。K48-连接的多泛素链 (K48-linked polyubiquitin chain) 是蛋白酶体识别和降解靶蛋白的信号。
▮▮▮▮ⓑ 26S 蛋白酶体 (26S Proteasome):26S 蛋白酶体 (26S proteasome) 是 UPS 的核心降解机器,是一种大型蛋白酶复合体,由 20S 核心颗粒 (20S core particle, CP) 和 19S 调节颗粒 (19S regulatory particle, RP) 组成。
▮▮▮▮▮▮▮▮❷ 20S 核心颗粒 (20S CP):具有蛋白酶活性,负责蛋白质的水解。20S CP 呈桶状结构,由 α 和 β 亚基交替排列的四个七聚环组成 (α7β7β7α7)。β 亚基具有蛋白酶活性,主要有 胰凝乳蛋白酶样活性 (chymotrypsin-like activity)、胰蛋白酶样活性 (trypsin-like activity) 和 肽酰谷氨酰水解酶样活性 (peptidylglutamyl-peptide hydrolyzing activity) 三种主要蛋白酶活性。
▮▮▮▮▮▮▮▮❸ 19S 调节颗粒 (19S RP):位于 20S CP 的两端,负责识别多泛素化标记的靶蛋白,解折叠靶蛋白,并将靶蛋白导入 20S CP 的降解腔中。19S RP 包含 泛素受体 (ubiquitin receptors)、ATP 酶 (ATPases) 和 去泛素化酶 (deubiquitinase, DUB) 等亚基。
▮▮▮▮ⓒ 降解过程 (Degradation Process):多泛素化标记的靶蛋白被 26S 蛋白酶体识别和结合,19S RP 的 ATP 酶利用 ATP 水解提供的能量,解折叠靶蛋白,并将解折叠的肽链导入 20S CP 的降解腔中。20S CP 的蛋白酶活性将肽链水解成短肽片段,释放到细胞质中,泛素分子被去泛素化酶回收,可以循环利用。
② 自噬-溶酶体途径 (Autophagy-Lysosome Pathway):
▮▮▮▮ⓐ 自噬 (Autophagy):自噬 (autophagy) 是一种细胞自噬机制,负责降解细胞内的大分子物质、细胞器和蛋白质聚集体。自噬主要分为 巨自噬 (macroautophagy)、微自噬 (microautophagy) 和 分子伴侣介导的自噬 (chaperone-mediated autophagy, CMA) 三种类型,其中巨自噬是最主要的形式。
▮▮▮▮ⓑ 巨自噬 (Macroautophagy):巨自噬的步骤包括:
▮▮▮▮▮▮▮▮❷ 自噬体的形成 (Autophagosome Formation):在细胞质中形成双层膜结构的 自噬体 (autophagosome),包裹需要降解的细胞组分。自噬体的形成过程复杂,需要 Atg 基因 (autophagy-related genes) 编码的 Atg 蛋白的参与。
▮▮▮▮▮▮▮▮❸ 自噬体与溶酶体的融合 (Autophagosome-Lysosome Fusion):自噬体与 溶酶体 (lysosome) 融合,形成 自噬溶酶体 (autolysosome)。
▮▮▮▮▮▮▮▮❹ 溶酶体酶的降解 (Lysosomal Degradation):溶酶体含有多种 酸性水解酶 (acid hydrolases),能够降解自噬体包裹的细胞组分,包括蛋白质、脂类、核酸和多糖等。降解产物被释放回细胞质,可以循环利用。
▮▮▮▮ⓒ 溶酶体 (Lysosome):溶酶体 (lysosome) 是细胞内的主要降解细胞器,含有多种酸性水解酶,如蛋白酶、核酸酶、脂肪酶、糖苷酶等,pH 值约为 4.5-5.0。溶酶体不仅参与自噬途径的降解,也参与 胞吞作用 (endocytosis) 途径的降解。
③ 蛋白质降解在细胞稳态和调控中的意义 (Significance of Protein Degradation in Cellular Homeostasis and Regulation):
▮▮▮▮ⓐ 清除错误折叠蛋白和受损蛋白 (Clearance of Misfolded and Damaged Proteins):蛋白质降解系统能够清除细胞内错误折叠蛋白、聚集蛋白和受损蛋白,防止蛋白质毒性聚集体的积累,维持细胞蛋白质稳态。
▮▮▮▮ⓑ 调控蛋白质水平 (Regulation of Protein Levels):蛋白质降解是调控细胞内蛋白质水平的重要机制。许多蛋白质的寿命受到严格调控,通过控制蛋白质的合成速率和降解速率,细胞可以快速响应内外环境的变化,调节细胞功能。例如,细胞周期蛋白 (cyclins) 和 细胞周期蛋白依赖性激酶抑制剂 (cyclin-dependent kinase inhibitors, CKIs) 的降解在细胞周期调控中发挥重要作用。
▮▮▮▮ⓒ 参与细胞信号通路调控 (Involvement in Cell Signaling Pathway Regulation):蛋白质降解参与调控多种细胞信号通路。例如,NF-κB 信号通路 (NF-κB signaling pathway) 的激活需要 IκB 抑制蛋白 (IκB inhibitory protein) 的泛素化降解;HIF-1α 信号通路 (HIF-1α signaling pathway) 的调控也与 HIF-1α 蛋白的泛素化降解有关。
蛋白质降解系统是细胞内重要的质量控制和调控系统,对于维持细胞的正常功能和生命活动至关重要。
5.3 翻译的调控 (Regulation of Translation)
翻译调控 (regulation of translation) 是指细胞调控蛋白质合成速率和效率的机制。与转录调控相比,翻译调控能够更加快速地响应细胞内外环境的变化,实现基因表达的快速调控。翻译调控可以在翻译起始、延伸和终止等各个阶段发生,其中 翻译起始调控 (regulation of translation initiation) 是最主要的调控环节。mRNA 结构、非编码 RNA 和细胞信号通路等多种因素都参与翻译调控。
5.3.1 翻译起始的调控 (Regulation of Translation Initiation)
翻译起始调控 (regulation of translation initiation) 是翻译调控的主要形式,通过调控翻译起始复合物的形成、起始密码子的识别和起始 tRNA 的结合等步骤,影响蛋白质的合成速率。常见的翻译起始调控机制包括 eIF2α 磷酸化、4E-BP 磷酸化和 uORF 介导的调控等。
① eIF2α 磷酸化 (eIF2α Phosphorylation):
▮▮▮▮ⓐ eIF2α 激酶 (eIF2α Kinases):eIF2α (eukaryotic initiation factor 2α) 是真核生物翻译起始因子 eIF2 的亚基之一,在翻译起始中发挥重要作用。eIF2α 激酶 (eIF2α kinases) 是一类蛋白激酶,能够磷酸化 eIF2α 的 Ser51 位点。哺乳动物细胞中主要有四种 eIF2α 激酶:
▮▮▮▮▮▮▮▮❷ PKR (Protein kinase RNA-activated):被双链 RNA 激活,参与抗病毒应答。
▮▮▮▮▮▮▮▮❸ PERK (PKR-like ER kinase):内质网应激传感器,参与未折叠蛋白应答 (unfolded protein response, UPR)。
▮▮▮▮▮▮▮▮❹ GCN2 (General control nonderepressible 2):氨基酸饥饿传感器,参与氨基酸饥饿应答。
▮▮▮▮▮▮▮▮❺ HRI (Heme-regulated inhibitor kinase):血红素饥饿传感器,参与血红素饥饿应答。
▮▮▮▮ⓑ 抑制 eIF2B 的活性 (Inhibition of eIF2B Activity):eIF2α 磷酸化后,增强 eIF2 与 eIF2B (eukaryotic initiation factor 2B) 的结合。eIF2B 负责催化 eIF2 的 GDP-GTP 交换,使其能够循环利用。磷酸化的 eIF2α 充当 eIF2B 的竞争性抑制剂,阻止 eIF2B 的 GDP-GTP 交换活性,导致细胞内 eIF2-GTP 浓度降低,抑制 eIF2-GTP-Met-tRNAMet 三元复合物的形成,从而抑制整体翻译起始。
▮▮▮▮ⓒ 应激反应 (Stress Response):eIF2α 磷酸化通常发生在细胞应激条件下,如病毒感染、内质网应激、氨基酸饥饿、血红素饥饿等。eIF2α 磷酸化介导的翻译抑制是一种保护性应答,能够减少细胞能量消耗,优先合成应激相关蛋白,帮助细胞度过应激时期。
② 4E-BP 磷酸化 (4E-BP Phosphorylation):
▮▮▮▮ⓐ 4E-BP (eIF4E-Binding Protein):4E-BP (eIF4E-binding protein) 是一类翻译抑制蛋白,能够结合 帽结合蛋白 eIF4E (cap-binding protein eIF4E),阻止 eIF4E 参与 eIF4F 复合物 (eIF4F complex) 的形成,从而抑制帽依赖性翻译起始。哺乳动物细胞中主要有三种 4E-BP:4E-BP1、4E-BP2 和 4E-BP3。
▮▮▮▮ⓑ mTOR 信号通路 (mTOR Signaling Pathway):mTOR (mammalian target of rapamycin) 信号通路是细胞生长和代谢调控的核心通路。mTOR 激酶能够磷酸化 4E-BP,磷酸化后的 4E-BP 与 eIF4E 的亲和力降低,从 eIF4E 上解离,释放 eIF4E,促进 eIF4F 复合物的形成,增强帽依赖性翻译起始。
▮▮▮▮ⓒ 营养和生长因子调控 (Nutrient and Growth Factor Regulation):营养充足和生长因子刺激条件下,mTOR 信号通路激活,4E-BP 磷酸化水平升高,促进蛋白质合成,促进细胞生长和增殖。营养缺乏和生长因子缺乏条件下,mTOR 信号通路抑制,4E-BP 去磷酸化,抑制蛋白质合成,减缓细胞生长。
③ uORF 介导的调控 (uORF-Mediated Regulation):
▮▮▮▮ⓐ uORF (Upstream Open Reading Frame):上游开放阅读框 (upstream open reading frame, uORF) 是指位于 mRNA 5' 前导区 (5' UTR) 中,位于主要开放阅读框 (main ORF) 上游的短的开放阅读框。许多 mRNA 的 5' UTR 中含有 uORF。
▮▮▮▮ⓑ 核糖体拥挤 (Ribosome Stalling):当核糖体翻译 uORF 时,可能会发生 核糖体拥挤 (ribosome stalling) 或 核糖体碰撞 (ribosome collision),导致下游主 ORF 的翻译起始受阻。
▮▮▮▮ⓒ 调控机制多样性 (Diversity of Regulatory Mechanisms):uORF 介导的翻译调控机制复杂多样,取决于 uORF 的位置、序列、翻译效率以及下游主 ORF 的特点。一些 uORF 的翻译可以抑制主 ORF 的翻译,另一些 uORF 的翻译则可以增强主 ORF 的翻译。uORF 介导的调控参与调控多种基因的表达,如转录因子、癌基因和生长因子等。
④ 其他翻译起始调控机制 (Other Mechanisms of Translation Initiation Regulation):除了上述常见的调控机制外,还有 mRNA 帽结构修饰 (mRNA cap modification)、mRNA 5' UTR 二级结构 (mRNA 5' UTR secondary structure)、起始密码子 AUG 周围序列环境 (start codon AUG context sequence) 等因素也能够影响翻译起始效率。
翻译起始调控是细胞调控基因表达的重要环节,能够快速响应细胞内外环境的变化,精细调节蛋白质合成,维持细胞的正常生理功能。
5.3.2 mRNA 结构与翻译调控 (mRNA Structure and Translational Control)
mRNA 结构 (mRNA structure),特别是 mRNA 5' 非翻译区 (5' UTR) 和 3' 非翻译区 (3' UTR) 的结构,能够影响 mRNA 的翻译效率和稳定性,从而实现翻译调控。mRNA 结构调控主要通过影响核糖体结合、翻译起始复合物形成和 mRNA 稳定性等环节进行。
① mRNA 5' UTR 结构 (mRNA 5' UTR Structure):
▮▮▮▮ⓐ 二级结构 (Secondary Structure):mRNA 5' UTR 区域可能形成复杂的 二级结构 (secondary structure),如发夹结构 (hairpin loop)、茎环结构 (stem-loop) 等。稳定的二级结构可以阻碍核糖体扫描和翻译起始复合物的组装,从而抑制翻译起始。
▮▮▮▮ⓑ IRES 元件 (Internal Ribosome Entry Site, IRES):内部核糖体进入位点 (internal ribosome entry site, IRES) 是一种特殊的 RNA 结构元件,通常位于 mRNA 5' UTR 区域,能够直接招募核糖体,启动翻译起始,而不需要依赖 mRNA 5' 端帽结构。IRES 介导的翻译起始称为 帽非依赖性翻译起始 (cap-independent translation initiation)。IRES 常见于病毒 mRNA 和一些细胞 mRNA 中,在细胞应激、细胞凋亡和病毒感染等条件下发挥重要作用。
② mRNA 3' UTR 结构 (mRNA 3' UTR Structure):
▮▮▮▮ⓐ RNA 结合蛋白结合位点 (RNA-Binding Protein Binding Sites):mRNA 3' UTR 区域富含 RNA 结合蛋白 (RNA-binding proteins, RBPs) 的结合位点。RBPs 与 3' UTR 结合,可以影响 mRNA 的稳定性、定位和翻译效率。一些 RBPs 能够增强翻译,另一些 RBPs 则能够抑制翻译。
▮▮▮▮ⓑ miRNA 结合位点 (miRNA Binding Sites):mRNA 3' UTR 区域含有 微小 RNA (microRNA, miRNA) 的结合位点,也称为 miRNA 反应元件 (miRNA response elements, MREs)。miRNA 通过与 MREs 结合,介导 mRNA 的降解或翻译抑制,实现基因表达的转录后调控。
③ mRNA 环化 (mRNA Circularization):
▮▮▮▮ⓐ eIF4E-eIF4G 相互作用 (eIF4E-eIF4G Interaction):mRNA 5' 端帽结构结合 eIF4E,3' 端 poly(A) 尾结合 poly(A) 结合蛋白 (poly(A)-binding protein, PABP)。eIF4G 作为支架蛋白,能够同时与 eIF4E 和 PABP 相互作用,形成 mRNA 环化结构 (mRNA circularization)。
▮▮▮▮ⓑ 增强翻译效率 (Enhancement of Translation Efficiency):mRNA 环化结构能够增强核糖体的循环利用,促进翻译起始的再启动,提高翻译效率。mRNA 环化结构也能够增强 mRNA 的稳定性,减少 mRNA 的降解。
④ mRNA 结构元件介导的翻译调控 (Translational Control Mediated by mRNA Structural Elements):
▮▮▮▮ⓐ 铁反应元件 (Iron Response Element, IRE):铁反应元件 (iron response element, IRE) 是一种特殊的 RNA 发夹结构,位于 铁蛋白 (ferritin) mRNA 的 5' UTR 和 转铁蛋白受体 (transferrin receptor, TfR) mRNA 的 3' UTR。铁调节蛋白 (iron regulatory protein, IRP) 能够结合 IRE,调控铁代谢相关基因的翻译和 mRNA 稳定性。在低铁条件下,IRP 结合铁蛋白 mRNA 的 5' UTR IRE,抑制铁蛋白 mRNA 的翻译;IRP 结合转铁蛋白受体 mRNA 的 3' UTR IRE,增强转铁蛋白受体 mRNA 的稳定性,促进转铁蛋白受体的合成,增加细胞对铁的摄取。
▮▮▮▮ⓑ 核糖体开关 (Riboswitch):核糖体开关 (riboswitch) 是一种位于 mRNA 5' UTR 区域的 RNA 结构元件,能够直接结合小分子配体,如代谢物、离子等,通过构象变化调控下游基因的翻译。核糖体开关是一种古老的基因表达调控机制,常见于细菌和植物中。
mRNA 结构元件在翻译调控中发挥着重要作用,通过与 RNA 结合蛋白、miRNA 和小分子配体等相互作用,精细调节基因的表达水平。
5.3.3 非编码 RNA 与翻译调控 (Non-coding RNAs and Translational Control)
非编码 RNA (non-coding RNAs, ncRNAs),特别是 微小 RNA (microRNA, miRNA) 和 长非编码 RNA (long non-coding RNA, lncRNA),在翻译调控中发挥着重要作用。miRNA 主要通过介导 mRNA 降解或翻译抑制来负调控基因表达,lncRNA 的调控机制则更加多样化,可以正调控或负调控基因表达。
① miRNA 介导的翻译抑制 (miRNA-Mediated Translational Repression):
▮▮▮▮ⓐ miRNA 的生物合成 (miRNA Biogenesis):miRNA 是一类小的非编码 RNA 分子,长度约为 21-25 个核苷酸。miRNA 由 miRNA 基因 (miRNA gene) 转录产生,经过 Drosha 酶 (Drosha enzyme) 和 Dicer 酶 (Dicer enzyme) 等酶的加工,最终形成成熟的 miRNA。
▮▮▮▮ⓑ RISC 复合物 (RNA-Induced Silencing Complex, RISC):成熟的 miRNA 与 AGO 蛋白 (Argonaute protein) 等蛋白结合,形成 RNA 诱导的沉默复合物 (RNA-induced silencing complex, RISC)。RISC 复合物中的 miRNA 作为引导 RNA,识别靶 mRNA 的 3' UTR 区域的 miRNA 反应元件 (miRNA response elements, MREs)。
▮▮▮▮ⓒ 翻译抑制机制 (Mechanisms of Translational Repression):当 miRNA 与 mRNA 的 MREs 完全或部分互补配对时,RISC 复合物可以介导靶 mRNA 的翻译抑制。miRNA 介导的翻译抑制机制尚不完全清楚,可能包括:
▮▮▮▮▮▮▮▮❷ 核糖体停滞 (Ribosome Stalling):RISC 复合物结合 mRNA,阻碍核糖体沿着 mRNA 移动,导致核糖体停滞,抑制翻译延伸。
▮▮▮▮▮▮▮▮❸ 翻译起始抑制 (Translation Initiation Repression):RISC 复合物干扰翻译起始复合物的组装,抑制翻译起始。
▮▮▮▮▮▮▮▮❹ mRNA 降解 (mRNA Degradation):在某些情况下,miRNA 与 mRNA 的 MREs 完全互补配对时,RISC 复合物可以介导靶 mRNA 的降解。
② lncRNA 介导的翻译调控 (lncRNA-Mediated Translational Control):
▮▮▮▮ⓐ lncRNA 的多样化功能 (Diverse Functions of lncRNAs):长非编码 RNA (long non-coding RNA, lncRNA) 是一类长度超过 200 个核苷酸的非编码 RNA 分子。lncRNA 的功能多样化,可以作为 支架 (scaffold),与 DNA、RNA 和蛋白质相互作用,参与调控基因表达的各个层面,包括转录调控、转录后调控和翻译调控。
▮▮▮▮ⓑ lncRNA 增强翻译 (lncRNA-Mediated Translational Enhancement):一些 lncRNA 可以与 mRNA 相互作用,增强 mRNA 的翻译效率。例如,lncRNA LINC00961 可以与 mRNA 结合,增强 mRNA 的稳定性,并促进 mRNA 的核糖体结合,从而增强 mRNA 的翻译。
▮▮▮▮ⓒ lncRNA 抑制翻译 (lncRNA-Mediated Translational Repression):另一些 lncRNA 则可以与 mRNA 或核糖体相互作用,抑制 mRNA 的翻译。例如,lncRNA antisense lncRNA 可以与 sense mRNA 形成 RNA-RNA 双链结构,阻碍核糖体的结合和翻译起始。lncRNA CYTOR 可以与核糖体结合,阻止核糖体与 mRNA 的结合,从而抑制整体翻译。
③ 其他非编码 RNA 的作用 (Roles of Other Non-coding RNAs):除了 miRNA 和 lncRNA 外,其他类型的非编码 RNA,如 tRNA 衍生片段 (tRNA-derived fragments, tRFs) 和 核糖体 RNA 衍生片段 (rRNA-derived fragments, rRFs),也可能参与翻译调控。
非编码 RNA 是一类重要的基因表达调控分子,通过与 mRNA、核糖体和蛋白质等相互作用,精细调节基因的翻译水平,参与调控细胞的各种生命活动。
5.3.4 细胞信号通路与翻译调控 (Cellular Signaling Pathways and Translational Control)
细胞信号通路 (cellular signaling pathways),如 mTOR 信号通路 (mTOR signaling pathway)、MAPK 信号通路 (MAPK signaling pathway) 和 应激反应通路 (stress response pathways) 等,能够整合细胞内外环境信号,通过调控翻译起始因子、延伸因子和 mRNA 结合蛋白等翻译机器组分的活性和表达水平,调控整体或特定 mRNA 的翻译,实现基因表达的快速调控。
① mTOR 信号通路 (mTOR Signaling Pathway):
▮▮▮▮ⓐ 营养和生长因子信号 (Nutrient and Growth Factor Signals):mTOR (mammalian target of rapamycin) 信号通路是细胞生长、代谢和增殖调控的核心通路,能够感受营养、生长因子、能量和应激等细胞内外环境信号。营养充足和生长因子刺激条件下,mTOR 信号通路激活。
▮▮▮▮ⓑ 下游靶点 (Downstream Targets):mTOR 信号通路的主要下游靶点包括 4E-BP (eIF4E-binding protein) 和 S6K1 (ribosomal protein S6 kinase 1)。mTOR 激酶磷酸化 4E-BP,释放 eIF4E,促进帽依赖性翻译起始;mTOR 激酶磷酸化 S6K1,激活 S6K1,S6K1 进一步磷酸化核糖体蛋白 S6 (ribosomal protein S6, rpS6),增强核糖体生物合成和翻译能力。
▮▮▮▮ⓒ 整体翻译增强 (Global Translation Enhancement):mTOR 信号通路激活后,能够增强整体翻译起始速率和翻译能力,促进蛋白质合成,促进细胞生长和增殖。mTOR 信号通路失调与多种疾病有关,如癌症、糖尿病和神经退行性疾病等。
② MAPK 信号通路 (MAPK Signaling Pathway):
▮▮▮▮ⓐ 生长因子和应激信号 (Growth Factor and Stress Signals):MAPK (mitogen-activated protein kinase) 信号通路是一类重要的细胞信号转导通路,能够响应生长因子、细胞因子、应激和炎症等多种细胞内外信号。MAPK 信号通路包括 ERK 信号通路 (ERK signaling pathway)、JNK 信号通路 (JNK signaling pathway) 和 p38 MAPK 信号通路 (p38 MAPK signaling pathway) 等。
▮▮▮▮ⓑ 翻译调控作用 (Translational Regulatory Roles):MAPK 信号通路能够通过多种机制调控翻译。例如,ERK 信号通路激活后,可以磷酸化 MNK1 (MAPK-interacting kinase 1),激活 MNK1,MNK1 进一步磷酸化 eIF4E,增强 eIF4E 的活性,促进帽依赖性翻译起始。p38 MAPK 信号通路激活后,可以磷酸化 MK2 (MAPK-activated protein kinase 2),激活 MK2,MK2 磷酸化 mRNA 结合蛋白 TTP (tristetraprolin),调控 TTP 对 mRNA 稳定性的影响,从而间接调控翻译。
③ 应激反应通路 (Stress Response Pathways):
▮▮▮▮ⓐ 细胞应激信号 (Cellular Stress Signals):细胞应激条件下,如内质网应激、氧化应激、热休克、营养饥饿和病毒感染等,细胞激活多种 应激反应通路 (stress response pathways),如 未折叠蛋白应答 (unfolded protein response, UPR)、氧化应激应答 (oxidative stress response) 和 热休克应答 (heat shock response) 等。
▮▮▮▮ⓑ 翻译抑制与应激蛋白合成 (Translational Repression and Stress Protein Synthesis):应激反应通路激活后,通常导致整体翻译抑制,减少细胞能量消耗,同时优先合成 应激蛋白 (stress proteins),如 热休克蛋白 (heat shock proteins, HSPs) 和 葡萄糖调节蛋白 (glucose-regulated proteins, GRPs) 等,帮助细胞应对应激,维持细胞存活。例如,内质网应激通路激活后,PERK 激酶磷酸化 eIF2α,导致整体翻译抑制,但同时选择性增强 ATF4 (activating transcription factor 4) mRNA 的翻译,ATF4 是一种转录因子,能够上调 UPR 相关基因的表达。
④ 细胞信号通路整合与翻译调控 (Integration of Cellular Signaling Pathways and Translational Control):细胞信号通路之间相互交叉,形成复杂的信号网络,共同调控翻译。翻译调控不仅受到细胞信号通路的调控,也反过来影响细胞信号通路的活性和信号传递。翻译调控与细胞生长、发育、代谢、应激反应和疾病发生等多种生物学过程密切相关。
细胞信号通路是翻译调控的重要上游调控因子,通过整合细胞内外环境信号,精细调节翻译机器的活性和功能,实现基因表达的快速和动态调控,维持细胞的稳态和适应性。
6. 基因表达的调控 (Regulation of Gene Expression)
本章系统讲解基因表达调控的各个层面,包括转录调控、RNA 加工调控、翻译调控和蛋白质水平调控,以及表观遗传调控和信号转导通路在基因表达调控中的作用。
6.1 转录水平的调控 (Transcriptional Regulation)
深入解析转录起始、延伸和终止阶段的调控机制,包括转录因子、顺式作用元件、染色质结构和表观遗传修饰在转录调控中的作用。
6.1.1 转录因子的作用机制 (Mechanisms of Transcription Factors)
转录因子 (Transcription Factor, TF) 是与 DNA 上的特定序列结合,从而调控基因转录的蛋白质。它们是基因表达调控网络中的核心组件,通过精细地控制基因的转录起始频率,最终决定细胞在不同时间、不同环境条件下的基因表达谱。
① 转录因子的结构域 (Domains of Transcription Factors)
转录因子通常具有模块化的结构,包含至少以下两个功能域:
▮▮▮▮ⓐ DNA 结合域 (DNA-binding domain, DBD):这是转录因子与 DNA 特异序列结合的关键区域。常见的 DNA 结合域类型包括:
⚝ 锌指结构 (Zinc finger):利用锌离子稳定蛋白质结构,形成能够插入 DNA 大沟的指状结构。例如,Sp1 家族转录因子。
⚝ 螺旋-转角-螺旋结构 (Helix-turn-helix, HTH):由两个 α 螺旋和一个连接它们的转角组成,其中一个螺旋(识别螺旋)插入 DNA 大沟。例如,原核生物的 CAP 蛋白和真核生物的同源异型结构域 (Homeodomain) 蛋白。
⚝ 螺旋-环-螺旋结构 (Helix-loop-helix, HLH):包含两个 α 螺旋,中间由一个环状结构连接。HLH 结构域通常介导二聚体的形成,增强 DNA 结合的特异性和稳定性。例如,Myc 家族转录因子。
⚝ 碱性螺旋-环-螺旋结构 (Basic helix-loop-helix, bHLH):在 HLH 结构的基础上,增加了一个富含碱性氨基酸的区域,直接参与 DNA 结合。例如,MyoD 和 bHLH-Zip 家族转录因子。
⚝ β 桶结构 (β-barrel):由反平行的 β 折叠形成桶状结构,参与 DNA 结合。例如,原核生物的 MetJ 阻遏蛋白。
▮▮▮▮ⓑ 激活域 (Activation domain, AD) 或 抑制域 (Repression domain, RD):这些结构域负责与其他蛋白质(如辅激活因子或辅抑制因子)相互作用,从而影响转录的活性。
⚝ 激活域:富含酸性氨基酸、谷氨酰胺或脯氨酸,能够招募 RNA 聚合酶复合体或染色质修饰酶,促进转录起始。
⚝ 抑制域:可以招募染色质重塑复合物或组蛋白去乙酰化酶 (Histone Deacetylase, HDAC),抑制转录起始。
② DNA 结合的特异性 (Specificity of DNA Binding)
转录因子通过其 DNA 结合域识别并结合 DNA 上的特定序列,这些序列通常是短的、简并的,称为 顺式作用元件 (cis-regulatory element)。DNA 结合的特异性主要由以下因素决定:
▮▮▮▮ⓐ DNA 结合域的结构:不同的 DNA 结合域具有不同的形状和化学性质,能够与特定 DNA 序列形成互补的相互作用,例如氢键、范德华力等。
▮▮▮▮ⓑ DNA 序列的特征:DNA 序列的碱基组成和排列方式决定了 DNA 分子的局部结构和化学性质,例如 DNA 大沟和小沟的宽度和深度,以及碱基的暴露程度。
▮▮▮▮ⓒ 辅助因子的参与:一些转录因子的 DNA 结合需要辅助因子的参与,这些辅助因子可以改变 DNA 的构象,或者增强转录因子与 DNA 的相互作用。
③ 激活与抑制功能 (Activation and Repression Functions)
转录因子结合到 DNA 后,可以通过多种机制激活或抑制基因的转录:
▮▮▮▮ⓐ 直接与 RNA 聚合酶复合体相互作用:一些激活型转录因子可以直接与 RNA 聚合酶 II (RNA Polymerase II, Pol II) 复合体中的组分(如 TFIID、 Mediator 复合物)相互作用,促进转录起始复合物的组装和 Pol II 的 recruitment。抑制型转录因子则可能干扰这些相互作用,阻止转录起始。
▮▮▮▮ⓑ 招募辅激活因子 (Coactivator) 或辅抑制因子 (Corepressor):转录因子可以作为平台,招募辅激活因子或辅抑制因子到启动子区域。
⚝ 辅激活因子:通常具有组蛋白乙酰转移酶 (Histone Acetyltransferase, HAT) 活性,能够乙酰化组蛋白,打开染色质结构,促进转录起始。一些辅激活因子也参与 RNA 聚合酶复合体的稳定和激活。
⚝ 辅抑制因子:通常具有组蛋白去乙酰化酶 (HDAC) 或组蛋白甲基转移酶 (Histone Methyltransferase, HMT) 活性,能够去乙酰化或甲基化组蛋白,关闭染色质结构,抑制转录起始。
▮▮▮▮ⓒ 影响染色质结构:一些转录因子可以直接或间接地影响染色质的结构,例如招募染色质重塑复合物 (Chromatin Remodeling Complex),改变核小体 (Nucleosome) 的位置和密度,从而影响 DNA 的可及性,调控转录。
④ 转录因子之间的协同作用与竞争作用 (Synergistic and Competitive Interactions)
基因的表达调控通常不是由单个转录因子决定的,而是多个转录因子协同作用的结果。转录因子之间可能存在协同作用和竞争作用:
▮▮▮▮ⓐ 协同作用 (Synergism):多个激活型转录因子可以共同作用于一个启动子或增强子区域,产生比单个转录因子单独作用更强的激活效果。协同作用的机制包括:
⚝ 协同结合 (Cooperative binding):一个转录因子的结合可以促进另一个转录因子的结合,增强总体 DNA 结合的强度和特异性。
⚝ 功能协同 (Functional synergy):不同的转录因子可能通过不同的机制激活转录,例如一个转录因子招募 HAT,另一个转录因子招募 Mediator,共同促进转录起始。
▮▮▮▮ⓑ 竞争作用 (Competition):不同的转录因子可能竞争结合同一个 DNA 结合位点,或者竞争招募相同的辅因子,从而产生抑制或拮抗效果。竞争作用的机制包括:
⚝ 位点竞争 (Site competition):激活型转录因子和抑制型转录因子竞争结合同一个 DNA 位点,抑制型转录因子的结合会阻止激活型转录因子的作用。
⚝ 辅因子竞争 (Cofactor competition):不同的转录因子竞争招募有限的辅因子资源,例如辅激活因子或辅抑制因子,从而影响基因的表达水平。
理解转录因子的作用机制是理解基因表达调控的核心。转录因子通过其结构域、DNA 结合特异性、激活与抑制功能,以及协同和竞争作用,精细地调控基因的转录,响应细胞内外的信号,维持细胞的正常功能和适应性。
6.1.2 顺式作用元件 (Cis-regulatory Elements)
顺式作用元件 (Cis-regulatory elements, CREs) 是 DNA 上的特定序列,能够调控邻近基因的转录。它们是转录因子结合的靶位点,也是基因表达调控的 顺式 组件,即它们的作用对象是同一 DNA 分子上的基因。
① 启动子 (Promoters)
启动子是基因转录起始位点 (Transcription Start Site, TSS) 上游的 DNA 区域,是 RNA 聚合酶 II (Pol II) 复合体结合和转录起始的核心区域。启动子通常包含以下元件:
▮▮▮▮ⓐ 核心启动子 (Core promoter):紧邻 TSS,包含 Pol II 复合体直接识别和结合的序列元件,例如:
⚝ TATA 盒 (TATA box):经典的核心启动子元件,位于 TSS 上游约 -25 到 -30 bp 处,是 TATA 结合蛋白 (TATA-binding protein, TBP) 结合的位点,对于精确定位转录起始位点至关重要。TATA 盒序列通常为 5'-TATAAA-3'。
⚝ 起始点选择子 (Initiator, Inr):位于 TSS 周围,富含嘧啶碱基,能够引导转录起始。Inr 序列通常为 5'-YYANWYY-3' (Y=嘧啶, N=任意碱基, W=A/T)。
⚝ 下游启动子元件 (Downstream promoter element, DPE):位于 TSS 下游约 +28 到 +32 bp 处,与 Inr 协同作用,在缺乏 TATA 盒的启动子中发挥重要作用。DPE 序列通常为 5'-RGWYV-3' (R=嘌呤, G=鸟嘌呤, W=A/T, Y=嘧啶, V=A/C/G)。
⚝ BRE 盒 (TFIIB recognition element, BRE):位于 TATA 盒上游或下游,是转录因子 TFIIB 结合的位点,参与转录起始复合物的稳定。
▮▮▮▮ⓑ 近端启动子区 (Proximal promoter region):位于核心启动子上游数百 bp 范围内,包含多种 近端顺式作用元件,例如:
⚝ CAAT 盒 (CAAT box):位于 TSS 上游约 -80 bp 处,是转录因子 CTF/NF-1 结合的位点,参与调控转录起始频率。CAAT 盒序列通常为 5'-GGCCAATCT-3'。
⚝ GC 盒 (GC box):位于 TSS 上游约 -110 bp 处,是转录因子 Sp1 结合的位点,参与调控管家基因 (Housekeeping gene) 的表达。GC 盒序列通常为 5'-GGGCGG-3'。
启动子的功能是招募 Pol II 复合体,确定转录起始位点,并提供基本的转录起始活性。不同基因的启动子结构和序列元件有所不同,导致其转录起始效率和调控方式的差异。
② 增强子 (Enhancers)
增强子是位于基因远端(上游或下游,甚至在内含子或其他基因区域)的 DNA 区域,能够增强启动子的转录活性,提高基因的表达水平。增强子具有以下特点:
▮▮▮▮ⓐ 位置和方向的灵活性:增强子可以在基因的远端发挥作用,距离启动子可达数 kb 甚至 Mb。增强子的作用方向也具有灵活性,可以上游或下游,甚至反向作用于启动子。
▮▮▮▮ⓑ 多重转录因子结合位点:增强子通常包含多个转录因子结合位点,这些转录因子协同作用,增强转录活性。增强子上的转录因子谱决定了增强子的活性和调控特异性。
▮▮▮▮ⓒ 染色质状态的调控:增强子区域通常具有开放的染色质状态,富含组蛋白乙酰化修饰和 H3K4me1 修饰,缺乏 DNA 甲基化修饰。增强子的激活与染色质重塑和组蛋白修饰密切相关。
增强子的作用机制尚不完全清楚,目前认为主要通过以下方式实现:
⚝ DNA 环化 (DNA looping):增强子与启动子之间形成 DNA 环,将增强子上的激活因子带到启动子附近,促进转录起始。Mediator 复合物被认为在 DNA 环化过程中发挥重要作用。
⚝ 转录工厂 (Transcription factory):增强子和启动子可能在细胞核内形成 转录工厂,聚集转录机器和相关调控因子,提高转录效率。
增强子是基因表达调控的重要元件,介导基因对发育信号、环境刺激和细胞类型特异性信号的响应。增强子的异常功能与多种疾病,包括癌症和发育障碍,密切相关。
③ 沉默子 (Silencers)
沉默子是与增强子功能相反的 DNA 区域,能够抑制启动子的转录活性,降低基因的表达水平。沉默子也具有位置和方向的灵活性,可以位于基因的远端。沉默子的特点包括:
▮▮▮▮ⓐ 抑制转录起始:沉默子上的结合的 抑制型转录因子 能够干扰转录起始复合物的组装,阻止 RNA 聚合酶的 recruitment,从而抑制转录起始。
▮▮▮▮ⓑ 招募辅抑制因子:沉默子上的抑制型转录因子可以招募辅抑制因子,例如 HDAC 和 HMT,导致染色质的 关闭 (closed) 状态,抑制基因的表达。
▮▮▮▮ⓒ 与增强子竞争:沉默子可能与增强子竞争相同的调控资源,例如转录因子或辅因子,从而拮抗增强子的激活作用。
沉默子在基因表达的 负调控 中发挥重要作用,例如在细胞分化过程中,沉默特定基因的表达,维持细胞类型的特异性。沉默子的功能异常也可能导致疾病的发生。
④ 绝缘子 (Insulators)
绝缘子是 DNA 上的特殊序列,能够阻止增强子对非靶基因的激活作用,或者阻止染色质区域之间的相互干扰,从而维持基因表达的 区域特异性。绝缘子主要通过以下两种机制发挥作用:
▮▮▮▮ⓐ 增强子阻断活性 (Enhancer-blocking activity):当绝缘子位于增强子和启动子之间时,能够阻止增强子对该启动子的激活作用,但对其他启动子没有影响。这种机制可以防止增强子 串扰 (crosstalk),确保增强子只激活靶基因的表达。
▮▮▮▮ⓑ 染色质屏障活性 (Chromatin barrier activity):绝缘子可以作为染色质区域之间的屏障,阻止 异染色质 (heterochromatin) 的蔓延,维持 常染色质 (euchromatin) 区域的开放状态,保证基因的正常表达。
绝缘子通常与 CTCF (CCCTC-binding factor) 蛋白结合,CTCF 是一种高度保守的锌指转录因子,在基因组中广泛分布,参与染色质高级结构的组织和基因表达调控。绝缘子在基因组的三维结构组织和基因表达的精确调控中发挥重要作用。
顺式作用元件是基因表达调控的 蓝图,它们与转录因子相互作用,精细地控制基因的转录起始、增强、抑制和区域特异性,最终决定细胞的基因表达模式和功能状态。对顺式作用元件的深入研究,有助于理解基因表达调控的复杂性和多样性,揭示疾病发生的分子机制。
6.1.3 染色质结构与转录调控 (Chromatin Structure and Transcriptional Regulation)
染色质 (Chromatin) 是真核细胞中 DNA 与蛋白质(主要是组蛋白)形成的复合体。染色质的结构状态直接影响 DNA 的可及性,从而调控基因的转录。染色质结构与转录调控之间存在密切的相互作用。
① 染色质的开放状态与关闭状态 (Open and Closed Chromatin States)
染色质可以分为两种基本状态:
▮▮▮▮ⓐ 开放染色质 (Open chromatin) 或 常染色质 (Euchromatin):这种状态下的染色质结构 松散,DNA 可及性高,转录因子和 RNA 聚合酶容易接近 DNA,基因转录活跃。开放染色质的特点包括:
⚝ 核小体密度低:核小体排列稀疏,DNA 暴露程度高。
⚝ 组蛋白修饰:富含 激活性 组蛋白修饰,例如组蛋白乙酰化 (Histone acetylation, HAc) 和 H3K4 三甲基化 (H3K4me3)。
⚝ DNA 甲基化水平低:CpG 岛 (CpG island) 通常 非甲基化。
⚝ DNA 酶敏感性高:对 DNA 酶 (DNase I) 敏感,容易被酶切。
▮▮▮▮ⓑ 关闭染色质 (Closed chromatin) 或 异染色质 (Heterochromatin):这种状态下的染色质结构 紧密,DNA 可及性低,转录因子和 RNA 聚合酶难以接近 DNA,基因转录受到抑制或沉默。关闭染色质的特点包括:
⚝ 核小体密度高:核小体排列紧密,DNA 暴露程度低。
⚝ 组蛋白修饰:富含 抑制性 组蛋白修饰,例如 H3K9 三甲基化 (H3K9me3) 和 H3K27 三甲基化 (H3K27me3)。
⚝ DNA 甲基化水平高:CpG 岛可能 甲基化。
⚝ DNA 酶敏感性低:对 DNA 酶 (DNase I) 不敏感,难以被酶切。
染色质的开放与关闭状态是动态可变的,受到多种因素的调控,包括染色质重塑复合物、组蛋白修饰和 DNA 甲基化。
② 染色质重塑复合物 (Chromatin Remodeling Complexes)
染色质重塑复合物是一类利用 ATP 水解能量,改变核小体位置和结构的蛋白质机器。它们能够 滑动 (slide)、弹出 (eject) 或 替换 (replace) 核小体,从而改变 DNA 的可及性,调控基因的转录。主要的染色质重塑复合物家族包括:
▮▮▮▮ⓐ SWI/SNF 家族:通过滑动或弹出核小体,打开染色质结构,促进转录激活。例如,SWI/SNF 复合物在基因激活、细胞分化和肿瘤发生中发挥重要作用。
▮▮▮▮ⓑ ISWI 家族:主要通过滑动核小体,规则化核小体的排列,抑制转录。例如,ISWI 复合物参与染色质的致密化和基因沉默。
▮▮▮▮ⓒ NuRD/Mi-2/CHD 家族:具有 HDAC 活性,能够去乙酰化组蛋白,关闭染色质结构,抑制转录。例如,NuRD 复合物参与基因沉默和细胞分化。
▮▮▮▮ⓓ INO80 家族:具有多种染色质重塑活性,包括核小体滑动、替换和 DNA 双链断裂修复。例如,INO80 复合物参与 DNA 损伤修复和转录调控。
染色质重塑复合物的 recruitment 通常由转录因子引导,它们与转录因子协同作用,精细地调控染色质结构和基因表达。
③ 组蛋白修饰 (Histone Modifications)
组蛋白修饰是指组蛋白氨基末端尾巴 (N-terminal tail) 上的共价修饰,包括乙酰化、甲基化、磷酸化、泛素化等。组蛋白修饰能够改变染色质的物理化学性质,影响染色质结构和基因转录。常见的组蛋白修饰及其功能包括:
▮▮▮▮ⓐ 组蛋白乙酰化 (Histone acetylation, HAc):由 HAT 催化,将乙酰基 (acetyl group) 添加到赖氨酸残基上,中和赖氨酸的正电荷,减弱组蛋白与 DNA 的相互作用,打开染色质结构,促进转录激活。H3K9ac 和 H3K27ac 是典型的激活性乙酰化修饰。
▮▮▮▮ⓑ 组蛋白去乙酰化 (Histone deacetylation, HDAC):由 HDAC 催化,去除组蛋白上的乙酰基,增强组蛋白与 DNA 的相互作用,关闭染色质结构,抑制转录。HDAC 抑制剂 (HDAC inhibitor) 是一类重要的抗肿瘤药物。
▮▮▮▮ⓒ 组蛋白甲基化 (Histone methylation, HMe):由 HMT 催化,将甲基 (methyl group) 添加到赖氨酸或精氨酸残基上。组蛋白甲基化具有双重功能,既可以激活转录,也可以抑制转录,取决于甲基化的位点和程度。
⚝ 激活性甲基化:例如 H3K4me3 和 H3K79me3,通常与转录激活相关,富集在活跃基因的启动子和编码区。
⚝ 抑制性甲基化:例如 H3K9me3 和 H3K27me3,通常与转录抑制相关,富集在沉默基因和异染色质区域。H3K27me3 是 Polycomb Repressive Complex 2 (PRC2) 催化的修饰,参与基因沉默和发育调控。
▮▮▮▮ⓓ 其他组蛋白修饰:例如组蛋白磷酸化 (Histone phosphorylation, HPh) 和组蛋白泛素化 (Histone ubiquitination, HUb),也参与转录调控、DNA 损伤修复和染色体分离等过程。
组蛋白修饰之间存在复杂的 串扰 (crosstalk) 现象,一种修饰可以影响另一种修饰的发生和功能。组蛋白修饰的 组合模式 (combinatorial pattern) 决定了染色质状态和基因表达的精细调控。
④ DNA 甲基化 (DNA Methylation)
DNA 甲基化是指在 DNA 序列的胞嘧啶 (Cytosine, C) 碱基的 5 位碳原子上添加甲基 (methyl group) 的修饰,主要发生在 CpG 二核苷酸序列中。DNA 甲基化通常与基因沉默相关,尤其是在启动子 CpG 岛区域。DNA 甲基化的机制和功能包括:
▮▮▮▮ⓐ DNA 甲基转移酶 (DNA Methyltransferase, DNMT):DNMT 是一类催化 DNA 甲基化的酶,哺乳动物细胞中主要有 DNMT1、DNMT3A 和 DNMT3B。
⚝ DNMT1:是 维持性 甲基转移酶,主要在 DNA 复制过程中,将亲代链上的甲基化模式 复制 到子代链上,维持 DNA 甲基化模式的 遗传性。
⚝ DNMT3A 和 DNMT3B:是 从头 甲基转移酶,能够建立新的 DNA 甲基化模式,在发育早期和细胞分化过程中发挥重要作用。
▮▮▮▮ⓑ DNA 甲基化与基因沉默:启动子 CpG 岛的甲基化通常与基因沉默相关。甲基化的 CpG 可以招募 甲基 CpG 结合域蛋白 (Methyl-CpG-binding domain protein, MBD),例如 MeCP2 和 MBD1,MBD 蛋白进一步招募辅抑制因子,例如 HDAC 和 NuRD 复合物,导致染色质致密化和转录抑制。
▮▮▮▮ⓒ DNA 去甲基化 (DNA Demethylation):DNA 甲基化是可逆的,DNA 去甲基化酶 (DNA Demethylase) 能够去除 DNA 上的甲基修饰,恢复基因的表达。哺乳动物细胞中主要的 DNA 去甲基化酶是 TET (Ten-eleven translocation) 酶家族,TET 酶催化 5-甲基胞嘧啶 (5mC) 氧化为 5-羟甲基胞嘧啶 (5hmC),5hmC 可以进一步被胸腺嘧啶 DNA 糖基化酶 (Thymine DNA glycosylase, TDG) 识别和去除,最终通过碱基切除修复 (Base Excision Repair, BER) 途径完成 DNA 去甲基化。
DNA 甲基化在基因印记 (Genomic imprinting)、X 染色体失活 (X-chromosome inactivation)、发育调控和肿瘤发生等过程中发挥重要作用。DNA 甲基化模式的异常改变与多种疾病,包括癌症和神经发育障碍,密切相关。
染色质结构是基因表达调控的重要层面,染色质的开放与关闭状态、染色质重塑、组蛋白修饰和 DNA 甲基化等因素相互作用,共同决定基因的转录活性。理解染色质结构与转录调控的关系,有助于深入认识基因表达调控的复杂性和精细性,揭示表观遗传调控在生命活动和疾病发生中的作用。
6.1.4 表观遗传调控 (Epigenetic Regulation)
表观遗传调控 (Epigenetic regulation) 是指不涉及 DNA 序列改变,但能够 可遗传 地改变基因表达的调控机制。表观遗传修饰包括 DNA 甲基化、组蛋白修饰和非编码 RNA 介导的调控等。表观遗传调控在发育、疾病和遗传中具有重要意义。
① DNA 甲基化与表观遗传 (DNA Methylation and Epigenetics)
DNA 甲基化是最早被发现和研究的表观遗传修饰之一。DNA 甲基化模式可以在细胞分裂过程中 复制 和 传递,从而实现基因表达的 代际遗传。DNA 甲基化在表观遗传调控中发挥重要作用:
▮▮▮▮ⓐ 基因印记 (Genomic imprinting):基因印记是一种 亲本来源特异性 的基因表达调控现象,即某些基因的表达只取决于其亲本来源,而与自身序列无关。基因印记的建立和维持主要依赖于 DNA 甲基化。例如,某些印记基因在父本来源的染色体上甲基化,导致沉默,而在母本来源的染色体上非甲基化,正常表达,反之亦然。基因印记在胚胎发育和个体生长中发挥重要作用。
▮▮▮▮ⓑ X 染色体失活 (X-chromosome inactivation):在雌性哺乳动物细胞中,两条 X 染色体中的一条随机失活,以实现剂量补偿效应,避免女性表达过多的 X 染色体基因。X 染色体失活的启动和维持也与 DNA 甲基化密切相关。失活的 X 染色体 (Xi) 上的 CpG 岛高度甲基化,导致染色质致密化和基因沉默。
▮▮▮▮ⓒ 发育调控 (Developmental regulation):DNA 甲基化模式在胚胎发育过程中动态变化,参与调控细胞分化和组织器官形成。例如,多能干细胞 (Pluripotent stem cell) 的基因组 DNA 甲基化水平较低,随着细胞分化,DNA 甲基化水平逐渐升高,特定基因的启动子 CpG 岛甲基化,导致基因沉默,细胞类型特异性基因表达模式建立。
▮▮▮▮ⓓ 疾病发生 (Disease development):DNA 甲基化模式的异常改变与多种疾病,包括癌症、神经发育障碍和自身免疫性疾病,密切相关。
⚝ 癌症:肿瘤细胞中 DNA 甲基化模式发生广泛紊乱,表现为 整体低甲基化 (global hypomethylation) 和 局部高甲基化 (regional hypermethylation)。整体低甲基化可能导致基因组不稳定和癌基因激活,局部高甲基化,特别是肿瘤抑制基因启动子 CpG 岛的高甲基化,导致肿瘤抑制基因沉默,促进肿瘤发生发展。
⚝ 神经发育障碍:例如 Rett 综合征和 Angelman 综合征,与 DNA 甲基化调控基因的突变或功能异常有关。
② 组蛋白修饰与表观遗传 (Histone Modifications and Epigenetics)
组蛋白修饰也是重要的表观遗传修饰,组蛋白修饰模式同样可以在细胞分裂过程中 传递,影响基因表达的 代际遗传。组蛋白修饰在表观遗传调控中发挥重要作用:
▮▮▮▮ⓐ 染色质状态的记忆 (Memory of chromatin states):特定的组蛋白修饰模式可以 标记 染色质区域的状态,例如激活性修饰 (H3K4me3, H3K9ac) 标记开放染色质,抑制性修饰 (H3K9me3, H3K27me3) 标记关闭染色质。这些修饰模式可以在细胞分裂过程中 传递 给子代细胞,维持染色质状态的 记忆。
▮▮▮▮ⓑ 基因表达的稳定遗传 (Stable inheritance of gene expression):组蛋白修饰模式与 DNA 甲基化模式相互协同,共同维持基因表达的稳定遗传。例如,H3K27me3 修饰与 DNA 甲基化协同作用,维持基因的长期沉默。
▮▮▮▮ⓒ 细胞命运决定 (Cell fate determination):组蛋白修饰模式在细胞命运决定过程中发挥重要作用。例如,在细胞分化过程中,特定基因的启动子区域富集激活性组蛋白修饰,促进基因表达,决定细胞的类型特异性。
▮▮▮▮ⓓ 表观遗传疾病 (Epigenetic diseases):组蛋白修饰酶的突变或功能异常,以及组蛋白修饰模式的紊乱,与多种疾病,包括癌症、发育障碍和神经退行性疾病,密切相关。例如,MLL 基因融合导致 H3K4 甲基转移酶功能异常,是白血病发生的重要原因。
③ 非编码 RNA 与表观遗传 (Non-coding RNAs and Epigenetics)
非编码 RNA (non-coding RNA, ncRNA) 是一类不编码蛋白质的 RNA 分子,包括 miRNA、siRNA、lncRNA 等。一些 ncRNA 参与表观遗传调控,例如:
▮▮▮▮ⓐ miRNA 和 siRNA 介导的 RNA 沉默 (RNA silencing mediated by miRNA and siRNA):miRNA 和 siRNA 可以引导 RNA 诱导沉默复合体 (RNA-induced silencing complex, RISC) 靶向 mRNA,导致 mRNA 降解或翻译抑制,实现基因表达的 转录后沉默。miRNA 和 siRNA 在基因表达调控、发育调控和基因组防御中发挥重要作用。
▮▮▮▮ⓑ lncRNA 介导的表观遗传调控 (Epigenetic regulation mediated by lncRNA):长非编码 RNA (long non-coding RNA, lncRNA) 是一类长度超过 200 nt 的 ncRNA。一些 lncRNA 能够与染色质修饰酶复合体相互作用,引导复合体靶向特定基因组区域,调控基因的转录和染色质状态。例如:
⚝ Xist RNA:是 X 染色体失活的关键调控因子,Xist RNA 转录后 覆盖 在 Xi 染色体上,招募 PRC2 复合物,催化 H3K27me3 修饰,导致 Xi 染色体致密化和基因沉默。
⚝ HOTAIR RNA:能够与 PRC2 复合物相互作用,引导 PRC2 靶向基因组特定区域,介导基因沉默。HOTAIR 在发育调控和肿瘤转移中发挥重要作用。
非编码 RNA 介导的表观遗传调控,为基因表达调控增加了新的维度,参与多种生物学过程和疾病发生。
表观遗传调控是基因表达调控的重要组成部分,DNA 甲基化、组蛋白修饰和非编码 RNA 介导的调控机制相互协同,共同决定基因表达的 可遗传性 和 稳定性。表观遗传调控在发育、疾病和遗传中具有重要意义,对表观遗传调控的深入研究,有助于理解生命活动的复杂性和多样性,揭示疾病发生的表观遗传机制,为疾病的诊断和治疗提供新的思路和靶点。
6.2 转录后水平的调控 (Post-transcriptional Regulation)
详细介绍 RNA 加工、RNA 稳定性、RNA 定位和翻译调控在基因表达调控中的作用,以及非编码 RNA 在转录后调控中的重要性。
6.2.1 RNA 剪接调控 (Regulation of RNA Splicing)
RNA 剪接 (RNA splicing) 是真核生物基因表达过程中,将 前体 mRNA (pre-mRNA) 中的 内含子 (intron) 序列去除,并将 外显子 (exon) 序列连接起来,形成 成熟 mRNA 的过程。RNA 剪接是基因表达调控的重要环节,通过 可变剪接 (alternative splicing),一个基因可以产生多种不同的 mRNA 异构体 (isoform) 和蛋白质产物,增加基因表达的多样性。
① 可变剪接的机制与类型 (Mechanisms and Types of Alternative Splicing)
可变剪接是指在 RNA 剪接过程中,对外显子的选择具有 灵活性,同一个 pre-mRNA 可以通过不同的剪接模式,产生不同的 mRNA 异构体。可变剪接的机制主要依赖于 剪接因子 (splicing factor) 对剪接位点的识别和选择。常见的可变剪接类型包括:
▮▮▮▮ⓐ 外显子跳跃 (Exon skipping):某个外显子在成熟 mRNA 中被 跳过,导致 mRNA 缺失该外显子编码的序列。外显子跳跃是最常见的可变剪接类型。
▮▮▮▮ⓑ 内含子保留 (Intron retention):某个内含子在成熟 mRNA 中被 保留 下来,导致 mRNA 包含内含子序列。内含子保留在植物和真菌中较为常见,在动物中相对较少。
▮▮▮▮ⓒ 可变 5' 剪接位点 (Alternative 5' splice site):在同一个内含子的 5' 端,存在多个可能的剪接位点,选择不同的 5' 剪接位点,导致外显子的 5' 端序列不同。
▮▮▮▮ⓓ 可变 3' 剪接位点 (Alternative 3' splice site):在同一个内含子的 3' 端,存在多个可能的剪接位点,选择不同的 3' 剪接位点,导致外显子的 3' 端序列不同。
▮▮▮▮ⓔ 互斥外显子 (Mutually exclusive exons):在 pre-mRNA 中,存在多个外显子,但成熟 mRNA 中只能 互斥地 选择其中一个或几个外显子。
可变剪接的类型和频率在不同基因、不同组织和不同发育阶段有所不同,反映了基因表达调控的复杂性和多样性。
② 剪接因子的作用 (Roles of Splicing Factors)
剪接因子是一类 RNA 结合蛋白 (RNA-binding protein, RBP),能够识别 pre-mRNA 上的剪接位点和 剪接增强子 (splicing enhancer) 或 剪接沉默子 (splicing silencer) 序列,调控剪接体的组装和剪接位点的选择,从而影响可变剪接的模式。主要的剪接因子类型包括:
▮▮▮▮ⓐ SR 蛋白 (SR proteins):富含丝氨酸 (Serine, S) 和精氨酸 (Arginine, R) 残基的蛋白,能够结合外显子剪接增强子 (Exonic splicing enhancer, ESE) 序列,促进剪接体的组装和外显子的识别。SR 蛋白家族成员包括 SF2/ASF、SC35、SRp40 和 SRp55 等。
▮▮▮▮ⓑ hnRNP 蛋白 (Heterogeneous nuclear ribonucleoproteins, hnRNPs):一类与 pre-mRNA 结合的核蛋白,能够结合内含子剪接沉默子 (Intronic splicing silencer, ISS) 或外显子剪接沉默子 (Exonic splicing silencer, ESS) 序列,抑制剪接体的组装和外显子的识别。hnRNP 蛋白家族成员包括 hnRNP A1、hnRNP H 和 PTB 等。
▮▮▮▮ⓒ U1 snRNP 和 U2 snRNP 辅助因子 (U1 snRNP and U2 snRNP auxiliary factors):例如 U2AF (U2 snRNP auxiliary factor) 和 SF1 (Splicing factor 1),参与早期剪接体的组装,识别和定义剪接位点。
剪接因子的表达水平、亚细胞定位和翻译后修饰,以及与其他 RNA 结合蛋白和信号通路之间的相互作用,共同决定了剪接调控的特异性和动态性。
③ 可变剪接的调控机制 (Regulation of Alternative Splicing)
可变剪接的调控是一个复杂的过程,受到多种因素的影响,包括:
▮▮▮▮ⓐ 顺式作用元件 (Cis-regulatory elements):pre-mRNA 上的剪接增强子和剪接沉默子序列,是剪接因子结合的靶位点,决定了剪接位点的选择和可变剪接的模式。顺式作用元件的序列、位置和组合方式,以及 RNA 二级结构,影响剪接因子的结合亲和力和功能。
▮▮▮▮ⓑ 反式作用因子 (Trans-acting factors):剪接因子的表达水平和活性,是可变剪接调控的关键因素。剪接因子的表达受到转录调控和转录后调控的共同影响。剪接因子的活性可以受到翻译后修饰 (例如磷酸化) 和与其他蛋白质相互作用的调控。
▮▮▮▮ⓒ 信号转导通路 (Signal transduction pathways):细胞内外的信号刺激,可以通过信号转导通路,调控剪接因子的活性和定位,从而影响可变剪接的模式。例如,丝裂原活化蛋白激酶 (Mitogen-activated protein kinase, MAPK) 信号通路和 PI3K/Akt 信号通路,可以调控 SR 蛋白的磷酸化水平,影响其剪接活性。
▮▮▮▮ⓓ 染色质结构 (Chromatin structure):染色质结构状态和组蛋白修饰,可以影响 RNA 聚合酶 II 的延伸速度和剪接体的组装效率,从而影响可变剪接的模式。例如,组蛋白 H3K36 三甲基化 (H3K36me3) 修饰,与外显子识别和剪接增强相关。
④ 可变剪接的生物学意义 (Biological Significance of Alternative Splicing)
可变剪接是真核生物基因表达多样性的重要来源,具有重要的生物学意义:
▮▮▮▮ⓐ 增加蛋白质多样性 (Increase protein diversity):通过可变剪接,一个基因可以产生多种不同的 mRNA 异构体,编码结构和功能不同的蛋白质异构体。蛋白质异构体可能具有不同的酶活性、结合特异性、亚细胞定位和调控功能,从而扩大基因的功能谱。
▮▮▮▮ⓑ 组织特异性基因表达 (Tissue-specific gene expression):不同组织细胞中,可变剪接的模式可能不同,导致同一个基因在不同组织中表达不同的蛋白质异构体,实现组织特异性的基因表达。例如,肌球蛋白 (Myosin) 和肌动蛋白 (Actin) 等肌肉蛋白,在骨骼肌和心肌中存在不同的剪接异构体,适应不同肌肉组织的功能需求。
▮▮▮▮ⓒ 发育调控 (Developmental regulation):可变剪接模式在发育过程中动态变化,参与调控细胞分化和组织器官形成。例如,神经元细胞分化过程中,多种神经元特异性基因的可变剪接模式发生改变,促进神经元功能的成熟。
▮▮▮▮ⓓ 疾病发生 (Disease development):可变剪接的异常改变与多种疾病,包括癌症、神经退行性疾病和遗传病,密切相关。例如,肿瘤细胞中可变剪接模式发生紊乱,可能导致癌基因激活和肿瘤抑制基因失活,促进肿瘤发生发展。一些遗传病是由剪接位点突变或剪接因子突变引起的,导致基因的异常剪接和蛋白质功能障碍。
可变剪接是基因表达调控的重要机制,通过精细调控 RNA 剪接模式,增加蛋白质多样性,实现组织特异性基因表达,参与发育调控和疾病发生。对可变剪接的深入研究,有助于理解基因表达调控的复杂性和多样性,揭示疾病发生的剪接调控机制,为疾病的诊断和治疗提供新的靶点。
6.2.2 RNA 稳定性与降解调控 (Regulation of RNA Stability and Degradation)
RNA 稳定性 (RNA stability) 是指 RNA 分子在细胞内存在的 寿命,即从转录合成到降解的时间。RNA 稳定性是基因表达调控的重要环节,影响细胞内 mRNA 的 丰度 (abundance) 和蛋白质的合成量。RNA 降解 (RNA degradation) 是细胞内 RNA 分子被酶降解的过程,是 RNA 稳定性调控的关键机制。
① mRNA 降解途径 (mRNA Degradation Pathways)
真核细胞中存在多种 mRNA 降解途径,主要的降解途径包括:
▮▮▮▮ⓐ 5'-3' 降解途径 (5'-3' decay pathway):是最主要的 mRNA 降解途径,起始于 mRNA 的 5' 端 脱帽 (decapping) 过程,即去除 5' 端帽子结构 (5' cap)。脱帽后的 mRNA 变得不稳定,容易被 5'-3' 外切核糖核酸酶 (5'-3' exoribonuclease) Xrn1 降解。脱帽酶 (Decapping enzyme) Dcp1/Dcp2 复合物催化脱帽反应。
▮▮▮▮ⓑ 3'-5' 降解途径 (3'-5' decay pathway):起始于 mRNA 的 3' 端 去腺苷酸化 (deadenylation) 过程,即去除 3' 端 poly(A) 尾。去腺苷酸化后的 mRNA 变得不稳定,容易被 外泌体 (exosome) 复合体从 3' 端向 5' 端降解。去腺苷酸化酶 (Deadenylase) Ccr4-Not 复合物催化去腺苷酸化反应。
▮▮▮▮ⓒ 无义突变介导的 mRNA 降解 (Nonsense-mediated mRNA decay, NMD):一种 质量控制 机制,特异性降解含有 无义突变 (nonsense mutation) 的 mRNA。无义突变导致 mRNA 提前终止密码子 (Premature termination codon, PTC),NMD 途径识别 PTC,触发 mRNA 降解。NMD 途径可以清除错误转录的 mRNA,防止有害蛋白质的产生。
▮▮▮▮ⓓ 无停滞密码子介导的 mRNA 降解 (Non-stop mRNA decay, NSD):一种降解 缺乏终止密码子 的 mRNA 的机制。缺乏终止密码子的 mRNA 在翻译过程中,核糖体 停滞 在 mRNA 的 3' 端,触发 NSD 途径,降解 mRNA 和释放停滞的核糖体。
▮▮▮▮ⓔ 无启动密码子介导的 mRNA 降解 (No-go mRNA decay, NGD):一种降解 翻译停滞 的 mRNA 的机制。当 mRNA 结构异常或翻译过程受阻时,核糖体可能在 mRNA 上 停滞,触发 NGD 途径,降解 mRNA 和释放停滞的核糖体。
不同的 mRNA 降解途径具有不同的特点和调控机制,共同维持细胞内 RNA 的稳态和基因表达的精确调控。
② RNA 结合蛋白在 RNA 稳定性调控中的作用 (Roles of RNA-binding Proteins in RNA Stability Regulation)
RNA 结合蛋白 (RBP) 是一类与 RNA 分子结合的蛋白质,能够调控 RNA 的生命周期,包括 RNA 的稳定性、剪接、定位和翻译。一些 RBP 参与 RNA 稳定性调控,可以 稳定 或 不稳定 mRNA,影响 mRNA 的降解速率。
▮▮▮▮ⓐ mRNA 稳定蛋白 (mRNA-stabilizing proteins):一些 RBP 能够结合 mRNA 的特定区域,例如 3' UTR 或 5' UTR,保护 mRNA 免受核糖核酸酶的降解,延长 mRNA 的寿命。例如:
⚝ HuR 蛋白 (Human antigen R):一种广泛表达的 RBP,能够结合 mRNA 的 AU 富集元件 (AU-rich element, ARE),稳定 mRNA,促进基因表达。HuR 参与调控细胞生长、分化和炎症反应等过程。
⚝ PTBP1 蛋白 (Polypyrimidine tract-binding protein 1):一种多功能的 RBP,能够结合 mRNA 的 poly(C) 序列,稳定 mRNA,调控 RNA 剪接和翻译。PTBP1 在神经发育和肿瘤发生中发挥重要作用。
▮▮▮▮ⓑ mRNA 不稳定蛋白 (mRNA-destabilizing proteins):一些 RBP 能够结合 mRNA 的特定区域,例如 ARE 或富含 GU 的元件 (GU-rich element),招募 mRNA 降解机器,促进 mRNA 的降解,缩短 mRNA 的寿命。例如:
⚝ AUF1 蛋白 (AU-rich element binding factor 1):一种 ARE 结合蛋白,能够招募脱腺苷酸化酶 Ccr4-Not 复合物,促进 mRNA 的去腺苷酸化和降解。AUF1 参与调控炎症反应和细胞凋亡等过程。
⚝ KSRP 蛋白 (KH-type splicing regulatory protein):一种 ARE 结合蛋白,能够招募脱帽酶 Dcp1/Dcp2 复合物和外切核糖核酸酶 Xrn1,促进 mRNA 的脱帽和 5'-3' 降解。KSRP 参与调控细胞分化和肿瘤转移等过程。
RBP 对 RNA 稳定性的调控具有序列特异性和上下文依赖性,不同的 RBP 结合不同的 RNA 序列元件,在不同的细胞类型和生理条件下,发挥不同的调控作用。
③ RNA 结构与 RNA 稳定性 (RNA Structure and RNA Stability)
RNA 分子的二级结构和三级结构,也影响 RNA 的稳定性。RNA 结构可以 保护 或 暴露 RNA 分子的降解位点,影响核糖核酸酶的接近性和酶活性。
▮▮▮▮ⓐ 5' 端帽子结构 (5' cap):5' 端帽子结构是 mRNA 稳定性的重要保护因子,能够阻止 5'-3' 外切核糖核酸酶 Xrn1 的降解。5' 端帽子结构还可以促进 mRNA 的翻译起始。
▮▮▮▮ⓑ 3' 端 poly(A) 尾 (3' poly(A) tail):3' 端 poly(A) 尾也是 mRNA 稳定性的重要保护因子,能够阻止 3'-5' 外切核糖核酸酶外泌体复合体的降解。poly(A) 尾的长度与 mRNA 的稳定性呈正相关,poly(A) 尾越长,mRNA 越稳定。poly(A) 尾还可以促进 mRNA 的翻译起始。
▮▮▮▮ⓒ RNA 二级结构元件 (RNA secondary structure elements):mRNA 的 5' UTR 和 3' UTR 区域,可能形成复杂的二级结构元件,例如茎环结构 (stem-loop structure) 和发夹结构 (hairpin structure)。这些结构元件可以 阻碍 核糖核酸酶的降解,或者 促进 RBP 的结合,从而影响 RNA 的稳定性。例如,mRNA 3' UTR 上的 ARE 序列,通常形成 RNA 二级结构,促进 ARE 结合蛋白的结合,调控 mRNA 的稳定性。
④ RNA 稳定性调控的生物学意义 (Biological Significance of RNA Stability Regulation)
RNA 稳定性调控是基因表达调控的重要机制,具有重要的生物学意义:
▮▮▮▮ⓐ 快速响应基因表达调控 (Rapid response gene expression regulation):RNA 稳定性调控可以快速改变细胞内 mRNA 的丰度,实现基因表达的快速响应调控。例如,在细胞受到刺激时,一些 不稳定 mRNA 的稳定性可以迅速增加,导致 mRNA 丰度升高和蛋白质合成量增加,快速响应刺激信号。
▮▮▮▮ⓑ 精细调控基因表达水平 (Fine-tuning gene expression levels):RNA 稳定性调控可以精细调节基因的表达水平。不同 mRNA 的稳定性差异很大,从几分钟到几天不等。mRNA 的稳定性差异,是细胞内蛋白质丰度差异的重要决定因素之一。
▮▮▮▮ⓒ 组织特异性基因表达 (Tissue-specific gene expression):不同组织细胞中,RNA 稳定性调控机制可能不同,导致同一个基因在不同组织中 mRNA 的稳定性不同,实现组织特异性的基因表达。
▮▮▮▮ⓓ 疾病发生 (Disease development):RNA 稳定性调控的异常改变与多种疾病,包括癌症、炎症性疾病和神经退行性疾病,密切相关。例如,肿瘤细胞中一些癌基因 mRNA 的稳定性异常升高,导致癌基因过表达,促进肿瘤发生发展。炎症性疾病中,一些炎症因子 mRNA 的稳定性异常升高,导致炎症反应过度激活。
RNA 稳定性调控是基因表达调控的重要层面,通过精细调控 mRNA 的降解速率,快速响应信号刺激,精细调节基因表达水平,实现组织特异性基因表达,参与多种生物学过程和疾病发生。对 RNA 稳定性调控的深入研究,有助于理解基因表达调控的动态性和精细性,揭示疾病发生的 RNA 稳定性调控机制,为疾病的诊断和治疗提供新的靶点。
6.2.3 RNA 定位与翻译调控 (Regulation of RNA Localization and Translation)
RNA 定位 (RNA localization) 是指 mRNA 分子在细胞内的 亚细胞分布 (subcellular distribution)。mRNA 不仅存在于细胞核和细胞质中,还可以在细胞质内 定向运输 到特定的细胞区域,例如细胞膜、内质网、线粒体和细胞突起等。RNA 定位与翻译调控密切相关,mRNA 的定位可以影响蛋白质的 局部合成 (local synthesis) 和功能。
① mRNA 定位的机制 (Mechanisms of mRNA Localization)
mRNA 定位是一个复杂的过程,受到多种因素的调控,主要的定位机制包括:
▮▮▮▮ⓐ 顺式作用元件 (Cis-acting elements) 和 反式作用因子 (Trans-acting factors):mRNA 分子上存在特定的 定位信号 (localization signal) 或 拉链序列 (zipcode sequence),通常位于 3' UTR 区域。这些顺式作用元件被 RNA 运输蛋白 (RNA transport protein) 或 马达蛋白 (motor protein) 等反式作用因子识别和结合,介导 mRNA 的定向运输。
▮▮▮▮ⓑ 细胞骨架 (Cytoskeleton):细胞骨架,特别是 微管 (microtubule) 和 肌动蛋白丝 (actin filament),是 mRNA 运输的 轨道 (track)。马达蛋白,例如 驱动蛋白 (kinesin) 和 动力蛋白 (dynein),利用 ATP 水解能量,沿着细胞骨架 驱动 mRNA 的定向运输。
▮▮▮▮ⓒ RNA 颗粒 (RNA granules):一些 mRNA 与 RBP 和其他蛋白质组分组装形成 RNA 运输颗粒 (RNA transport granule),例如 应激颗粒 (stress granule) 和 P 颗粒 (P-body)。RNA 颗粒可以 保护 mRNA 免受降解,并 协调 mRNA 的运输、翻译和降解。
▮▮▮▮ⓓ 膜锚定 (Membrane anchoring):一些 mRNA 可以通过其编码的蛋白质产物,或者通过与膜蛋白的相互作用, 锚定 在特定的细胞膜区域,例如内质网膜和细胞膜。膜锚定可以实现蛋白质的 共翻译定位 (co-translational localization),即蛋白质在合成过程中就定位到膜上。
mRNA 定位的机制具有序列特异性和细胞类型特异性,不同的 mRNA 具有不同的定位信号和运输机制,在不同的细胞类型和生理条件下,mRNA 定位的模式和功能有所不同。
② mRNA 定位与局部翻译调控 (mRNA Localization and Local Translational Control)
mRNA 定位与翻译调控密切相关,mRNA 的定位可以实现蛋白质的 局部合成,即蛋白质在特定的细胞区域合成,直接在作用位点发挥功能。局部翻译调控具有重要的生物学意义:
▮▮▮▮ⓐ 空间特异性蛋白质表达 (Spatial-specific protein expression):mRNA 定位可以将 mRNA 定位到特定的细胞区域,例如细胞突起、细胞膜和细胞器,实现蛋白质在特定区域的 高浓度 表达,而在其他区域 低浓度 表达,形成蛋白质表达的 空间梯度 (spatial gradient)。空间特异性蛋白质表达对于细胞的极性、形态和功能至关重要。
▮▮▮▮ⓑ 快速响应局部信号 (Rapid response to local signals):mRNA 定位可以将 mRNA 预先定位到特定的细胞区域,当细胞受到 局部信号 刺激时,可以 快速启动 局部翻译,合成所需的蛋白质,快速响应局部信号。例如,在神经突触部位,突触后 mRNA 的局部翻译,可以快速响应神经递质信号,调控突触可塑性。
▮▮▮▮ⓒ 蛋白质的共翻译定位 (Co-translational protein localization):对于分泌蛋白和膜蛋白,mRNA 定位到内质网膜上,实现蛋白质的 共翻译定位。蛋白质在合成过程中,通过信号肽 (signal peptide) 的引导,进入内质网腔或插入内质网膜,完成蛋白质的折叠、修饰和转运。
▮▮▮▮ⓓ 能量效率 (Energy efficiency):局部翻译可以 节省能量,避免蛋白质在不需要的区域合成,提高蛋白质合成的效率。
mRNA 定位与局部翻译调控,是基因表达调控的重要机制,通过精细调控 mRNA 的亚细胞分布和翻译起始,实现空间特异性蛋白质表达,快速响应局部信号,提高蛋白质合成的效率,参与多种生物学过程和疾病发生。
③ mRNA 定位调控的生物学意义 (Biological Significance of mRNA Localization Regulation)
mRNA 定位调控在多种生物学过程中发挥重要作用:
▮▮▮▮ⓐ 细胞极性建立 (Establishment of cell polarity):在极性细胞,例如上皮细胞和神经元细胞,mRNA 定位对于建立和维持细胞极性至关重要。例如,上皮细胞顶端膜和基底外侧膜的蛋白质,其 mRNA 定位到相应的膜区域,保证细胞极性的建立和功能。神经元细胞轴突和树突的蛋白质,其 mRNA 定位到相应的突起区域,维持神经元极性和突触功能。
▮▮▮▮ⓑ 细胞迁移 (Cell migration):在细胞迁移过程中,细胞前缘和后缘的蛋白质,其 mRNA 定位到相应的细胞区域,调控细胞的定向运动。例如,肌动蛋白 mRNA 定位到细胞前缘,促进细胞前缘的延伸和 lamellipodia 的形成。
▮▮▮▮ⓒ 胚胎发育 (Embryonic development):在胚胎发育早期,卵母细胞和早期胚胎的 mRNA 定位,对于胚胎轴向形成和细胞命运决定至关重要。例如,果蝇卵母细胞的 bicoid mRNA 定位到卵母细胞前部,编码的 Bicoid 蛋白形成浓度梯度,决定胚胎的前后轴向。
▮▮▮▮ⓓ 神经突触可塑性 (Neuronal synaptic plasticity):在神经突触部位,突触后 mRNA 的局部翻译,参与突触可塑性的调控。例如,突触后密度蛋白 PSD-95 mRNA 定位到突触后部位,局部翻译合成 PSD-95 蛋白,增强突触的信号传递效率,参与学习和记忆过程。
▮▮▮▮ⓔ 疾病发生 (Disease development):mRNA 定位调控的异常改变与多种疾病,包括神经发育障碍、神经退行性疾病和癌症,密切相关。例如,神经退行性疾病,例如阿尔茨海默病和帕金森病,与神经元细胞 mRNA 定位异常和局部翻译障碍有关。肿瘤细胞中,一些癌基因 mRNA 的定位异常,可能导致癌基因在特定细胞区域过表达,促进肿瘤转移和侵袭。
mRNA 定位调控是基因表达调控的重要层面,通过精细调控 mRNA 的亚细胞分布和局部翻译,实现空间特异性蛋白质表达,快速响应局部信号,参与细胞极性建立、细胞迁移、胚胎发育、神经突触可塑性和疾病发生等多种生物学过程。对 mRNA 定位调控的深入研究,有助于理解基因表达调控的空间维度和动态性,揭示疾病发生的 mRNA 定位调控机制,为疾病的诊断和治疗提供新的靶点。
6.2.4 非编码 RNA 在转录后调控中的作用 (Role of Non-coding RNAs in Post-transcriptional Regulation)
非编码 RNA (non-coding RNA, ncRNA) 是一类不编码蛋白质的 RNA 分子,包括 miRNA、siRNA、lncRNA 等。ncRNA 在基因表达的转录后调控中发挥重要作用,参与 RNA 剪接调控、RNA 稳定性调控、翻译调控和 RNA 定位调控等多个环节。
① 小 RNA (Small RNAs): miRNA 和 siRNA
微小 RNA (microRNA, miRNA) 和小干扰 RNA (small interfering RNA, siRNA) 是一类长度约为 20-25 nt 的小 ncRNA,通过 RNA 干扰 (RNA interference, RNAi) 机制,调控基因表达的转录后沉默。
▮▮▮▮ⓐ miRNA 的生物合成途径 (Biogenesis of miRNA):miRNA 由内源基因编码,转录产生 初级 miRNA (primary miRNA, pri-miRNA),pri-miRNA 在细胞核内被 Drosha 酶加工成 前体 miRNA (precursor miRNA, pre-miRNA),pre-miRNA 输出到细胞质,被 Dicer 酶加工成 双链 miRNA (miRNA duplex)。双链 miRNA 解旋,形成 单链成熟 miRNA,成熟 miRNA 组装到 RNA 诱导沉默复合体 (RISC) 中,形成 miRISC。
▮▮▮▮ⓑ siRNA 的生物合成途径 (Biogenesis of siRNA):siRNA 可以是外源性的,例如病毒感染或人工导入的双链 RNA (double-stranded RNA, dsRNA)。外源性 dsRNA 进入细胞质后,被 Dicer 酶加工成 siRNA 双链 (siRNA duplex)。siRNA 双链解旋,形成 单链成熟 siRNA,成熟 siRNA 组装到 RISC 中,形成 siRISC。
▮▮▮▮ⓒ miRNA 和 siRNA 的作用机制 (Mechanisms of miRNA and siRNA):miRISC 和 siRISC 通过 碱基配对 原则,识别靶 mRNA 的 3' UTR 区域。
⚝ miRNA 介导的翻译抑制 (miRNA-mediated translational repression):当 miRNA 与靶 mRNA 的 3' UTR 部分互补 时,miRISC 结合到 mRNA 上,抑制 mRNA 的翻译起始或延伸,降低蛋白质的合成量。
⚝ siRNA 介导的 mRNA 降解 (siRNA-mediated mRNA degradation):当 siRNA 与靶 mRNA 完全互补 时,siRISC 结合到 mRNA 上,激活 RISC 的核糖核酸酶活性,切割靶 mRNA,导致 mRNA 降解。
miRNA 和 siRNA 介导的 RNA 干扰机制,是基因表达调控的重要方式,参与多种生物学过程和疾病发生。
② 长非编码 RNA (Long Non-coding RNAs, lncRNAs)
长非编码 RNA (lncRNA) 是一类长度超过 200 nt 的 ncRNA,种类繁多,功能多样,在基因表达的转录后调控中发挥重要作用。lncRNA 的作用机制包括:
▮▮▮▮ⓐ 作为 RNA 支架 (RNA scaffold):lncRNA 可以作为 支架,同时结合多个蛋白质分子,形成 RNA-蛋白质复合体,调控蛋白质的活性和定位。例如,lncRNA HOTAIR 可以同时结合 PRC2 复合物和 LSD1 复合物,引导复合体靶向基因组特定区域,介导基因沉默。
▮▮▮▮ⓑ 作为 RNA 诱饵 (RNA decoy):lncRNA 可以作为 诱饵,结合 RBP 或 miRNA, 竞争性抑制 RBP 或 miRNA 与靶 mRNA 的相互作用,解除 RBP 或 miRNA 对靶 mRNA 的调控。例如,lncRNA HULC 可以作为 miRNA-182 的诱饵,竞争性结合 miRNA-182,解除 miRNA-182 对靶基因的抑制,促进靶基因的表达。
▮▮▮▮ⓒ 作为 RNA 向导 (RNA guide):lncRNA 可以作为 向导,引导蛋白质复合体靶向基因组特定区域或 mRNA 分子,调控基因表达。例如,lncRNA Xist 可以引导 PRC2 复合物靶向 X 染色体,介导 X 染色体失活。
▮▮▮▮ⓓ 调控 RNA 剪接 (Regulation of RNA splicing):一些 lncRNA 可以与剪接因子相互作用,调控 pre-mRNA 的剪接模式,影响可变剪接的发生。例如,lncRNA MALAT1 可以与 SR 蛋白相互作用,调控 SR 蛋白的磷酸化水平和剪接活性,影响可变剪接的模式。
▮▮▮▮ⓔ 调控 RNA 稳定性 (Regulation of RNA stability):一些 lncRNA 可以与 mRNA 相互作用,调控 mRNA 的稳定性。例如,lncRNA NORAD 可以结合 PUMILIO 蛋白,保护 mRNA 免受 PUMILIO 蛋白介导的降解,稳定 mRNA。
lncRNA 的功能多样性,反映了基因表达调控的复杂性和精细性。lncRNA 在发育调控、细胞分化、疾病发生和进化过程中发挥重要作用。
③ 其他非编码 RNA (Other Non-coding RNAs)
除了 miRNA、siRNA 和 lncRNA,还有其他类型的 ncRNA,例如 rRNA、tRNA、snoRNA、snRNA 和 piRNA 等,也参与基因表达的转录后调控。
▮▮▮▮ⓐ rRNA 和 tRNA (rRNA and tRNA):核糖体 RNA (rRNA) 和转运 RNA (tRNA) 是蛋白质合成机器的重要组分,rRNA 构成核糖体的骨架,tRNA 携带氨基酸参与翻译过程。rRNA 和 tRNA 的丰度和功能,直接影响蛋白质合成的效率和质量。
▮▮▮▮ⓑ snoRNA 和 snRNA (snoRNA and snRNA):小核仁 RNA (small nucleolar RNA, snoRNA) 和小核 RNA (small nuclear RNA, snRNA) 参与 RNA 加工过程。snoRNA 引导核糖核酸酶加工 rRNA 和 tRNA,snRNA 是剪接体的组分,参与 pre-mRNA 的剪接。
▮▮▮▮ⓒ piRNA (PIWI-interacting RNA):PIWI 相互作用 RNA (PIWI-interacting RNA, piRNA) 是一类主要在生殖细胞中表达的小 ncRNA,与 PIWI 蛋白家族成员相互作用,形成 piRNA 诱导沉默复合体 (piRISC),参与转座子沉默和生殖细胞发育。
非编码 RNA 是基因表达调控的重要 执行者 (effector),通过 RNA 干扰、RNA 支架、RNA 诱饵、RNA 向导等多种机制,精细调控基因表达的转录后水平,参与多种生物学过程和疾病发生。对非编码 RNA 的深入研究,有助于理解基因表达调控的复杂性和多样性,揭示疾病发生的非编码 RNA 调控机制,为疾病的诊断和治疗提供新的靶点。
6.3 翻译水平的调控 (Translational Regulation)
阐述翻译起始、延伸和终止阶段的调控机制,以及 mRNA 结构、非编码 RNA 和细胞信号通路对翻译的影响,以及翻译调控在快速响应细胞内外信号中的作用。
6.3.1 翻译起始的调控机制 (Mechanisms of Translational Initiation Regulation)
翻译起始 (Translation initiation) 是蛋白质合成的第一个阶段,决定了 mRNA 是否能够被核糖体识别和翻译。翻译起始是翻译调控的关键环节,受到多种因素的精细调控。
① eIF2α 磷酸化 (Phosphorylation of eIF2α)
真核生物翻译起始因子 2α (eukaryotic initiation factor 2α, eIF2α) 是翻译起始复合物形成的关键组分。eIF2α 磷酸化是翻译起始调控的重要机制。
▮▮▮▮ⓐ eIF2α 的作用 (Function of eIF2α):eIF2α 结合 GTP 和起始 tRNA (Met-tRNAiMet),形成 三元复合物 (ternary complex, eIF2-GTP-Met-tRNAiMet),三元复合物是核糖体小亚基 (40S subunit) 结合 mRNA 和扫描起始密码子 AUG 的必要条件。
▮▮▮▮ⓑ eIF2α 激酶 (eIF2α kinases):细胞内存在多种 eIF2α 激酶,能够磷酸化 eIF2α 的 Ser51 位点。主要的 eIF2α 激酶包括:
⚝ PKR (dsRNA-dependent protein kinase R):被双链 RNA (dsRNA) 激活,参与病毒感染和细胞应激反应。
⚝ PERK (PKR-like endoplasmic reticulum kinase):被内质网应激 (ER stress) 激活,参与未折叠蛋白反应 (unfolded protein response, UPR)。
⚝ GCN2 (General control nonderepressible 2):被氨基酸饥饿 (amino acid starvation) 激活,参与氨基酸代谢调控。
⚝ HRI (Heme-regulated inhibitor):被血红素 (heme) 缺乏激活,参与血红蛋白合成调控。
▮▮▮▮ⓒ eIF2α 磷酸化的抑制翻译起始 (Inhibition of translation initiation by eIF2α phosphorylation):eIF2α 磷酸化后,与 eIF2B (eIF2 guanine nucleotide exchange factor) 的亲和力增加,形成稳定的 eIF2α-P-eIF2B 复合物, 抑制 eIF2B 的鸟嘌呤核苷酸交换因子 (guanine nucleotide exchange factor, GEF) 活性,阻止 eIF2-GDP 向 eIF2-GTP 的转化, 减少 三元复合物的形成, 抑制 翻译起始。
eIF2α 磷酸化是细胞应激反应和代谢调控的重要机制,通过 全局性抑制 翻译起始,节省能量,应对不利环境条件。
② 4E-BP 磷酸化 (Phosphorylation of 4E-BP)
真核生物翻译起始因子 4E (eukaryotic initiation factor 4E, eIF4E) 是帽子结合蛋白 (cap-binding protein),识别 mRNA 5' 端帽子结构,是翻译起始复合物组装的关键组分。4E-BP (4E-binding protein) 是一类 eIF4E 抑制蛋白,4E-BP 磷酸化是翻译起始调控的重要机制。
▮▮▮▮ⓐ 4E-BP 的作用 (Function of 4E-BP):4E-BP 与 eIF4E 结合, 竞争性抑制 eIF4E 与 eIF4G (eIF4G scaffold protein) 的相互作用, 阻止 eIF4F 复合物 (eIF4E-eIF4G-eIF4A) 的组装, 抑制 核糖体小亚基 (40S subunit) 结合 mRNA, 抑制 翻译起始。
▮▮▮▮ⓑ 4E-BP 激酶 (4E-BP kinases):mTOR (mammalian target of rapamycin) 激酶是主要的 4E-BP 激酶。mTOR 信号通路被生长因子、营养物质和能量水平激活,激活 mTOR 激酶,磷酸化 4E-BP。
▮▮▮▮ⓒ 4E-BP 磷酸化的促进翻译起始 (Promotion of translation initiation by 4E-BP phosphorylation):4E-BP 磷酸化后,与 eIF4E 的亲和力 降低, 释放 eIF4E, 促进 eIF4E 与 eIF4G 的相互作用, 促进 eIF4F 复合物的组装, 促进 核糖体小亚基结合 mRNA, 促进 翻译起始。
4E-BP 磷酸化是 mTOR 信号通路调控翻译起始的关键机制,通过 选择性促进 帽子依赖性翻译起始,响应生长因子和营养物质信号,调控细胞生长和代谢。
③ uORF 介导的翻译调控 (uORF-mediated translational control)
上游开放阅读框 (upstream open reading frame, uORF) 是指位于 mRNA 5' UTR 区域的短开放阅读框。uORF 可以调控下游主要开放阅读框 (main ORF) 的翻译起始。
▮▮▮▮ⓐ uORF 的作用 (Function of uORF):核糖体扫描 mRNA 5' UTR 时,可能在 uORF 的起始密码子 AUG 处 优先起始 翻译,翻译 uORF 编码的短肽。翻译 uORF 后,核糖体可能 终止 翻译, 释放 mRNA, 阻止 下游主要 ORF 的翻译起始。
▮▮▮▮ⓑ uORF 的调控机制 (Regulation of uORF):uORF 的翻译起始效率和对下游主要 ORF 翻译的影响,受到多种因素的调控,包括:
⚝ uORF 的序列和位置:uORF 的起始密码子序列、终止密码子位置和 Kozak 序列强度,影响 uORF 的翻译起始效率。
⚝ mRNA 二级结构:mRNA 5' UTR 区域的二级结构,可以影响核糖体扫描和 uORF 翻译起始。
⚝ 翻译起始因子:翻译起始因子的丰度和活性,例如 eIF2 和 eIF4F,影响 uORF 和主要 ORF 的竞争性翻译起始。
▮▮▮▮ⓒ uORF 介导的翻译调控的生物学意义 (Biological significance of uORF-mediated translational control):uORF 介导的翻译调控,可以 精细调节 基因的表达水平,响应细胞内外的信号刺激。例如,一些转录因子的 mRNA 5' UTR 区域存在 uORF,uORF 介导的翻译调控,可以 负反馈调节 转录因子的表达水平,维持基因表达的稳态。一些应激反应基因的 mRNA 5' UTR 区域也存在 uORF,uORF 介导的翻译调控,可以 快速抑制 正常翻译, 优先翻译 应激反应基因,应对细胞应激。
翻译起始的调控机制复杂多样,eIF2α 磷酸化、4E-BP 磷酸化和 uORF 介导的翻译调控,是翻译起始调控的重要方式,参与细胞应激反应、代谢调控、发育调控和疾病发生等多种生物学过程。对翻译起始调控的深入研究,有助于理解基因表达调控的动态性和精细性,揭示疾病发生的翻译调控机制,为疾病的诊断和治疗提供新的靶点。
6.3.2 mRNA 结构与翻译调控 (mRNA Structure and Translational Control)
mRNA 的结构,特别是 5' UTR 和 3' UTR 区域的结构,可以影响 mRNA 的翻译效率。mRNA 结构与翻译调控之间存在密切的相互作用。
① mRNA 5' UTR 结构与翻译调控 (mRNA 5' UTR Structure and Translational Control)
mRNA 5' UTR (5' untranslated region) 是位于起始密码子 AUG 上游的非翻译区。mRNA 5' UTR 结构,包括二级结构和 内部核糖体进入位点 (internal ribosome entry site, IRES) 元件,可以影响核糖体结合和扫描,调控翻译起始。
▮▮▮▮ⓐ mRNA 5' UTR 二级结构 (mRNA 5' UTR secondary structure):mRNA 5' UTR 区域可能形成复杂的二级结构,例如茎环结构和发夹结构。 稳定的二级结构 可以 阻碍 核糖体小亚基 (40S subunit) 的扫描和起始密码子 AUG 的识别, 抑制 翻译起始。 不稳定的二级结构 或 线性结构,有利于核糖体扫描和翻译起始。 mRNA 5' UTR 二级结构的稳定性,受到 RNA 结合蛋白和细胞环境因素的调控。
▮▮▮▮ⓑ 内部核糖体进入位点 (IRES) 元件 (Internal ribosome entry site, IRES element):IRES 元件是一类特殊的 RNA 结构元件,通常位于 mRNA 5' UTR 区域,能够 直接招募 核糖体小亚基 (40S subunit) 到 mRNA 上, 绕过 帽子依赖性翻译起始机制, 启动 翻译起始。 IRES 依赖性翻译起始,在细胞应激反应、细胞凋亡和病毒感染等条件下发挥重要作用。
⚝ C型 IRES (Cellular IRES):存在于一些细胞 mRNA 5' UTR 区域,例如 凋亡蛋白酶激活因子 1 (Apaf-1) mRNA 和 免疫球蛋白重链结合蛋白 (BiP/GRP78) mRNA。 C型 IRES 通常在细胞应激或细胞凋亡条件下激活, 优先翻译 应激反应基因或凋亡相关基因。
⚝ V型 IRES (Viral IRES):存在于一些病毒 RNA 基因组 5' UTR 区域,例如 脊髓灰质炎病毒 (poliovirus) RNA 和 肝炎病毒 C (hepatitis C virus, HCV) RNA。 V型 IRES 能够 高效启动 病毒 RNA 的翻译, 抑制 宿主细胞的帽子依赖性翻译, 劫持 宿主细胞的翻译机器,用于病毒蛋白质合成。
mRNA 5' UTR 结构与翻译调控,为基因表达调控增加了新的维度,参与细胞应激反应、细胞凋亡、病毒感染和发育调控等多种生物学过程。
② mRNA 3' UTR 结构与翻译调控 (mRNA 3' UTR Structure and Translational Control)
mRNA 3' UTR (3' untranslated region) 是位于终止密码子下游的非翻译区。mRNA 3' UTR 结构,包括 RNA 二级结构元件和 RNA 结合蛋白结合位点,可以影响 mRNA 的稳定性、定位和翻译效率。
▮▮▮▮ⓐ mRNA 3' UTR RNA 二级结构元件 (mRNA 3' UTR RNA secondary structure elements):mRNA 3' UTR 区域可能形成多种 RNA 二级结构元件,例如 ARE 和富含 GU 的元件。这些结构元件可以 招募 RNA 稳定蛋白或 RNA 不稳定蛋白,调控 mRNA 的稳定性,间接影响翻译效率。一些 3' UTR RNA 二级结构元件,也可以 直接影响 核糖体翻译终止和再起始,调控翻译效率。
▮▮▮▮ⓑ mRNA 3' UTR RNA 结合蛋白结合位点 (mRNA 3' UTR RNA-binding protein binding sites):mRNA 3' UTR 区域包含多种 RBP 结合位点。RBP 结合 mRNA 3' UTR,可以 稳定 或 不稳定 mRNA, 定位 mRNA 到特定细胞区域, 促进 或 抑制 翻译。例如:
⚝ PUMILIO 蛋白 (PUMILIO protein):一种 mRNA 3' UTR 结合蛋白,能够结合 mRNA 3' UTR 上的 PUMILIO 识别元件 (PUMILIO response element, PRE), 抑制 mRNA 的翻译, 促进 mRNA 的降解。 PUMILIO 蛋白参与发育调控和神经元功能。
⚝ TIS11B 蛋白 (TIS11B protein):一种 mRNA 3' UTR 结合蛋白,能够结合 mRNA 3' UTR 上的 ARE 序列, 促进 mRNA 的降解, 抑制 翻译。 TIS11B 蛋白参与炎症反应和细胞凋亡。
⚝ hnRNP C 蛋白 (hnRNP C protein):一种 mRNA 3' UTR 结合蛋白,能够结合 mRNA 3' UTR 上的 poly(U) 序列, 促进 mRNA 的翻译。 hnRNP C 蛋白参与细胞生长和分化。
mRNA 3' UTR 结构与翻译调控,是基因表达调控的重要层面,通过调控 mRNA 的稳定性、定位和翻译效率,精细调节基因的表达水平,参与多种生物学过程和疾病发生。
③ RNA 结合蛋白在 mRNA 结构介导的翻译调控中的作用 (Roles of RNA-binding Proteins in mRNA Structure-mediated Translational Control)
RNA 结合蛋白 (RBP) 是 mRNA 结构介导的翻译调控的关键 介质 (mediator)。RBP 能够识别和结合 mRNA 5' UTR 和 3' UTR 区域的特定 RNA 结构元件, 解读 RNA 结构信息, 传递 调控信号, 执行 翻译调控功能。
▮▮▮▮ⓐ RBP 识别 RNA 结构元件 (RBP recognition of RNA structure elements):不同的 RBP 具有不同的 RNA 结合域,能够识别和结合不同的 RNA 结构元件,例如茎环结构、发夹结构、ARE 和 PRE 等。 RBP 与 RNA 结构元件的结合,具有序列特异性和结构特异性。
▮▮▮▮ⓑ RBP 调控翻译起始 (RBP regulation of translation initiation):一些 RBP 结合 mRNA 5' UTR 区域的 RNA 结构元件,可以 阻碍 核糖体扫描和起始密码子 AUG 的识别, 抑制 翻译起始。另一些 RBP 结合 mRNA 5' UTR 区域的 RNA 结构元件,可以 促进 核糖体结合和扫描, 促进 翻译起始。
▮▮▮▮ⓒ RBP 调控翻译延伸和终止 (RBP regulation of translation elongation and termination):一些 RBP 结合 mRNA 编码区或 3' UTR 区域的 RNA 结构元件,可以 影响 核糖体翻译延伸速度和翻译终止效率, 调控 翻译效率。
▮▮▮▮ⓓ RBP 调控 mRNA 稳定性和定位 (RBP regulation of mRNA stability and localization):一些 RBP 结合 mRNA 3' UTR 区域的 RNA 结构元件,可以 招募 mRNA 降解机器, 促进 mRNA 降解, 降低 翻译效率。另一些 RBP 结合 mRNA 3' UTR 区域的 RNA 结构元件,可以 保护 mRNA 免受降解, 延长 mRNA 寿命, 提高 翻译效率。 一些 RBP 结合 mRNA 3' UTR 区域的 RNA 结构元件,可以 介导 mRNA 的定向运输, 定位 mRNA 到特定细胞区域, 实现 局部翻译调控。
RNA 结合蛋白在 mRNA 结构介导的翻译调控中发挥核心作用,通过识别和解读 RNA 结构信息,传递调控信号,执行翻译调控功能,精细调节基因的表达水平,参与多种生物学过程和疾病发生。
6.3.3 细胞信号通路与翻译调控 (Cellular Signaling Pathways and Translational Control)
细胞信号通路 (Cellular signaling pathway) 是细胞响应细胞内外信号刺激,传递和放大信号,调控细胞功能的重要机制。细胞信号通路与翻译调控之间存在密切的相互作用,细胞信号通路可以调控翻译机器的活性,影响 mRNA 的翻译效率,实现基因表达的快速响应调控。
① mTOR 信号通路与翻译调控 (mTOR Signaling Pathway and Translational Control)
mTOR (mammalian target of rapamycin) 信号通路是细胞生长、代谢和存活调控的核心通路,mTOR 信号通路激活,可以 促进 翻译起始、延伸和核糖体生物合成, 增强 蛋白质合成能力, 促进 细胞生长和代谢。
▮▮▮▮ⓐ mTOR 信号通路的激活 (Activation of mTOR signaling pathway):mTOR 信号通路可以被多种细胞内外信号激活,包括:
⚝ 生长因子 (Growth factors):例如胰岛素 (insulin) 和胰岛素样生长因子 1 (IGF-1),通过受体酪氨酸激酶 (receptor tyrosine kinase, RTK) 信号通路,激活 PI3K/Akt 信号通路,进一步激活 mTOR 信号通路。
⚝ 营养物质 (Nutrients):例如氨基酸和葡萄糖,通过多种机制激活 mTOR 信号通路,例如氨基酸可以直接激活 mTORC1 复合物,葡萄糖代谢产生 ATP,为 mTOR 信号通路提供能量。
⚝ 能量水平 (Energy levels):细胞内 ATP 水平升高,AMP/ATP 比值降低,激活 mTOR 信号通路。细胞内 ATP 水平降低,AMP/ATP 比值升高,抑制 mTOR 信号通路。
▮▮▮▮ⓑ mTOR 信号通路调控翻译起始 (mTOR signaling pathway regulation of translation initiation):mTOR 信号通路主要通过以下机制调控翻译起始:
⚝ 4E-BP 磷酸化 (4E-BP phosphorylation):mTOR 激酶磷酸化 4E-BP, 释放 eIF4E, 促进 eIF4F 复合物的组装, 促进 帽子依赖性翻译起始。
⚝ S6K1 磷酸化 (S6K1 phosphorylation):mTOR 激酶磷酸化核糖体蛋白 S6 激酶 1 (ribosomal protein S6 kinase 1, S6K1),激活 S6K1 激酶活性。 S6K1 激酶进一步磷酸化核糖体蛋白 S6 (ribosomal protein S6, rpS6) 和翻译起始因子 eIF4B, 促进 核糖体生物合成和翻译起始。
▮▮▮▮ⓒ mTOR 信号通路调控翻译延伸 (mTOR signaling pathway regulation of translation elongation):mTOR 信号通路也可以 促进 翻译延伸。 mTOR 激活可以 增加 tRNA 的丰度, 促进 氨基酰 tRNA 合成酶的活性, 提高 氨基酰 tRNA 的供应, 加速 翻译延伸速度。
▮▮▮▮ⓓ mTOR 信号通路调控核糖体生物合成 (mTOR signaling pathway regulation of ribosome biogenesis):mTOR 信号通路可以 促进 核糖体 RNA (rRNA) 和核糖体蛋白 (r-protein) 的合成, 增加 核糖体的数量, 增强 细胞的蛋白质合成能力。 mTOR 激活可以 促进 RNA 聚合酶 I 和 RNA 聚合酶 III 的活性, 增加 rRNA 和 tRNA 的转录。 mTOR 激活也可以 促进 r-protein mRNA 的翻译, 增加 r-protein 的合成。
mTOR 信号通路是翻译调控的核心通路,通过调控翻译起始、延伸和核糖体生物合成,响应生长因子、营养物质和能量水平信号,调控细胞生长、代谢和存活。 mTOR 信号通路的异常激活与多种疾病,包括癌症、糖尿病和神经退行性疾病,密切相关。 mTOR 抑制剂,例如雷帕霉素 (rapamycin),是一类重要的抗肿瘤药物和免疫抑制剂。
② 应激反应与翻译调控 (Stress Response and Translational Control)
细胞应激反应 (Cellular stress response) 是细胞应对不利环境条件,例如热休克、氧化应激、内质网应激和营养饥饿,启动的保护性反应。细胞应激反应通常伴随 全局性抑制 正常翻译, 优先翻译 应激反应基因, 重塑 细胞的蛋白质合成模式, 提高 细胞的存活能力。
▮▮▮▮ⓐ 热休克反应与翻译调控 (Heat shock response and translational control):热休克 (heat shock) 是细胞受到高温刺激时启动的应激反应。热休克反应的特点是 热休克蛋白 (heat shock protein, HSP) 的 高表达。 热休克反应伴随 全局性抑制 正常翻译, 优先翻译 HSP mRNA。
⚝ 热休克因子 1 (HSF1):是热休克反应的关键转录因子,在正常条件下,HSF1 以 单体 形式存在于细胞质中,活性 抑制。 热休克刺激导致蛋白质 错误折叠,错误折叠的蛋白质与 HSP70 结合, 释放 HSF1。 释放的 HSF1 寡聚化 形成 三聚体, 转运 到细胞核, 激活 热休克基因的转录, 增加 HSP mRNA 的表达。
⚝ 翻译抑制机制:热休克反应伴随 全局性抑制 正常翻译。 热休克刺激可以 激活 eIF2α 激酶 HRI, 磷酸化 eIF2α, 抑制 翻译起始。 热休克刺激也可以 破坏 eIF4F 复合物的组装, 抑制 帽子依赖性翻译起始。 IRES 依赖性翻译起始 在热休克条件下 相对增强, 优先翻译 HSP mRNA。
▮▮▮▮ⓑ 内质网应激反应与翻译调控 (Endoplasmic reticulum stress response and translational control):内质网应激 (ER stress) 是内质网功能障碍,错误折叠蛋白质在内质网腔内 积累 时启动的应激反应。内质网应激反应的特点是 未折叠蛋白反应 (unfolded protein response, UPR) 的激活。 UPR 激活可以 全局性抑制 正常翻译, 优先翻译 UPR 相关基因 mRNA。
⚝ PERK 信号通路:内质网应激激活 PERK 激酶, PERK 磷酸化 eIF2α, 抑制 翻译起始。 PERK 信号通路是 UPR 介导的翻译抑制的主要机制。
⚝ ATF4 翻译激活:UPR 激活转录因子 ATF4 (activating transcription factor 4) 的翻译。 ATF4 mRNA 5' UTR 区域存在 uORF,在正常条件下,uORF 翻译 抑制 ATF4 主要 ORF 的翻译。 在内质网应激条件下,eIF2α 磷酸化 降低 全局翻译起始效率,但 增强 ATF4 mRNA 的翻译, 优先翻译 ATF4 蛋白。 ATF4 蛋白 激活 UPR 相关基因的转录, 促进 错误折叠蛋白质的降解和内质网功能的恢复。
▮▮▮▮ⓒ 氨基酸饥饿反应与翻译调控 (Amino acid starvation response and translational control):氨基酸饥饿 (amino acid starvation) 是细胞缺乏氨基酸时启动的应激反应。氨基酸饥饿反应的特点是 全局性抑制 正常翻译, 优先翻译 氨基酸合成和转运相关基因 mRNA。
⚝ GCN2 信号通路:氨基酸饥饿激活 GCN2 激酶, GCN2 磷酸化 eIF2α, 抑制 翻译起始。 GCN2 信号通路是氨基酸饥饿反应介导的翻译抑制的主要机制。
⚝ ATF4 翻译激活:氨基酸饥饿条件下,ATF4 mRNA 的翻译也 优先增强,机制与内质网应激条件下类似。 ATF4 蛋白 激活 氨基酸合成和转运相关基因的转录, 促进 氨基酸的合成和摄取, 缓解 氨基酸饥饿。
细胞应激反应与翻译调控,是细胞应对不利环境条件的重要保护机制,通过 全局性抑制 正常翻译, 节省能量, 优先翻译 应激反应基因, 重塑 细胞的蛋白质合成模式, 提高 细胞的存活能力。 细胞应激反应的异常激活或失调,与多种疾病,包括神经退行性疾病、炎症性疾病和癌症,密切相关。
细胞信号通路与翻译调控,是基因表达调控的重要层面,通过调控翻译机器的活性,影响 mRNA 的翻译效率,实现基因表达的快速响应调控,参与细胞生长、代谢、应激反应、发育调控和疾病发生等多种生物学过程。 对细胞信号通路与翻译调控的深入研究,有助于理解基因表达调控的动态性和精细性,揭示疾病发生的翻译调控机制,为疾病的诊断和治疗提供新的靶点。
6.4 蛋白质水平的调控 (Post-translational Regulation)
介绍蛋白质的翻译后修饰、蛋白质的定位、蛋白质的相互作用和蛋白质的降解在基因表达调控中的作用,以及蛋白质水平调控在快速可逆调控细胞功能中的意义。
6.4.1 蛋白质翻译后修饰的调控作用 (Regulatory Roles of Post-translational Modifications)
蛋白质翻译后修饰 (Post-translational modification, PTM) 是指蛋白质合成后发生的共价修饰,包括磷酸化、糖基化、泛素化、乙酰化和甲基化等。PTM 可以改变蛋白质的结构、活性、定位和相互作用,是蛋白质功能调控的重要机制。PTM 在基因表达的蛋白质水平调控中发挥核心作用。
① 磷酸化 (Phosphorylation)
磷酸化是最常见的 PTM 之一,由蛋白激酶 (protein kinase) 催化,将磷酸基团 (phosphate group) 添加到蛋白质的丝氨酸 (Serine, Ser)、苏氨酸 (Threonine, Thr) 或酪氨酸 (Tyrosine, Tyr) 残基的羟基上。磷酸化可以改变蛋白质的构象和电荷分布,影响蛋白质的活性、相互作用和定位。
▮▮▮▮ⓐ 蛋白激酶与蛋白磷酸酶 (Protein kinases and protein phosphatases):蛋白质的磷酸化状态由蛋白激酶和蛋白磷酸酶 (protein phosphatase) 共同决定。蛋白激酶催化磷酸化反应,蛋白磷酸酶催化去磷酸化反应。细胞内存在大量的蛋白激酶和蛋白磷酸酶,构成复杂的磷酸化信号网络,调控多种细胞功能。
▮▮▮▮ⓑ 磷酸化的调控作用 (Regulatory roles of phosphorylation):磷酸化可以调控蛋白质的多种功能:
⚝ 酶活性调控:磷酸化可以 激活 或 抑制 酶的活性。 例如,蛋白激酶 Akt 的磷酸化激活 Akt 激酶活性,参与细胞生长和存活调控。 蛋白磷酸酶 PP1 的磷酸化抑制 PP1 磷酸酶活性,参与糖原代谢调控。
⚝ 蛋白质相互作用调控:磷酸化可以 促进 或 抑制 蛋白质之间的相互作用。 例如,SH2 结构域和 PTB 结构域能够识别磷酸化酪氨酸残基,介导蛋白质的相互作用。 14-3-3 蛋白能够结合磷酸化丝氨酸或苏氨酸残基,调控蛋白质的定位和功能。
⚝ 蛋白质定位调控:磷酸化可以 改变 蛋白质的亚细胞定位。 例如,NF-κB 抑制蛋白 IκBα 的磷酸化,导致 IκBα 降解, 释放 NF-κB, 转运 到细胞核, 激活 基因转录。
⚝ 蛋白质稳定性调控:磷酸化可以 影响 蛋白质的稳定性。 例如,细胞周期蛋白 Cyclin D1 的磷酸化, 促进 Cyclin D1 的泛素化和降解, 调控 细胞周期进程。
磷酸化是快速可逆的 PTM,蛋白激酶和蛋白磷酸酶的活性受到细胞信号通路的精细调控,磷酸化信号网络能够快速响应细胞内外信号刺激,精细调节蛋白质的功能,参与多种细胞过程。
② 糖基化 (Glycosylation)
糖基化是指将糖链 (glycan) 共价连接到蛋白质上的修饰。糖基化主要发生在真核细胞中,可以改变蛋白质的折叠、稳定性、溶解性、免疫原性和细胞识别等特性。糖基化主要分为 N-糖基化和 O-糖基化两种类型。
▮▮▮▮ⓐ N-糖基化 (N-glycosylation):糖链连接到天冬酰胺 (Asparagine, Asn) 残基的酰胺氮原子上。 N-糖基化通常发生在内质网和高尔基体中,参与分泌蛋白和膜蛋白的折叠、质量控制和运输。
▮▮▮▮ⓑ O-糖基化 (O-glycosylation):糖链连接到丝氨酸 (Serine, Ser) 或苏氨酸 (Threonine, Thr) 残基的羟基上。 O-糖基化可以发生在细胞质、细胞核和高尔基体中,参与蛋白质的折叠、相互作用和信号转导。
▮▮▮▮ⓒ 糖基化的调控作用 (Regulatory roles of glycosylation):糖基化可以调控蛋白质的多种功能:
⚝ 蛋白质折叠与质量控制:N-糖基化参与分泌蛋白和膜蛋白的正确折叠和质量控制。 未正确折叠的糖基化蛋白质,会被内质网质量控制系统识别和降解。
⚝ 蛋白质稳定性与溶解性:糖基化可以 增加 蛋白质的稳定性, 提高 蛋白质的溶解性, 保护 蛋白质免受蛋白酶降解。
⚝ 细胞识别与免疫应答:糖基化修饰的糖链,可以作为细胞表面的 配体 (ligand),参与细胞识别、细胞粘附和免疫应答。 例如,血型抗原和 MHC 分子上的糖基化修饰,参与免疫识别和免疫应答。
⚝ 蛋白质相互作用:糖基化可以 影响 蛋白质之间的相互作用。 例如,糖基化修饰可以 屏蔽 蛋白质表面的相互作用位点, 阻止 蛋白质的相互作用。
糖基化是复杂多样的 PTM,糖链的结构和组成受到多种因素的调控,糖基化修饰模式的异常改变与多种疾病,包括癌症、糖尿病和炎症性疾病,密切相关。
③ 泛素化 (Ubiquitination)
泛素化是指将泛素 (ubiquitin, Ub) 分子共价连接到靶蛋白的赖氨酸 (Lysine, Lys) 残基上的修饰。泛素化可以调控蛋白质的稳定性、定位和相互作用,是蛋白质降解和非降解调控的重要机制。
▮▮▮▮ⓐ 泛素化酶系统 (Ubiquitination enzyme system):泛素化反应由 泛素激活酶 (E1)、 泛素结合酶 (E2) 和 泛素连接酶 (E3) 组成的酶级联系统催化。 E1 激活泛素, E2 结合激活的泛素, E3 识别靶蛋白,并将泛素转移到靶蛋白上。 E3 连接酶是泛素化反应的 特异性决定因子,细胞内存在数百种 E3 连接酶,识别不同的靶蛋白,调控不同的生物学过程。
▮▮▮▮ⓑ 泛素化的类型 (Types of ubiquitination):泛素化可以分为 单泛素化 (monoubiquitination) 和 多泛素化 (polyubiquitination) 两种类型。 多泛素化又可以根据泛素链的连接方式,分为 Lys48 连接的泛素链 (K48-linked polyUb chain) 和 Lys63 连接的泛素链 (K63-linked polyUb chain) 等多种类型。
▮▮▮▮ⓒ 泛素化的调控作用 (Regulatory roles of ubiquitination):不同类型的泛素化修饰,具有不同的调控功能:
⚝ K48 连接的多泛素化:主要 标记 靶蛋白, 引导 靶蛋白被 泛素-蛋白酶体系统 (ubiquitin-proteasome system, UPS) 识别和降解。 K48 连接的多泛素化是蛋白质降解的主要信号。
⚝ K63 连接的多泛素化:主要 调控 蛋白质的非降解功能,例如蛋白质的相互作用、定位和信号转导。 K63 连接的多泛素化参与 DNA 损伤修复、炎症反应和内吞作用等过程。
⚝ 单泛素化:可以 调控 蛋白质的膜转运、DNA 修复和转录调控。 例如,组蛋白 H2B 的单泛素化, 促进 组蛋白 H3K4 甲基化, 激活 基因转录。
泛素化是动态可逆的 PTM, 去泛素化酶 (deubiquitinase, DUB) 能够去除蛋白质上的泛素修饰, 拮抗 泛素化的作用。 泛素化和去泛素化酶系统共同构成精细的泛素化信号网络,调控多种细胞功能。 泛素-蛋白酶体系统是细胞内蛋白质降解的主要途径,参与细胞周期调控、细胞凋亡、信号转导和免疫应答等多种生物学过程。 泛素化系统的异常功能与多种疾病,包括癌症、神经退行性疾病和炎症性疾病,密切相关。
④ 乙酰化与甲基化 (Acetylation and Methylation)
乙酰化和甲基化是发生在赖氨酸 (Lysine, Lys) 和精氨酸 (Arginine, Arg) 残基上的 PTM。 乙酰化和甲基化可以改变蛋白质的电荷分布和结构,影响蛋白质的活性、相互作用和定位。
▮▮▮▮ⓐ 乙酰化 (Acetylation):由乙酰转移酶 (acetyltransferase) 催化,将乙酰基 (acetyl group) 添加到赖氨酸残基的氨基上。 乙酰化可以中和赖氨酸的正电荷, 减弱 蛋白质与 DNA 或 RNA 等负电荷分子的相互作用。 蛋白质乙酰化在基因转录调控、代谢调控和细胞信号转导中发挥重要作用。
⚝ 组蛋白乙酰化:组蛋白乙酰化是基因转录激活的重要修饰。 组蛋白乙酰化酶 (HAT) 催化组蛋白赖氨酸残基的乙酰化, 打开 染色质结构, 促进 基因转录。 组蛋白去乙酰化酶 (HDAC) 催化组蛋白乙酰基的去除, 关闭 染色质结构, 抑制 基因转录。 组蛋白乙酰化和去乙酰化酶的平衡,决定了染色质状态和基因转录活性。
⚝ 非组蛋白乙酰化:非组蛋白也存在乙酰化修饰,例如转录因子、代谢酶和细胞骨架蛋白。 非组蛋白乙酰化可以调控蛋白质的活性、稳定性、定位和相互作用,参与多种细胞过程。
▮▮▮▮ⓑ 甲基化 (Methylation):由甲基转移酶 (methyltransferase) 催化,将甲基 (methyl group) 添加到赖氨酸或精氨酸残基的氨基或胍基上。 甲基化可以改变蛋白质的结构和相互作用,调控蛋白质的功能。 蛋白质甲基化在基因转录调控、信号转导和 RNA 加工中发挥重要作用。
⚝ 组蛋白甲基化:组蛋白甲基化可以 激活 或 抑制 基因转录,取决于甲基化的位点和程度。 例如,组蛋白 H3K4 三甲基化 (H3K4me3) 与基因转录激活相关, 组蛋白 H3K9 三甲基化 (H3K9me3) 和 H3K27 三甲基化 (H3K27me3) 与基因转录抑制相关。 组蛋白甲基转移酶 (HMT) 和组蛋白去甲基化酶 (HDM) 共同调控组蛋白甲基化模式,影响基因表达。
⚝ 非组蛋白甲基化:非组蛋白也存在甲基化修饰,例如 RNA 结合蛋白、信号转导蛋白和 DNA 修复蛋白。 非组蛋白甲基化可以调控蛋白质的活性、相互作用和定位,参与多种细胞过程。
乙酰化和甲基化是重要的 PTM,参与基因表达调控、代谢调控和细胞信号转导等多种生物学过程。 乙酰化和甲基化修饰模式的异常改变与多种疾病,包括癌症、神经退行性疾病和代谢性疾病,密切相关。
蛋白质翻译后修饰是基因表达调控的重要层面,通过快速可逆地改变蛋白质的结构和功能,精细调节蛋白质的活性、稳定性、定位和相互作用,实现基因表达的快速响应调控和精细调节,参与细胞生长、代谢、应激反应、发育调控和疾病发生等多种生物学过程。 对蛋白质翻译后修饰的深入研究,有助于理解基因表达调控的动态性和精细性,揭示疾病发生的蛋白质水平调控机制,为疾病的诊断和治疗提供新的靶点。
6.4.2 蛋白质的定位与调控 (Protein Localization and Regulation)
蛋白质的定位 (Protein localization) 是指蛋白质在细胞内的 亚细胞分布 (subcellular distribution)。 蛋白质的定位决定了蛋白质的作用位点和功能,蛋白质的定位调控是基因表达调控的重要环节。 蛋白质的定位受到多种因素的调控,包括蛋白质的 定位信号 (localization signal)、 转运机制 (transport mechanism) 和 锚定机制 (anchoring mechanism)。
① 蛋白质的细胞内定位信号 (Intracellular Protein Localization Signals)
蛋白质的细胞内定位信号是蛋白质序列中包含的特定氨基酸序列,能够 引导 蛋白质定向运输到特定的细胞器或细胞区域。 常见的蛋白质定位信号包括:
▮▮▮▮ⓐ 信号肽 (Signal peptide):位于分泌蛋白和内质网、高尔基体、溶酶体等细胞器膜蛋白的 N 端,长度约为 15-30 个氨基酸,富含疏水性氨基酸。 信号肽被 信号识别颗粒 (signal recognition particle, SRP) 识别,引导核糖体和 mRNA 复合物靶向内质网膜,实现蛋白质的 共翻译定位 到内质网。
▮▮▮▮ⓑ 核定位信号 (Nuclear localization signal, NLS):位于核蛋白的特定区域,通常富含碱性氨基酸 (赖氨酸和精氨酸)。 NLS 被 核输入受体 (nuclear import receptor, importin) 识别,介导蛋白质 主动转运 进入细胞核。
▮▮▮▮ⓒ 核输出信号 (Nuclear export signal, NES):位于核输出蛋白的特定区域,富含亮氨酸。 NES 被 核输出受体 (nuclear export receptor, exportin) 识别,介导蛋白质 主动转运 出细胞核。
▮▮▮▮ⓓ 线粒体定位信号 (Mitochondrial targeting signal, MTS):位于线粒体蛋白的 N 端,富含碱性氨基酸和疏水性氨基酸。 MTS 被 线粒体输入受体 识别,介导蛋白质 转运 进入线粒体。
▮▮▮▮ⓔ 内质网滞留信号 (Endoplasmic reticulum retention signal, ER retention signal):位于内质网滞留蛋白的 C 端,例如 KDEL 序列 (Lys-Asp-Glu-Leu)。 ER 滞留信号被 KDEL 受体 识别, 阻止 蛋白质从内质网输出, 滞留 在内质网中。
蛋白质的定位信号是蛋白质定位的 密码,不同的定位信号引导蛋白质定向运输到不同的细胞器或细胞区域,决定了蛋白质的亚细胞分布。
② 蛋白质的细胞内转运机制 (Intracellular Protein Transport Mechanisms)
蛋白质的细胞内转运机制是指蛋白质从合成部位 (细胞质核糖体或内质网核糖体) 运输到目的细胞器或细胞区域的 分子机制。 蛋白质的细胞内转运机制主要包括:
▮▮▮▮ⓐ 门控转运 (Gated transport):蛋白质通过 核孔复合体 (nuclear pore complex, NPC) 在细胞质和细胞核之间 选择性转运。 NPC 是细胞核膜上的 通道,允许小分子自由扩散, 介导 大分子 (例如蛋白质和 RNA) 的 主动转运。 核蛋白通过 NLS 引导,被核输入受体识别, 主动转运 进入细胞核。 核输出蛋白通过 NES 引导,被核输出受体识别, 主动转运 出细胞核。
▮▮▮▮ⓑ 跨膜转运 (Transmembrane transport):蛋白质通过 蛋白质转运器 (protein translocator) 在细胞质和细胞器 (例如内质网、线粒体和叶绿体) 之间 跨膜转运。 蛋白质转运器是细胞器膜上的 通道, 介导 蛋白质 单向 跨膜运输。 分泌蛋白和内质网膜蛋白通过信号肽引导,被 SRP 识别, 共翻译 跨膜转运进入内质网。 线粒体蛋白通过 MTS 引导,被线粒体输入受体识别, 翻译后 跨膜转运进入线粒体。
▮▮▮▮ⓒ 囊泡运输 (Vesicular transport):蛋白质通过 囊泡 (vesicle) 在内质网、高尔基体、溶酶体和细胞膜之间 运输。 囊泡运输是 膜泡介导 的蛋白质运输方式,蛋白质被 包裹 在囊泡中,囊泡 出芽 (budding) 和 融合 (fusion) 过程,实现蛋白质在不同细胞器之间的 定向运输。 囊泡运输参与分泌蛋白的 分泌、膜蛋白的 膜转运 和细胞器之间的 物质交换。
蛋白质的细胞内转运机制是蛋白质定位的 执行者,不同的转运机制介导蛋白质定向运输到不同的细胞器或细胞区域,保证蛋白质的正确定位和功能。
③ 蛋白质定位与调控 (Protein Localization and Regulation)
蛋白质的定位调控是基因表达调控的重要层面,蛋白质的定位可以 影响 蛋白质的活性、相互作用和功能。 蛋白质的定位调控机制主要包括:
▮▮▮▮ⓐ 定位信号的调控 (Regulation of localization signals):蛋白质定位信号的 暴露 或 掩蔽,可以调控蛋白质的定位。 例如,转录因子 NF-κB 在细胞质中与抑制蛋白 IκBα 结合, NLS 被 IκBα 掩蔽, NF-κB 定位于细胞质。 当细胞受到刺激时,IκBα 被磷酸化和降解, NLS 暴露, NF-κB 转运 进入细胞核, 激活 基因转录。
▮▮▮▮ⓑ 转运机制的调控 (Regulation of transport mechanisms):蛋白质转运机制的 活性 或 效率,可以调控蛋白质的定位。 例如,细胞周期调控蛋白 Cyclin B1 在细胞质中合成,在细胞周期 G2/M 期, Cyclin B1 的 NLS 被磷酸化, 增强 与核输入受体的相互作用, 促进 Cyclin B1 转运 进入细胞核, 激活 细胞周期进程。
▮▮▮▮ⓒ 锚定机制的调控 (Regulation of anchoring mechanisms):蛋白质与细胞膜或细胞骨架的 结合 或 解离,可以调控蛋白质的定位。 例如,蛋白激酶 Akt 在细胞质中处于 非激活 状态, 当细胞受到生长因子刺激时, Akt 转运 到细胞膜,与膜磷脂 PIP3 结合, 锚定 在细胞膜上,被 PDK1 和 mTORC2 磷酸化 激活, 启动 下游信号通路。
蛋白质的定位调控是快速可逆的,细胞可以根据细胞内外信号刺激, 动态调节 蛋白质的亚细胞分布, 快速改变 蛋白质的功能, 响应 环境变化。 蛋白质的定位调控在细胞信号转导、细胞周期调控、细胞代谢调控和细胞分化调控等多种生物学过程中发挥重要作用。 蛋白质定位异常与多种疾病,包括癌症、神经退行性疾病和免疫缺陷病,密切相关。
6.4.3 蛋白质的相互作用与调控 (Protein-Protein Interactions and Regulation)
蛋白质-蛋白质相互作用 (Protein-protein interaction, PPI) 是指两个或多个蛋白质分子之间通过非共价键形成的 复合体 (complex)。 PPI 是蛋白质功能发挥的基础,蛋白质通过 PPI 形成 功能模块 (functional module) 和 信号通路 (signaling pathway),执行复杂的生物学功能。 蛋白质的相互作用调控是基因表达调控的重要层面。
① 蛋白质-蛋白质相互作用的类型与机制 (Types and Mechanisms of Protein-Protein Interactions)
蛋白质-蛋白质相互作用可以根据相互作用的 强度 和 持续时间,分为 稳定相互作用 (stable interaction) 和 瞬时相互作用 (transient interaction) 两种类型。 根据相互作用的 方式,可以分为:
▮▮▮▮ⓐ 结构域-结构域相互作用 (Domain-domain interaction):蛋白质通过特定的 结构域 (domain) 相互作用。 常见的蛋白质相互作用结构域包括:
⚝ SH2 结构域 (Src homology 2 domain):能够识别磷酸化酪氨酸残基及其周围序列,介导信号转导蛋白的相互作用。
⚝ SH3 结构域 (Src homology 3 domain):能够识别富含脯氨酸的序列,介导细胞骨架蛋白和信号转导蛋白的相互作用。
⚝ PTB 结构域 (Phosphotyrosine-binding domain):能够识别磷酸化酪氨酸残基及其周围序列,与 SH2 结构域功能类似。
⚝ PH 结构域 (Pleckstrin homology domain):能够结合膜磷脂 PIP3,介导蛋白质与细胞膜的结合。
⚝ PDZ 结构域 (PSD-95/Dlg/ZO-1 domain):能够识别 C 端序列,介导细胞连接蛋白和信号转导蛋白的相互作用。
结构域-结构域相互作用是 PPI 的 主要形式,结构域的 模块化 特点,使得蛋白质可以 灵活组合 形成多种 PPI 网络。
▮▮▮▮ⓑ 线性基序介导的相互作用 (Linear motif-mediated interaction):蛋白质通过短的 线性基序 (linear motif) 相互作用。 线性基序通常是长度为 3-10 个氨基酸的短序列,富含特定类型的氨基酸,例如磷酸化位点、泛素化位点和糖基化位点。 线性基序被 模块化结构域 (modular domain) 识别,例如 SH2 结构域识别磷酸化酪氨酸基序, 14-3-3 蛋白识别磷酸化丝氨酸/苏氨酸基序。 线性基序介导的相互作用通常是 瞬时 和 可调控 的,参与信号转导和蛋白质修饰调控。
▮▮▮▮ⓒ 蛋白质折叠和组装介导的相互作用 (Interaction mediated by protein folding and assembly):一些蛋白质通过 蛋白质折叠 和 亚基组装 形成稳定的蛋白质复合体。 例如,核糖体是由 rRNA 和 r-protein 组装形成的 巨大复合体。 蛋白质复合体的形成,需要蛋白质亚基之间的 协同折叠 和 精确组装。 蛋白质折叠和组装介导的相互作用通常是 稳定 和 不可逆 的,参与细胞结构和功能单元的构建。
蛋白质-蛋白质相互作用的机制复杂多样,不同的 PPI 类型具有不同的特点和功能,共同构成复杂的 PPI 网络,执行细胞的各种生物学功能。
② 蛋白质相互作用与调控 (Protein-Protein Interactions and Regulation)
蛋白质相互作用调控是基因表达调控的重要层面,蛋白质的相互作用可以 影响 蛋白质的活性、定位和功能。 蛋白质相互作用调控机制主要包括:
▮▮▮▮ⓐ 酶活性调控 (Regulation of enzyme activity):蛋白质相互作用可以 激活 或 抑制 酶的活性。 例如,细胞周期蛋白依赖性激酶 (cyclin-dependent kinase, CDK) 的活性,需要与细胞周期蛋白 (cyclin) 结合才能 激活。 CDK-cyclin 复合物能够磷酸化靶蛋白, 驱动 细胞周期进程。 蛋白激酶抑制蛋白 (protein kinase inhibitor, PKI) 与蛋白激酶 A (protein kinase A, PKA) 结合, 抑制 PKA 激酶活性, 调控 细胞信号转导。
▮▮▮▮ⓑ 信号通路调控 (Regulation of signaling pathways):蛋白质相互作用是信号通路 信息传递 的基础。 信号通路中的蛋白质,通过 顺序 和 特异性 的 PPI,将细胞外信号 传递 到细胞核, 调控 基因表达。 例如,受体酪氨酸激酶 (RTK) 激活后, 招募 接头蛋白 Grb2, Grb2 结合 SOS 蛋白, SOS 蛋白 激活 Ras 蛋白, 启动 Ras-MAPK 信号通路, 调控 细胞生长和分化。
▮▮▮▮ⓒ 蛋白质定位调控 (Regulation of protein localization):蛋白质相互作用可以 改变 蛋白质的亚细胞定位。 例如,转录因子 NF-κB 与抑制蛋白 IκBα 结合, 定位于 细胞质。 当细胞受到刺激时, IκBα 降解, 释放 NF-κB, NF-κB 转运 进入细胞核, 激活 基因转录。
▮▮▮▮ⓓ 蛋白质稳定性调控 (Regulation of protein stability):蛋白质相互作用可以 影响 蛋白质的稳定性。 例如,肿瘤抑制蛋白 p53 与泛素连接酶 MDM2 结合, 促进 p53 的泛素化和降解, 降低 p53 的蛋白水平。 当细胞受到 DNA 损伤时, p53 磷酸化, 阻止 与 MDM2 的结合, 稳定 p53 蛋白, 激活 细胞周期阻滞和细胞凋亡。
蛋白质相互作用调控是快速可逆的,细胞可以根据细胞内外信号刺激, 动态调节 蛋白质之间的相互作用, 快速改变 蛋白质的功能, 响应 环境变化。 蛋白质相互作用调控在细胞信号转导、细胞周期调控、细胞代谢调控和细胞分化调控等多种生物学过程中发挥重要作用。 蛋白质相互作用异常与多种疾病,包括癌症、神经退行性疾病和免疫缺陷病,密切相关。
6.4.4 蛋白质降解的调控 (Regulation of Protein Degradation)
蛋白质降解 (Protein degradation) 是指细胞内蛋白质被 蛋白酶 (protease) 降解为氨基酸的过程。 蛋白质降解是蛋白质水平调控的重要机制,可以 快速降低 细胞内特定蛋白质的丰度, 调控 蛋白质的功能。 蛋白质降解的调控机制主要包括 泛素-蛋白酶体系统 (ubiquitin-proteasome system, UPS) 和 溶酶体途径 (lysosomal pathway)。
① 泛素-蛋白酶体系统 (Ubiquitin-Proteasome System, UPS)
泛素-蛋白酶体系统 (UPS) 是细胞内蛋白质降解的 主要途径,负责降解 大部分 细胞内蛋白质,包括错误折叠蛋白质、短寿命调控蛋白和受损蛋白质。 UPS 的降解过程包括 泛素化标记 和 蛋白酶体降解 两个步骤。
▮▮▮▮ⓐ 泛素化标记 (Ubiquitination tagging):靶蛋白被 泛素化酶系统 (E1, E2, E3) 标记上 K48 连接的多泛素链。 E3 连接酶识别靶蛋白,决定泛素化的 特异性。
▮▮▮▮ⓑ 蛋白酶体降解 (Proteasomal degradation): 26S 蛋白酶体 识别 K48 连接的多泛素链, 结合 靶蛋白, 去除 泛素链, 解折叠 靶蛋白,并将靶蛋白 降解 为短肽。 26S 蛋白酶体是一个 巨大的蛋白酶复合体,由 20S 核心颗粒 (20S core particle, CP) 和 19S 调节颗粒 (19S regulatory particle, RP) 组成。 20S CP 具有蛋白酶活性,负责蛋白质降解。 19S RP 负责识别泛素化蛋白、去除泛素链、解折叠靶蛋白和将靶蛋白导入 20S CP。
UPS 降解途径具有 高度选择性 和 ATP 依赖性 的特点,能够 快速 和 精确 地降解靶蛋白,调控多种细胞过程。
② 溶酶体途径 (Lysosomal Pathway)
溶酶体途径是细胞内蛋白质降解的 另一重要途径,负责降解 长寿命蛋白质、 细胞器 和 细胞外物质。 溶酶体是细胞内的 消化工厂,含有多种 酸性水解酶 (acid hydrolase),能够降解蛋白质、核酸、脂类和糖类等生物大分子。 溶酶体途径的降解过程包括 自噬 (autophagy) 和 吞噬 (phagocytosis) 两种类型。
▮▮▮▮ⓐ 自噬 (Autophagy):细胞 自身 成分的降解途径。 自噬过程包括 自噬体形成、 自噬体成熟 和 自噬溶酶体融合 三个步骤。
⚝ 自噬体形成 (Autophagosome formation):在细胞质中形成 双层膜结构 的自噬体, 包裹 细胞质成分,例如蛋白质聚集体、受损细胞器和细胞质。
⚝ 自噬体成熟 (Autophagosome maturation):自噬体 成熟, 扩大 体积, 包裹 更多的细胞质成分。
⚝ 自噬溶酶体融合 (Autolysosome fusion):成熟的自噬体与溶酶体 融合,形成 自噬溶酶体。 溶酶体中的酸性水解酶 降解 自噬体包裹的细胞质成分。
自噬途径是细胞 清除 损伤细胞器和蛋白质聚集体的 重要机制,参与细胞的 营养饥饿应激反应 和 细胞器质量控制。
▮▮▮▮ⓑ 吞噬 (Phagocytosis):细胞 吞噬 细胞外物质 (例如细菌、病毒和细胞碎片) 的降解途径。 吞噬过程包括 吞噬体形成、 吞噬体成熟 和 吞噬溶酶体融合 三个步骤。
⚝ 吞噬体形成 (Phagosome formation):细胞膜 延伸 形成 伪足, 包裹 细胞外物质,形成 单层膜结构 的吞噬体。
⚝ 吞噬体成熟 (Phagosome maturation):吞噬体 成熟, 酸化 内部 pH 值。
⚝ 吞噬溶酶体融合 (Phagolysosome fusion):成熟的吞噬体与溶酶体 融合,形成 吞噬溶酶体。 溶酶体中的酸性水解酶 降解 吞噬体包裹的细胞外物质。
吞噬途径是 免疫细胞 (例如巨噬细胞和中性粒细胞) 清除 病原微生物和细胞碎片的 重要机制,参与 免疫防御 和 组织稳态。
溶酶体途径降解途径具有 非选择性 和 酸性 pH 依赖性 的特点,能够 降解 大量细胞成分和细胞外物质,参与细胞的 营养应激反应、 细胞器质量控制 和 免疫防御。
③ 蛋白质降解调控的生物学意义 (Biological Significance of Protein Degradation Regulation)
蛋白质降解调控是基因表达调控的重要层面,通过 快速降低 细胞内特定蛋白质的丰度, 精细调节 蛋白质的功能, 响应 细胞内外信号刺激,参与多种生物学过程和疾病发生。
▮▮▮▮ⓐ 细胞周期调控 (Cell cycle regulation):细胞周期蛋白 (cyclin) 和细胞周期蛋白依赖性激酶抑制蛋白 (CDKI) 的蛋白水平,受到 UPS 途径的 周期性降解 调控, 驱动 细胞周期进程。 例如,Cyclin B1 在有丝分裂期 积累, 激活 CDK1, 启动 有丝分裂。 有丝分裂结束后, Cyclin B1 被 APC/C 泛素连接酶 泛素化 和 降解, 终止 有丝分裂。
▮▮▮▮ⓑ 细胞凋亡调控 (Apoptosis regulation):细胞凋亡相关蛋白 (例如 Bcl-2 家族蛋白和 caspase 蛋白) 的蛋白水平,受到 UPS 途径和溶酶体途径的 精细调控, 决定 细胞的存活或死亡命运。 例如,促凋亡蛋白 Bax 在细胞凋亡信号刺激下, 转运 到线粒体外膜, 诱导 线粒体外膜通透性增加, 释放 细胞色素 c, 激活 caspase 级联反应, 启动 细胞凋亡。 抗凋亡蛋白 Bcl-2 可以 抑制 Bax 的活性, 阻止 细胞凋亡。 Bcl-2 蛋白的蛋白水平受到 UPS 途径的 负调控, 维持 细胞的存活。
▮▮▮▮ⓒ 疾病发生 (Disease development):蛋白质降解调控的异常改变与多种疾病,包括癌症、神经退行性疾病和炎症性疾病,密切相关。 例如,肿瘤抑制基因 p53 的蛋白水平,受到 MDM2 泛素连接酶的 负调控。 肿瘤细胞中 MDM2 基因 过表达 或 p53 基因 突变,导致 p53 蛋白水平 降低 或 功能丧失, 促进 肿瘤发生发展。 神经退行性疾病,例如阿尔茨海默病和帕金森病,与 蛋白质聚集体 在神经元细胞中的 积累 有关。 自噬途径功能 障碍, 无法有效清除 蛋白质聚集体, 导致 神经元细胞功能障碍和死亡。
蛋白质降解调控是基因表达调控的重要层面,通过精细调控蛋白质的降解速率,快速响应信号刺激,精细调节蛋白质的丰度,参与细胞周期调控、细胞凋亡、细胞代谢调控、免疫应答和疾病发生等多种生物学过程。 对蛋白质降解调控的深入研究,有助于理解基因表达调控的动态性和精细性,揭示疾病发生的蛋白质降解调控机制,为疾病的诊断和治疗提供新的靶点。
7. 分子生物学技术 (Molecular Biology Techniques)
本章系统介绍分子生物学中常用的实验技术,包括核酸的分离、纯化、分析、克隆、测序,蛋白质的分离、纯化、分析,以及细胞生物学和基因组学常用技术,为读者提供分子生物学研究的工具箱。
7.1 核酸的分离、纯化与分析 (Nucleic Acid Isolation, Purification, and Analysis)
介绍 DNA 和 RNA 的提取、纯化方法,以及核酸的定量、定性分析技术,如凝胶电泳、核酸酶切、Southern blotting 和 Northern blotting 等。
7.1.1 DNA 的提取与纯化 (DNA Extraction and Purification)
讲解不同来源 DNA (基因组 DNA、质粒 DNA) 的提取方法,以及 DNA 纯化的原理和步骤。
DNA 提取与纯化是分子生物学实验中最基础且关键的步骤之一。其目的是从各种生物样品(如细胞、组织、血液、植物、微生物等)中获取高纯度、完整性好的 DNA,以满足后续实验的需求,例如 PCR (聚合酶链式反应, Polymerase Chain Reaction)、酶切、连接、测序、文库构建等。根据 DNA 的来源和实验目的,DNA 的提取方法和纯化策略也会有所不同。
① DNA 的来源
⚝ 基因组 DNA (genomic DNA, gDNA):指生物体细胞核内染色体上的 DNA,包含了生物体的全部遗传信息。基因组 DNA 的提取通常用于基因组结构分析、基因功能研究、遗传病诊断、物种鉴定等。基因组 DNA 的提取需要裂解细胞核,释放染色体 DNA,并去除 RNA、蛋白质、脂类等杂质。
⚝ 质粒 DNA (plasmid DNA):指细菌、酵母等细胞中存在的环状双链 DNA 分子,可以独立于染色体进行复制。质粒 DNA 常被用作基因克隆和表达的载体。质粒 DNA 的提取通常用于质粒构建、DNA 测序、转染细胞等。质粒 DNA 的提取需要选择性地裂解细菌细胞,释放质粒 DNA,并与细菌染色体 DNA 分离。
② DNA 提取的基本原理
DNA 提取的基本原理是利用 DNA 和其他细胞成分在物理化学性质上的差异,通过一系列步骤将 DNA 从细胞中分离出来并纯化。通用的 DNA 提取步骤主要包括:
⚝ 细胞裂解 (cell lysis):破坏细胞膜和核膜,释放细胞内容物,包括 DNA。常用的裂解方法包括物理方法(如研磨、超声、冻融)和化学方法(如使用 SDS (十二烷基硫酸钠, Sodium dodecyl sulfate)、Triton X-100 等去垢剂)。
⚝ DNA 释放 (DNA release):在裂解液中加入蛋白酶 K (proteinase K) 等蛋白酶,消化细胞裂解物中的蛋白质,特别是与 DNA 结合的组蛋白,使 DNA 从蛋白质中释放出来。同时,RNA 酶 A (RNase A) 可以用于降解 RNA,减少 RNA 对 DNA 纯度的影响。
⚝ 去除杂质 (impurity removal):细胞裂解液中除了 DNA 外,还含有 RNA、蛋白质、脂类、多糖等多种杂质。需要采用不同的方法去除这些杂质,常用的方法包括:
▮▮▮▮⚝ 有机抽提 (organic extraction):使用苯酚 (phenol)、氯仿 (chloroform) 等有机溶剂抽提蛋白质和脂类等杂质。苯酚可以使蛋白质变性沉淀,氯仿可以促进相分离,使变性蛋白质和脂类聚集在有机相和相间层,而 DNA 则保留在水相中。
▮▮▮▮⚝ 柱纯化 (column purification):利用硅胶柱、离子交换柱等吸附柱材料,选择性地吸附 DNA,然后通过洗涤去除杂质,最后用洗脱液将 DNA 从柱子上洗脱下来。柱纯化方法操作简便、快速,纯化效果好,是目前常用的 DNA 纯化方法。
▮▮▮▮⚝ 磁珠法 (magnetic bead method):利用磁珠表面修饰的特定基团(如硅羟基、阳离子基团等)与 DNA 结合,通过磁力分离 DNA 和杂质。磁珠法可以实现自动化操作,适用于高通量 DNA 提取。
⚝ DNA 沉淀与洗涤 (DNA precipitation and washing):为了浓缩 DNA 并进一步去除残留的盐离子、有机溶剂等杂质,通常需要进行 DNA 沉淀。常用的沉淀方法是乙醇沉淀或异丙醇沉淀。在低温和高盐浓度条件下,乙醇或异丙醇可以降低 DNA 的溶解度,使 DNA 聚集沉淀。沉淀后的 DNA 需要用 70% 乙醇洗涤,去除残留的盐离子。
⚝ DNA 回溶 (DNA resuspension):将沉淀的 DNA 溶解到合适的缓冲液中,如 TE 缓冲液 (Tris-EDTA buffer) 或无菌水中。回溶时需要注意充分溶解 DNA,避免 DNA 降解。
③ 常用 DNA 提取方法
⚝ 酚-氯仿抽提法 (phenol-chloroform extraction):经典的 DNA 提取方法,利用苯酚和氯仿抽提蛋白质和脂类杂质,操作步骤相对繁琐,但纯化效果好,DNA 片段长度较长。适用于基因组 DNA 的提取。
⚝ 柱纯化试剂盒法 (column purification kit method):基于硅胶柱吸附原理的 DNA 纯化试剂盒,操作简便、快速,纯化效率高,适用于各种来源 DNA 的提取,包括基因组 DNA 和质粒 DNA。市面上有很多商品化的 DNA 纯化试剂盒,如 Qiagen、Promega、Thermo Fisher 等公司的产品。
⚝ 碱裂解法 (alkaline lysis method):常用于质粒 DNA 的提取。利用碱性条件 (NaOH) 使细菌细胞裂解,染色体 DNA 和质粒 DNA 均变性,然后用酸性条件 (乙酸钾) 中和,小分子环状质粒 DNA 可以复性,而大分子线性染色体 DNA 则难以复性,通过离心可以去除沉淀的染色体 DNA 和细胞碎片,上清液中主要含有质粒 DNA。后续通常结合柱纯化或乙醇沉淀进一步纯化质粒 DNA。
⚝ 磁珠法 (magnetic bead method):利用磁珠吸附 DNA,操作简便、快速,易于自动化。适用于高通量 DNA 提取和自动化工作站。
④ DNA 纯度的评估
提取的 DNA 的纯度直接影响后续实验的成功与否。常用的 DNA 纯度评估方法是紫外分光光度法。通过测定 DNA 样品在 260 nm 和 280 nm 波长下的吸光度值 (A260 和 A280),计算 A260/A280 比值和 A260/A230 比值,可以评估 DNA 的纯度。
⚝ A260/A280 比值:用于评估 DNA 样品中蛋白质的污染程度。DNA 在 260 nm 波长处有最大吸收峰,蛋白质在 280 nm 波长处有最大吸收峰。纯 DNA 的 A260/A280 比值应在 1.8 左右。如果比值偏低,说明 DNA 样品中可能含有蛋白质污染。
⚝ A260/A230 比值:用于评估 DNA 样品中有机溶剂、盐离子、多糖等杂质的污染程度。这些杂质在 230 nm 波长处有吸收峰。纯 DNA 的 A260/A230 比值应在 2.0-2.2 左右。如果比值偏低,说明 DNA 样品中可能含有有机溶剂或盐离子等污染。
除了紫外分光光度法,琼脂糖凝胶电泳也可以用于评估 DNA 的完整性和纯度。高质量的基因组 DNA 电泳后应呈现高分子量条带,没有明显的降解拖尾现象。质粒 DNA 电泳后应呈现超螺旋、线性、开环三种构象的条带。
7.1.2 RNA 的提取与纯化 (RNA Extraction and Purification)
介绍总 RNA、mRNA 和小 RNA 的提取方法,以及 RNA 纯化的注意事项和 RNA 酶的防治。
RNA 提取与纯化与 DNA 提取类似,但由于 RNA 的化学性质更加不稳定,容易被 RNA 酶 (RNase) 降解,因此 RNA 提取需要更加小心谨慎,并采取额外的措施防止 RNA 降解。RNA 提取的目的通常是为了进行基因表达分析 (如 RT-PCR (逆转录聚合酶链式反应, Reverse Transcription Polymerase Chain Reaction)、Northern blotting、RNA-Seq (RNA 测序, RNA Sequencing))、RNA 结构与功能研究等。
① RNA 的种类
根据功能和大小,RNA 可以分为多种类型,常见的 RNA 类型包括:
⚝ 总 RNA (total RNA):指细胞中所有 RNA 的总和,包括 rRNA (核糖体 RNA, ribosomal RNA)、mRNA (信使 RNA, messenger RNA)、tRNA (转移 RNA, transfer RNA) 和各种非编码 RNA (non-coding RNA, ncRNA) 等。总 RNA 提取通常用于基因表达的总体分析。
⚝ mRNA (信使 RNA, messenger RNA):编码蛋白质的 RNA 分子,在总 RNA 中含量相对较低 (约占 1-5%)。mRNA 提取通常用于研究基因的转录水平和蛋白质表达。真核生物 mRNA 具有 poly(A) 尾巴,可以利用 oligo(dT) 磁珠或柱子选择性地分离 mRNA。
⚝ 小 RNA (small RNA):指长度小于 200 nt 的 RNA 分子,包括 miRNA (微小 RNA, microRNA)、siRNA (小干扰 RNA, small interfering RNA)、tRNA、5S rRNA 等。小 RNA 提取通常用于研究 miRNA 和 siRNA 等调控性 RNA 的功能。小 RNA 的提取需要采用特殊的试剂和方法,以富集小分子 RNA。
② RNA 提取的基本原理
RNA 提取的基本原理与 DNA 提取类似,也是利用 RNA 和其他细胞成分在物理化学性质上的差异进行分离纯化。通用的 RNA 提取步骤主要包括:
⚝ 细胞裂解 (cell lysis):破坏细胞结构,释放细胞内容物。RNA 提取常用的裂解液通常含有强烈的 RNA 酶抑制剂,如异硫氰酸胍 (guanidinium thiocyanate) 或盐酸胍 (guanidinium hydrochloride),可以迅速灭活细胞内的 RNA 酶,防止 RNA 降解。
⚝ RNA 释放 (RNA release):裂解液中的 RNA 酶抑制剂可以有效抑制 RNA 酶的活性,保护 RNA 的完整性。
⚝ 去除杂质 (impurity removal):细胞裂解液中含有 DNA、蛋白质、脂类、多糖等杂质,需要采用不同的方法去除这些杂质。常用的方法包括:
▮▮▮▮⚝ 酸性苯酚-氯仿抽提 (acid phenol-chloroform extraction):在酸性条件下 (pH 4.0-4.7),DNA 优先进入有机相,而 RNA 则保留在水相中。通过酸性苯酚-氯仿抽提可以有效分离 RNA 和 DNA。
▮▮▮▮⚝ 柱纯化 (column purification):利用硅胶柱或其他吸附柱材料,选择性地吸附 RNA,然后通过洗涤去除杂质,最后用洗脱液将 RNA 从柱子上洗脱下来。RNA 柱纯化试剂盒通常采用 RNA 酶抑制剂处理过的柱子和缓冲液,以保证 RNA 的完整性。
▮▮▮▮⚝ 磁珠法 (magnetic bead method):利用磁珠吸附 RNA,操作简便、快速,适用于高通量 RNA 提取。
⚝ RNA 沉淀与洗涤 (RNA precipitation and washing):为了浓缩 RNA 并去除残留的盐离子、有机溶剂等杂质,通常需要进行 RNA 沉淀。常用的沉淀方法是乙醇沉淀。RNA 沉淀后的洗涤步骤与 DNA 沉淀类似,也常用 70% 乙醇洗涤。
⚝ RNA 回溶 (RNA resuspension):将沉淀的 RNA 溶解到 RNA 酶 free 的缓冲液中,如 RNA 酶 free 的水或 TE 缓冲液。回溶时需要注意充分溶解 RNA,避免 RNA 降解。
③ 常用 RNA 提取方法
⚝ 异硫氰酸胍-苯酚-氯仿抽提法 (guanidinium thiocyanate-phenol-chloroform extraction):也称为 Trizol 法,是一种经典的 RNA 提取方法,使用 Trizol 试剂 (含有异硫氰酸胍和苯酚的混合液) 裂解细胞,然后通过氯仿抽提和异丙醇沉淀纯化 RNA。Trizol 法提取的总 RNA 质量高,产量高,适用于各种组织和细胞的 RNA 提取。
⚝ 柱纯化试剂盒法 (column purification kit method):基于硅胶柱吸附原理的 RNA 纯化试剂盒,操作简便、快速,纯化效率高。市面上有很多商品化的 RNA 纯化试剂盒,如 Qiagen RNeasy Kit、Thermo Fisher mirVana Kit (用于小 RNA 提取) 等。
⚝ 磁珠法 (magnetic bead method):利用磁珠吸附 RNA,操作简便、快速,易于自动化。适用于高通量 RNA 提取和自动化工作站。
④ RNA 提取的注意事项和 RNA 酶的防治
RNA 酶广泛存在于环境中,且活性极高,即使微量的 RNA 酶污染也可能导致 RNA 样品降解。因此,RNA 提取实验需要特别注意 RNA 酶的防治:
⚝ RNA 酶 free 环境:所有实验用品 (如离心管、枪头、移液器、玻璃器皿等) 必须是 RNA 酶 free 的。一次性塑料制品应购买 RNA 酶 free 认证的产品。玻璃器皿和金属器皿需要经过高温灭菌 (250℃, >3 小时) 或 DEPC (焦碳酸二乙酯, diethylpyrocarbonate) 处理。
⚝ RNA 酶 free 试剂:所有试剂和溶液应使用 RNA 酶 free 的水配制,并经过 RNA 酶抑制剂处理 (如 DEPC 处理或购买 RNA 酶 free 试剂)。
⚝ 操作人员防护:操作人员应佩戴手套、口罩和实验服,防止自身 RNA 酶污染 RNA 样品。实验操作应在超净工作台中进行,减少空气中的 RNA 酶污染。
⚝ 快速操作和低温条件:RNA 提取过程应快速进行,尽量缩短 RNA 暴露在 RNA 酶污染环境中的时间。实验操作应在低温条件下进行 (如 4℃ 或冰浴),降低 RNA 酶的活性。
⚝ RNA 酶抑制剂的应用:在 RNA 提取过程中,裂解液和后续的缓冲液中通常会加入 RNA 酶抑制剂,如异硫氰酸胍、盐酸胍、RNase 抑制蛋白等,以抑制 RNA 酶的活性。
⑤ RNA 纯度的评估
与 DNA 纯度评估类似,RNA 的纯度也常用紫外分光光度法评估。测定 RNA 样品在 260 nm 和 280 nm 波长下的吸光度值 (A260 和 A280),计算 A260/A280 比值和 A260/A230 比值。
⚝ A260/A280 比值:用于评估 RNA 样品中蛋白质的污染程度。纯 RNA 的 A260/A280 比值应在 2.0 左右。
⚝ A260/A230 比值:用于评估 RNA 样品中有机溶剂、盐离子、多糖等杂质的污染程度。纯 RNA 的 A260/A230 比值应在 2.0-2.5 左右。
此外,琼脂糖凝胶电泳也可以用于评估 RNA 的完整性和纯度。高质量的总 RNA 电泳后应呈现清晰的 28S rRNA 和 18S rRNA 条带,且 28S rRNA 条带亮度约为 18S rRNA 条带的两倍,背景无明显的拖尾现象。如果 RNA 降解,则 rRNA 条带模糊或消失,出现低分子量拖尾。
7.1.3 核酸的定量与定性分析 (Nucleic Acid Quantification and Qualitative Analysis)
讲解紫外分光光度法、荧光定量 PCR 等核酸定量方法,以及凝胶电泳、核酸酶切、Southern blotting 和 Northern blotting 等核酸定性分析技术。
核酸的定量与定性分析是分子生物学实验中常用的技术,用于确定核酸的浓度、纯度、分子量大小、序列特征等信息。核酸的定量分析主要用于精确测定核酸的含量,为后续实验提供准确的起始量。核酸的定性分析主要用于判断核酸的质量、完整性、特定序列的存在与否等。
① 核酸的定量方法
⚝ 紫外分光光度法 (UV spectrophotometry) 🧪:
▮▮▮▮⚝ 原理:核酸分子在 260 nm 波长处有最大紫外吸收峰,蛋白质在 280 nm 波长处有吸收峰,一些有机物在 230 nm 波长处有吸收峰。利用紫外分光光度计测定核酸样品在不同波长下的吸光度值,可以定量核酸的浓度,并评估核酸的纯度。
▮▮▮▮⚝ 方法:
1. 使用紫外分光光度计,在 260 nm、280 nm 和 230 nm 波长下分别测定核酸样品的吸光度值 (A260, A280, A230)。
2. 根据 Beer-Lambert 定律,计算核酸的浓度。对于双链 DNA,1 OD260 单位相当于 50 μg/mL 的 DNA 浓度;对于 RNA,1 OD260 单位相当于 40 μg/mL 的 RNA 浓度;对于单链 DNA 或寡核苷酸,1 OD260 单位相当于 33 μg/mL 的浓度。
3. 计算 A260/A280 比值和 A260/A230 比值,评估核酸的纯度。纯 DNA 的 A260/A280 比值应为 ~1.8,A260/A230 比值应为 2.0-2.2。纯 RNA 的 A260/A280 比值应为 ~2.0,A260/A230 比值应为 2.0-2.5。
▮▮▮▮⚝ 优点:操作简便、快速、无需特殊试剂。
▮▮▮▮⚝ 缺点:灵敏度较低,适用于较高浓度的核酸样品;不能区分 DNA 和 RNA;不能提供核酸的分子量大小和序列信息。
⚝ 荧光定量 PCR (quantitative PCR, qPCR) 🧬:
▮▮▮▮⚝ 原理:利用荧光染料或荧光探针,在 PCR 反应过程中实时检测荧光信号的强度,根据荧光信号的累积情况,定量 PCR 产物的量。qPCR 可以用于绝对定量和相对定量。
▮▮▮▮⚝ 方法:
1. 绝对定量 (absolute quantification):使用已知浓度的核酸标准品制作标准曲线,根据标准曲线和样品的 Ct 值 (cycle threshold value, 循环阈值),计算样品中核酸的绝对拷贝数或浓度。
2. 相对定量 (relative quantification):以管家基因 (housekeeping gene) 或内参基因 (internal control gene) 作为参照,比较不同样品之间特定基因的表达水平差异。常用的相对定量方法有 ΔCt 法和 ΔΔCt 法。
▮▮▮▮⚝ 荧光检测系统:qPCR 常用的荧光检测系统包括:
▮▮▮▮▮▮▮▮⚝ 荧光染料法 (intercalating dye method):使用荧光染料 (如 SYBR Green) 嵌入双链 DNA 分子中,产生荧光信号。荧光信号强度与双链 DNA 含量成正比。
▮▮▮▮▮▮▮▮⚝ 荧光探针法 (probe-based method):使用荧光标记的特异性探针 (如 TaqMan 探针、分子信标探针),探针与 PCR 产物特异性结合后,产生荧光信号。荧光信号强度与特异性 PCR 产物含量成正比。
▮▮▮▮⚝ 优点:灵敏度高,特异性强,可以定量低浓度的核酸样品;可以区分 DNA 和 RNA (RT-qPCR);可以进行绝对定量和相对定量。
▮▮▮▮⚝ 缺点:操作相对复杂,需要引物和探针设计,需要 qPCR 仪等专用设备。
② 核酸的定性分析技术
⚝ 凝胶电泳 (gel electrophoresis) 🧫:
▮▮▮▮⚝ 原理:在电场作用下,带负电荷的核酸分子在凝胶介质 (如琼脂糖凝胶、聚丙烯酰胺凝胶) 中泳动。核酸分子的泳动速度与其分子量大小、构象、凝胶浓度等因素有关。分子量小的核酸泳动速度快,分子量大的核酸泳动速度慢。通过凝胶电泳可以分离不同大小的核酸分子,并根据电泳条带的位置和亮度,判断核酸的分子量大小、完整性和相对含量。
▮▮▮▮⚝ 方法:
1. 配制合适浓度的琼脂糖凝胶或聚丙烯酰胺凝胶。
2. 将核酸样品与 loading buffer 混合后,加入凝胶的加样孔中。
3. 施加电场,进行电泳。
4. 电泳结束后,使用核酸染料 (如 EB (溴化乙锭, ethidium bromide)、SYBR Green) 染色凝胶,使核酸条带显现。
5. 在紫外灯或蓝光灯下观察和拍照凝胶电泳结果。
▮▮▮▮⚝ 应用:
▮▮▮▮▮▮▮▮⚝ DNA 凝胶电泳:用于分析 DNA 片段的大小、PCR 产物的验证、质粒 DNA 的鉴定、基因组 DNA 的完整性评估等。
▮▮▮▮▮▮▮▮⚝ RNA 凝胶电泳:用于分析 RNA 的完整性、rRNA 的比例、mRNA 的大小分布等。
▮▮▮▮⚝ 优点:操作简便、直观,可以快速判断核酸的分子量大小和完整性。
▮▮▮▮⚝ 缺点:灵敏度较低,只能定性或半定量分析核酸;不能提供核酸的序列信息。
⚝ 核酸酶切 (nucleic acid digestion) 🔪:
▮▮▮▮⚝ 原理:利用核酸酶 (如限制性内切酶、DNase I、RNase A 等) 特异性地切割核酸分子。限制性内切酶可以识别 DNA 分子上的特定序列 (限制性酶切位点) 并切割 DNA。DNase I 可以非特异性地切割 DNA 分子。RNase A 可以特异性地切割 RNA 分子。通过核酸酶切,可以将核酸分子切割成特定大小的片段,用于后续分析。
▮▮▮▮⚝ 方法:
1. 选择合适的核酸酶和酶切缓冲液。
2. 将核酸样品与核酸酶和酶切缓冲液混合,在适宜的温度下孵育一段时间,进行酶切反应。
3. 酶切反应结束后,使用凝胶电泳分析酶切产物的大小和分布。
▮▮▮▮⚝ 应用:
▮▮▮▮▮▮▮▮⚝ 限制性内切酶酶切:用于构建重组 DNA 分子、基因克隆、DNA 指纹图谱分析、基因分型等。
▮▮▮▮▮▮▮▮⚝ DNase I 酶切:用于去除 RNA 样品中的 DNA 污染、DNA footprinting 分析等。
▮▮▮▮▮▮▮▮⚝ RNase A 酶切:用于去除 DNA 样品中的 RNA 污染、RNA 结构分析等。
▮▮▮▮⚝ 优点:特异性强,可以精确切割核酸分子;可以用于构建重组 DNA 分子。
▮▮▮▮⚝ 缺点:需要选择合适的核酸酶和酶切条件;酶切产物需要通过凝胶电泳等方法进一步分析。
⚝ Southern blotting (Southern 印迹) 📄:
▮▮▮▮⚝ 原理:Southern blotting 是一种用于检测特定 DNA 序列的技术。首先,用限制性内切酶酶切基因组 DNA,然后通过凝胶电泳分离 DNA 片段,将 DNA 片段转移到固相支持物 (如硝酸纤维素膜或尼龙膜) 上,与放射性或非放射性标记的 DNA 探针进行杂交,检测与探针互补的 DNA 序列。
▮▮▮▮⚝ 方法:
1. 用限制性内切酶酶切基因组 DNA。
2. 进行 DNA 凝胶电泳,分离 DNA 片段。
3. 将凝胶中的 DNA 片段转移到固相膜上 (blotting)。
4. 用 DNA 探针与膜上的 DNA 进行杂交 (hybridization)。
5. 洗涤去除未杂交的探针。
6. 检测杂交信号 (放射自显影或化学发光)。
▮▮▮▮⚝ 应用:
▮▮▮▮▮▮▮▮⚝ 检测基因组 DNA 中特定基因或 DNA 片段的存在与否。
▮▮▮▮▮▮▮▮⚝ 分析基因拷贝数、基因重排、DNA 甲基化等。
▮▮▮▮▮▮▮▮⚝ 用于遗传病诊断、基因组图谱构建、转基因生物检测等。
▮▮▮▮⚝ 优点:特异性高,灵敏度较高,可以检测基因组 DNA 中低丰度的特定序列。
▮▮▮▮⚝ 缺点:操作步骤繁琐,耗时较长;需要放射性或化学发光标记的探针。
⚝ Northern blotting (Northern 印迹) 📄:
▮▮▮▮⚝ 原理:Northern blotting 是一种用于检测特定 RNA 转录本的技术,类似于 Southern blotting,但 Northern blotting 的起始材料是 RNA 而不是 DNA。通过 Northern blotting 可以检测细胞或组织中特定基因的 mRNA 表达水平。
▮▮▮▮⚝ 方法:
1. 提取总 RNA 或 mRNA。
2. 进行 RNA 凝胶电泳,分离 RNA 分子。
3. 将凝胶中的 RNA 分子转移到固相膜上 (blotting)。
4. 用 RNA 或 DNA 探针与膜上的 RNA 进行杂交 (hybridization)。
5. 洗涤去除未杂交的探针。
6. 检测杂交信号 (放射自显影或化学发光)。
▮▮▮▮⚝ 应用:
▮▮▮▮▮▮▮▮⚝ 检测细胞或组织中特定基因的 mRNA 表达水平。
▮▮▮▮▮▮▮▮⚝ 分析基因表达模式、可变剪接、RNA 降解等。
▮▮▮▮▮▮▮▮⚝ 用于基因表达调控研究、疾病发生机制研究、药物疗效评估等。
▮▮▮▮⚝ 优点:特异性高,可以检测 RNA 的大小和表达水平。
▮▮▮▮⚝ 缺点:灵敏度相对较低,需要较高量的 RNA 样品;操作步骤繁琐,耗时较长;定量分析精度不如 RT-qPCR。
7.2 DNA 克隆与基因工程 (DNA Cloning and Genetic Engineering)
详细介绍 DNA 克隆的原理和步骤,包括限制性内切酶、DNA 连接酶、载体、转化、筛选等,以及基因工程的基本操作和应用。
DNA 克隆 (DNA cloning) 和基因工程 (genetic engineering) 是分子生物学领域的核心技术,是构建重组 DNA 分子、扩增特定 DNA 片段、改造生物遗传特性的重要手段。DNA 克隆是指将特定的 DNA 片段 (目的基因) 插入到载体 DNA 分子中,构建重组 DNA 分子,然后将重组 DNA 分子导入宿主细胞,利用宿主细胞的复制机制,实现目的基因的扩增和复制。基因工程是在 DNA 克隆的基础上,进一步对基因进行操作和改造,以达到改变生物遗传特性、生产特定产物的目的。
7.2.1 限制性内切酶与 DNA 连接酶 (Restriction Enzymes and DNA Ligases)
介绍限制性内切酶的类型、切割位点和应用,以及 DNA 连接酶的作用机制和应用。
① 限制性内切酶 (restriction enzymes, restriction endonucleases) 🔪
⚝ 定义:限制性内切酶是一类能够识别 DNA 分子上的特定核苷酸序列,并在特定位点切割 DNA 双链的酶。这些特定的核苷酸序列被称为限制性酶切位点 (restriction sites)。限制性内切酶主要来源于细菌,是细菌防御外源 DNA (如噬菌体 DNA) 入侵的一种防御机制。
⚝ 类型:根据酶的结构、酶切位点特异性和辅因子需求等,限制性内切酶可以分为四种主要类型 (Type I, Type II, Type III, Type IV)。在分子生物学实验中最常用的是 Type II 限制性内切酶。Type II 限制性内切酶识别特定的酶切位点,并在酶切位点内或附近切割 DNA 双链,酶切位点通常是回文序列 (palindromic sequence),即正向和反向序列相同。
⚝ 酶切位点:不同的限制性内切酶识别不同的酶切位点。酶切位点的长度通常为 4-8 个碱基对。常见的酶切位点长度为 6 个碱基对 (如 EcoRI, BamHI, HindIII)。酶切位点序列具有多样性,例如:
▮▮▮▮⚝ EcoRI 识别序列:5'-GAATTC-3',切割位点:G↓AATTC
▮▮▮▮⚝ BamHI 识别序列:5'-GGATCC-3',切割位点:G↓GATCC
▮▮▮▮⚝ HindIII 识别序列:5'-AAGCTT-3',切割位点:A↓AGCTT
▮▮▮▮⚝ PstI 识别序列:5'-CTGCAG-3',切割位点:CTGCA↓G
▮▮▮▮⚝ SmaI 识别序列:5'-CCCGGG-3',切割位点:CCC↓GGG
▮▮▮▮⚝ AluI 识别序列:5'-AGCT-3',切割位点:AG↓CT
⚝ 酶切产物:Type II 限制性内切酶酶切 DNA 后,根据酶切位点和切割方式,可以产生两种类型的 DNA 末端:
▮▮▮▮⚝ 黏性末端 (sticky ends, cohesive ends):酶切位点两侧的切割位点不对称,酶切后产生单链突出末端。黏性末端可以是 5' 突出末端或 3' 突出末端。例如,EcoRI, BamHI, HindIII 产生 5' 突出黏性末端,PstI 产生 3' 突出黏性末端。
▮▮▮▮⚝ 平末端 (blunt ends):酶切位点两侧的切割位点对称,酶切后产生平齐的末端。例如,SmaI, AluI 产生平末端。
⚝ 应用:限制性内切酶是 DNA 克隆和基因工程中最常用的工具酶之一。主要应用包括:
▮▮▮▮⚝ DNA 片段的制备:用限制性内切酶酶切 DNA,可以获得特定大小和末端的 DNA 片段,用于基因克隆。
▮▮▮▮⚝ 重组 DNA 分子的构建:用相同的限制性内切酶酶切载体 DNA 和目的基因 DNA,产生相同的黏性末端或平末端,然后用 DNA 连接酶连接,构建重组 DNA 分子。
▮▮▮▮⚝ DNA 指纹图谱分析:利用限制性内切酶酶切基因组 DNA,分析不同个体或物种的 DNA 酶切片段长度多态性 (RFLP, Restriction Fragment Length Polymorphism),用于 DNA 指纹鉴定、亲子鉴定、物种进化分析等。
▮▮▮▮⚝ 基因分型:利用限制性内切酶酶切 PCR 产物或基因组 DNA,分析特定基因位点的多态性,用于基因分型、SNP (单核苷酸多态性, Single Nucleotide Polymorphism) 检测等。
② DNA 连接酶 (DNA ligases) 🧬
⚝ 定义:DNA 连接酶是一类能够催化 DNA 分子中相邻的 3'-OH 末端和 5'-磷酸末端之间形成磷酸二酯键的酶。DNA 连接酶在 DNA 复制、修复和重组过程中发挥重要作用。在 DNA 克隆和基因工程中,DNA 连接酶用于连接 DNA 片段,构建重组 DNA 分子。
⚝ 作用机制:DNA 连接酶催化磷酸二酯键的形成需要 ATP 或 NAD+ 作为能量来源。以 T4 DNA 连接酶 (来源于 T4 噬菌体) 为例,其作用机制主要包括三个步骤:
1. 酶的腺苷酸化 (enzyme adenylylation):T4 DNA 连接酶与 ATP 结合,将 ATP 上的腺苷酰基转移到酶的赖氨酸残基上,形成酶-腺苷酰中间体,并释放焦磷酸 (PPi)。
2. DNA 末端腺苷酸化 (DNA adenylylation):酶-腺苷酰中间体将腺苷酰基转移到 DNA 分子的 5'-磷酸末端,形成 DNA-腺苷酰中间体,并释放腺苷酰化的酶。
3. 磷酸二酯键形成 (phosphodiester bond formation):DNA-腺苷酰中间体上的腺苷酰基被相邻 DNA 分子的 3'-OH 末端攻击,形成磷酸二酯键,并释放 AMP (腺苷单磷酸)。
⚝ 连接效率:DNA 连接酶连接 DNA 片段的效率受多种因素影响,包括:
▮▮▮▮⚝ DNA 末端类型:黏性末端连接效率高于平末端连接效率。黏性末端之间可以通过碱基配对形成氢键,增加连接酶作用的底物浓度和稳定性。平末端连接效率较低,需要较高的连接酶浓度和较长的连接时间。
▮▮▮▮⚝ DNA 末端浓度:DNA 末端浓度过低或过高都会降低连接效率。最佳 DNA 末端浓度通常在 1-10 nM 范围内。
▮▮▮▮⚝ 连接酶浓度:连接酶浓度过低会降低连接效率,连接酶浓度过高可能会导致非特异性连接。
▮▮▮▮⚝ 连接温度和时间:连接反应通常在低温 (4℃ 或 16℃) 下进行,以增加黏性末端的稳定性,并减少 DNA 酶的活性。连接时间根据 DNA 末端类型和连接效率而定,黏性末端连接通常需要 1-2 小时,平末端连接通常需要过夜。
▮▮▮▮⚝ 连接缓冲液:连接缓冲液的 pH 值、离子强度、Mg2+ 浓度等都会影响连接酶的活性和连接效率。
⚝ 应用:DNA 连接酶是 DNA 克隆和基因工程中必不可少的工具酶。主要应用包括:
▮▮▮▮⚝ 重组 DNA 分子的构建:将酶切后的载体 DNA 和目的基因 DNA 用 DNA 连接酶连接,构建重组 DNA 分子。
▮▮▮▮⚝ DNA 片段的连接:将多个 DNA 片段连接成更长的 DNA 分子,用于基因合成、文库构建等。
▮▮▮▮⚝ DNA 修复:在体外或体内修复 DNA 分子中的单链或双链断裂。
▮▮▮▮⚝ 环状 DNA 的形成:将线性 DNA 分子环化,用于质粒构建、环状 RNA 的合成等。
7.2.2 载体 (Vectors)
讲解质粒载体、噬菌体载体、病毒载体、人工染色体载体的类型、特点和应用。
载体 (vector) 是 DNA 克隆和基因工程中用于携带外源 DNA 片段 (目的基因) 进入宿主细胞,并在宿主细胞中复制和表达的 DNA 分子。载体本身具有自我复制能力,可以将外源 DNA 片段复制扩增,并可以在宿主细胞中表达外源基因。根据载体的类型和特点,可以应用于不同的 DNA 克隆和基因工程实验。常用的载体类型主要包括质粒载体、噬菌体载体、病毒载体和人工染色体载体。
① 质粒载体 (plasmid vectors) 🦠
⚝ 定义:质粒载体是最常用的 DNA 克隆载体,来源于细菌或酵母等细胞中的天然质粒。质粒是一种环状双链 DNA 分子,可以独立于宿主细胞染色体进行复制。
⚝ 组成:典型的质粒载体通常包含以下几个基本组成部分:
▮▮▮▮⚝ 复制起点 (origin of replication, ori):是质粒 DNA 在宿主细胞中复制的起始位点,决定了质粒的复制和拷贝数。不同的质粒载体具有不同的复制起点,适用于不同的宿主细胞和拷贝数需求。例如,pUC 系列质粒具有 ColE1 复制起点的高拷贝数质粒,pBR322 质粒具有较低拷贝数的 ColE1 复制起点。
▮▮▮▮⚝ 多克隆位点 (multiple cloning site, MCS):也称为 polylinker,是载体上含有多个限制性酶切位点的区域。这些酶切位点通常是唯一的,且分布密集,方便外源 DNA 片段的插入。不同的质粒载体具有不同的 MCS,可以根据实验需求选择合适的酶切位点。
▮▮▮▮⚝ 筛选标记基因 (selectable marker gene):用于筛选含有重组质粒的宿主细胞。常用的筛选标记基因是抗生素抗性基因 (如氨苄青霉素抗性基因 ampR、卡那霉素抗性基因 kanR)。只有含有抗性基因的宿主细胞才能在含有相应抗生素的培养基中生长。
⚝ 特点:
▮▮▮▮⚝ 操作简便:质粒载体操作简便,易于构建和扩增。
▮▮▮▮⚝ 宿主范围广:质粒载体可以用于细菌、酵母、植物、动物细胞等多种宿主细胞。
▮▮▮▮⚝ 容量有限:质粒载体的容量相对较小,通常适用于克隆 10 kb 以下的 DNA 片段。
▮▮▮▮⚝ 拷贝数可调:质粒载体的拷贝数可以通过选择不同的复制起点或调控元件进行调节。
⚝ 应用:
▮▮▮▮⚝ 基因克隆:将目的基因插入质粒载体,构建重组质粒,用于基因的扩增和表达。
▮▮▮▮⚝ 蛋白质表达:构建表达质粒,用于在宿主细胞中表达外源蛋白质。
▮▮▮▮⚝ 基因功能研究:构建基因敲除、基因过表达质粒,用于研究基因的功能。
▮▮▮▮⚝ 基因治疗:质粒载体可以作为非病毒基因治疗载体,将治疗基因导入靶细胞。
⚝ 常用质粒载体:pUC 系列质粒 (如 pUC18, pUC19)、pBR322 质粒、pBluescript 质粒、pGEM 系列质粒、pET 系列质粒 (用于蛋白质表达)、酵母质粒 (如 YEp, YCp, YIp) 等。
② 噬菌体载体 (phage vectors) 🦠
⚝ 定义:噬菌体载体是利用噬菌体 (主要指 λ 噬菌体和 M13 噬菌体) 作为载体,克隆外源 DNA 片段。噬菌体是感染细菌的病毒,具有高效的感染和复制能力。
⚝ λ 噬菌体载体 (λ phage vectors):
▮▮▮▮⚝ 特点:λ 噬菌体是一种温和噬菌体,其基因组为线性双链 DNA,感染细菌后可以进行裂解性复制或溶原性复制。λ 噬菌体载体容量较大,可以克隆 20 kb 左右的 DNA 片段。
▮▮▮▮⚝ 类型:λ 噬菌体载体主要分为插入型载体 (insertion vectors) 和置换型载体 (replacement vectors)。
▮▮▮▮▮▮▮▮⚝ 插入型载体:在 λ 噬菌体基因组的非必需区 (如 cI 基因) 插入外源 DNA 片段。插入型载体容量较小,通常用于克隆 8 kb 以下的 DNA 片段。
▮▮▮▮▮▮▮▮⚝ 置换型载体:将 λ 噬菌体基因组的非必需区 (如 stuffer 片段) 切除,用外源 DNA 片段替换。置换型载体容量较大,可以克隆 8-20 kb 的 DNA 片段。
▮▮▮▮⚝ 应用:构建基因组 DNA 文库、cDNA 文库,用于基因的分离和克隆。
⚝ M13 噬菌体载体 (M13 phage vectors):
▮▮▮▮⚝ 特点:M13 噬菌体是一种丝状噬菌体,其基因组为环状单链 DNA。M13 噬菌体感染细菌后,不裂解细菌,而是以出芽的方式释放子代噬菌体,感染效率高。M13 噬菌体载体可以用于制备单链 DNA,用于 DNA 测序、定点诱变等。
▮▮▮▮⚝ 应用:
▮▮▮▮▮▮▮▮⚝ DNA 测序:M13 噬菌体载体可以制备单链 DNA 模板,用于 Sanger 测序。
▮▮▮▮▮▮▮▮⚝ 定点诱变:利用 M13 噬菌体载体制备单链 DNA,进行寡核苷酸定点诱变。
▮▮▮▮▮▮▮▮⚝ 噬菌体展示:将外源基因插入 M13 噬菌体外壳蛋白基因中,使外源蛋白质展示在噬菌体表面,用于蛋白质相互作用研究、抗体筛选等。
③ 病毒载体 (viral vectors) 🦠
⚝ 定义:病毒载体是利用病毒作为载体,将外源基因导入宿主细胞。病毒具有高效的感染和基因导入能力,可以用于基因治疗、基因功能研究等。常用的病毒载体主要包括逆转录病毒载体、腺病毒载体和腺相关病毒载体。
⚝ 逆转录病毒载体 (retroviral vectors):
▮▮▮▮⚝ 特点:逆转录病毒 (如 HIV, Moloney murine leukemia virus) 的基因组为 RNA,感染宿主细胞后,通过逆转录酶将 RNA 逆转录成 DNA,整合到宿主细胞染色体上,实现外源基因的长期稳定表达。逆转录病毒载体可以感染分裂和非分裂细胞,基因导入效率高,但存在插入突变和免疫原性风险。
▮▮▮▮⚝ 应用:基因治疗、基因功能研究、干细胞基因修饰等。
⚝ 腺病毒载体 (adenoviral vectors):
▮▮▮▮⚝ 特点:腺病毒 (如人腺病毒 5 型) 的基因组为双链 DNA,感染宿主细胞后,腺病毒 DNA 不整合到宿主细胞染色体上,而是以游离状态存在于细胞核内,实现外源基因的瞬时高水平表达。腺病毒载体可以感染多种类型的细胞,包括分裂和非分裂细胞,基因导入效率高,但存在免疫原性和表达时间短暂的缺点。
▮▮▮▮⚝ 应用:基因治疗、疫苗开发、肿瘤靶向治疗等。
⚝ 腺相关病毒载体 (adeno-associated viral vectors, AAV vectors):
▮▮▮▮⚝ 特点:腺相关病毒 (AAV) 是一种无包膜的单链 DNA 病毒,对人体无致病性,免疫原性低,基因导入效率高,可以感染多种类型的细胞,包括分裂和非分裂细胞。AAV 载体可以将外源基因整合到宿主细胞染色体上,实现外源基因的长期稳定表达,也可以以游离状态存在于细胞核内,实现外源基因的长期表达。AAV 载体是目前基因治疗领域最有前景的病毒载体之一。
▮▮▮▮⚝ 应用:基因治疗、疫苗开发、基因功能研究等。
④ 人工染色体载体 (artificial chromosome vectors) 🧬
⚝ 定义:人工染色体载体是利用染色体的结构和功能元件 (如复制起点、着丝粒、端粒) 构建的,可以像染色体一样在宿主细胞中复制和分离的载体。人工染色体载体容量巨大,可以克隆百万碱基对 (Mb) 级别的 DNA 片段,用于构建大型基因组文库、基因组工程等。
⚝ 类型:常用的人工染色体载体主要包括:
▮▮▮▮⚝ 酵母人工染色体 (yeast artificial chromosomes, YACs):基于酵母染色体结构元件构建的人工染色体,可以在酵母细胞中复制和分离。YAC 载体容量巨大,可以克隆 1 Mb 以上的 DNA 片段,但 YAC 载体构建和操作相对复杂,稳定性较差。
▮▮▮▮⚝ 细菌人工染色体 (bacterial artificial chromosomes, BACs):基于 F 质粒复制起点构建的人工染色体,可以在细菌细胞 (如 E. coli) 中复制和分离。BAC 载体容量较大,可以克隆 300 kb 左右的 DNA 片段,稳定性较好,操作相对简便,是构建基因组 DNA 文库常用的载体。
▮▮▮▮⚝ P1 噬菌体人工染色体 (P1-derived artificial chromosomes, PACs):基于 P1 噬菌体复制起点构建的人工染色体,可以在细菌细胞中复制和分离。PAC 载体容量与 BAC 载体相近,约为 300 kb。
▮▮▮▮⚝ 人人工染色体 (human artificial chromosomes, HACs):基于人染色体结构元件构建的人工染色体,可以在人细胞中复制和分离。HAC 载体是基因治疗和基因组工程的理想载体,但 HAC 载体的构建和操作难度较大,仍处于研究阶段。
⚝ 应用:
▮▮▮▮⚝ 构建大型基因组 DNA 文库:YAC 载体和 BAC 载体是构建大型基因组 DNA 文库的重要工具,用于基因组测序、基因组结构分析、基因组功能研究等。
▮▮▮▮⚝ 基因组工程:人工染色体载体可以用于构建大型基因组片段的载体,进行基因组的转移和改造。
▮▮▮▮⚝ 基因治疗:HAC 载体是基因治疗的理想载体,可以携带大型治疗基因或基因簇,实现基因的长期稳定表达,并减少插入突变风险。
7.2.3 DNA 克隆的步骤 (Steps of DNA Cloning)
详细介绍 DNA 片段的制备、载体的选择和处理、DNA 片段与载体的连接、转化、筛选重组克隆等 DNA 克隆的完整步骤。
DNA 克隆的完整步骤主要包括以下几个关键步骤:
① 目的基因 DNA 片段的制备 (preparation of target DNA fragment) ✂️
⚝ PCR 扩增 (PCR amplification):如果已知目的基因的序列信息,可以通过 PCR 技术从基因组 DNA、cDNA 或质粒 DNA 中扩增目的基因片段。PCR 扩增需要设计合适的引物,引物序列应包含限制性酶切位点,以便于后续的克隆操作。PCR 扩增产物需要进行纯化 (如凝胶回收或柱纯化)。
⚝ 限制性酶切 (restriction enzyme digestion):如果目的基因来源于基因组 DNA 或质粒 DNA,可以使用限制性内切酶酶切目的基因所在的 DNA 分子,获得含有特定末端的目的基因片段。酶切反应需要选择合适的限制性内切酶,酶切条件 (酶浓度、温度、时间) 需要优化。酶切产物需要进行纯化 (如凝胶回收或柱纯化)。
⚝ cDNA 合成 (cDNA synthesis):如果目的基因来源于 RNA,需要先通过逆转录酶将 RNA 反转录成 cDNA,然后使用 PCR 扩增或限制性酶切获得目的基因 cDNA 片段。cDNA 合成需要使用 RNA 酶抑制剂,防止 RNA 降解。
② 载体的选择和处理 (vector selection and preparation) 🧬
⚝ 载体选择:根据实验目的和 DNA 片段的大小,选择合适的载体类型 (质粒载体、噬菌体载体、病毒载体、人工染色体载体) 和具体的载体分子。选择载体时需要考虑载体的容量、复制起点、筛选标记基因、多克隆位点等因素。
⚝ 载体酶切:使用与目的基因 DNA 片段制备相同的限制性内切酶酶切载体 DNA,使载体 DNA 线性化,并产生与目的基因 DNA 片段相同的末端 (黏性末端或平末端)。载体酶切反应需要选择合适的限制性内切酶,酶切条件需要优化。酶切后的载体 DNA 需要进行纯化 (如凝胶回收或柱纯化)。
⚝ 载体去磷酸化 (vector dephosphorylation) (可选步骤):为了减少载体自身环化,提高重组效率,可以对酶切后的载体 DNA 进行去磷酸化处理。使用碱性磷酸酶 (CIP, Calf Intestinal Phosphatase 或 SAP, Shrimp Alkaline Phosphatase) 去除载体 DNA 5'-磷酸末端,使载体 DNA 自身难以环化。去磷酸化后的载体 DNA 需要进行纯化 (如苯酚-氯仿抽提和乙醇沉淀或柱纯化)。
③ DNA 片段与载体的连接 (DNA ligation) 🔗
⚝ 连接反应:将制备好的目的基因 DNA 片段和酶切处理后的载体 DNA 混合,加入 DNA 连接酶和连接缓冲液,在适宜的温度下孵育一段时间,进行连接反应。连接反应的目的是将目的基因 DNA 片段插入到载体 DNA 分子中,形成重组 DNA 分子。
⚝ 连接条件优化:连接反应的效率受多种因素影响,需要优化连接条件,包括 DNA 末端类型 (黏性末端或平末端)、DNA 末端浓度、连接酶浓度、连接温度和时间、连接缓冲液等。黏性末端连接效率高于平末端连接效率。DNA 末端浓度和连接酶浓度需要适当调整。连接温度通常为 16℃ 或 4℃,连接时间根据 DNA 末端类型和连接效率而定。
⚝ 连接产物纯化 (可选步骤):连接反应结束后,可以使用苯酚-氯仿抽提和乙醇沉淀或柱纯化方法纯化连接产物,去除连接酶、缓冲液等杂质,提高转化效率。
④ 转化 (transformation) 🧬
⚝ 转化方法:将连接产物 (重组 DNA 分子) 导入宿主细胞 (常用的宿主细胞是 E. coli 细菌)。常用的转化方法包括:
▮▮▮▮⚝ 化学转化 (chemical transformation):使用 CaCl2 或 MgCl2 处理细菌细胞,使细菌细胞处于感受态 (competent state),然后将 DNA 加入感受态细胞中,通过热激 (heat shock) 或电穿孔 (electroporation) 等方法促进 DNA 进入细胞。化学转化方法操作简便,适用于质粒 DNA 转化。
▮▮▮▮⚝ 电穿孔转化 (electroporation):利用高压脉冲在细胞膜上形成瞬时孔道,使 DNA 分子通过孔道进入细胞。电穿孔转化方法转化效率高,适用于质粒 DNA、噬菌体 DNA 和大型 DNA 分子 (如 BAC DNA) 的转化。
▮▮▮▮⚝ 病毒包装 (viral packaging):对于病毒载体 (如 λ 噬菌体载体、病毒载体),需要先将重组 DNA 分子包装成病毒颗粒,然后用病毒颗粒感染宿主细胞,实现基因导入。病毒包装需要使用特定的包装细胞系和包装质粒。
⚝ 感受态细胞制备:化学转化和电穿孔转化都需要使用感受态细胞。感受态细胞是指经过特殊处理,细胞膜通透性增加,易于 DNA 进入的细胞。感受态细胞可以自行制备,也可以购买商品化的感受态细胞。
⑤ 筛选重组克隆 (screening of recombinant clones) 🔬
⚝ 筛选原理:转化后的宿主细胞中,只有少数细胞成功导入了重组 DNA 分子 (重组克隆)。为了筛选出含有重组 DNA 分子的宿主细胞,需要利用载体上的筛选标记基因进行筛选。常用的筛选方法包括:
▮▮▮▮⚝ 抗生素筛选 (antibiotic selection):如果载体上带有抗生素抗性基因 (如 ampR, kanR),可以将转化后的细菌涂布在含有相应抗生素的培养基上。只有成功转化并含有重组质粒的细菌才能在抗生素培养基上生长,形成菌落。未转化的细菌或未含有重组质粒的细菌会被抗生素杀死。
▮▮▮▮⚝ 蓝白斑筛选 (blue-white screening):基于 lacZ 基因的 α-互补原理。载体上带有 lacZ' 基因 (lacZ 基因的 N 端片段),宿主菌株带有 ΔM15 lacZ 基因 (lacZ 基因的 C 端片段)。当载体没有插入外源 DNA 时,lacZ' 基因和 ΔM15 lacZ 基因可以发生 α-互补,产生有活性的 β-半乳糖苷酶 (β-galactosidase),在含有 X-gal (5-溴-4-氯-3-吲哚-β-D-半乳糖苷) 和 IPTG (异丙基-β-D-硫代半乳糖苷) 的培养基上,菌落呈蓝色。当外源 DNA 插入载体的 lacZ' 基因中时,lacZ' 基因被破坏,不能发生 α-互补,不能产生有活性的 β-半乳糖苷酶,菌落呈白色。因此,蓝色菌落是未重组克隆,白色菌落是重组克隆。
▮▮▮▮⚝ 噬菌斑筛选 (plaque screening):对于噬菌体载体,转化后形成的噬菌斑 (plaque) 可以用于筛选重组克隆。例如,λ 噬菌体载体可以使用 cI 基因失活筛选或 Spi- 筛选等方法筛选重组噬菌斑。
⚝ 克隆鉴定:筛选得到的阳性克隆 (如抗生素抗性菌落、白色菌落、重组噬菌斑) 需要进一步进行克隆鉴定,确认克隆中是否含有目的基因,以及目的基因是否正确插入载体。常用的克隆鉴定方法包括:
▮▮▮▮⚝ 限制性酶切鉴定 (restriction enzyme digestion analysis):提取质粒 DNA 或噬菌体 DNA,用限制性内切酶酶切,进行凝胶电泳分析,根据酶切片段的大小和分布,判断克隆中是否含有目的基因,以及目的基因是否正确插入载体。
▮▮▮▮⚝ PCR 鉴定 (PCR screening):以质粒 DNA 或噬菌体 DNA 为模板,使用目的基因特异性引物进行 PCR 扩增,检测 PCR 产物的大小和序列,判断克隆中是否含有目的基因。
▮▮▮▮⚝ DNA 测序 (DNA sequencing):对质粒 DNA 或噬菌体 DNA 进行 DNA 测序,直接验证克隆中是否含有目的基因,以及目的基因序列是否正确。DNA 测序是最可靠的克隆鉴定方法。
7.2.4 基因工程的应用 (Applications of Genetic Engineering)
介绍基因工程在基因功能研究、蛋白质表达、基因治疗、转基因生物等领域的应用。
基因工程技术在生命科学和生物技术领域具有广泛的应用价值,主要应用领域包括:
① 基因功能研究 (gene function study) 🧬
⚝ 基因敲除 (gene knockout):利用基因工程技术,敲除细胞或生物体中的特定基因,研究该基因的功能。基因敲除可以通过同源重组、CRISPR-Cas9 系统等基因编辑技术实现。基因敲除可以用于研究基因在发育、代谢、疾病发生等过程中的作用。
⚝ 基因敲入 (gene knockin):利用基因工程技术,将外源基因或突变基因精确地插入到细胞或生物体的特定基因位点,研究基因的功能和调控。基因敲入可以通过同源重组、CRISPR-Cas9 系统等基因编辑技术实现。基因敲入可以用于构建基因报告系统、基因标记系统、基因治疗模型等。
⚝ 基因过表达 (gene overexpression):利用基因工程技术,将目的基因克隆到高表达载体中,导入细胞或生物体,使目的基因在细胞或生物体中高水平表达,研究基因的功能和调控。基因过表达可以用于研究基因产物的功能、蛋白质相互作用、信号通路等。
⚝ 基因沉默 (gene silencing):利用 RNA 干扰 (RNA interference, RNAi)、反义寡核苷酸 (antisense oligonucleotides) 等技术,沉默细胞或生物体中特定基因的表达,研究基因的功能。基因沉默可以用于研究基因在细胞生理过程、疾病发生等过程中的作用,也可以用于药物靶点验证和药物开发。
② 蛋白质表达 (protein expression) 🧪
⚝ 原核表达系统 (prokaryotic expression system):利用细菌 (如 E. coli) 作为宿主细胞,表达外源蛋白质。原核表达系统具有表达速度快、成本低廉、易于大规模培养等优点,是蛋白质表达常用的系统。常用的原核表达载体有 pET 系列、pGEX 系列、pMAL 系列等。原核表达系统适用于表达结构简单、无复杂修饰的蛋白质。
⚝ 真核表达系统 (eukaryotic expression system):利用酵母、昆虫细胞、哺乳动物细胞等真核细胞作为宿主细胞,表达外源蛋白质。真核表达系统可以进行蛋白质的正确折叠、糖基化修饰、磷酸化修饰等翻译后修饰,适用于表达结构复杂、需要翻译后修饰的蛋白质。常用的真核表达系统有酵母表达系统 (如毕赤酵母 Pichia pastoris、酿酒酵母 Saccharomyces cerevisiae)、昆虫细胞表达系统 (如 Sf9 细胞、High Five 细胞)、哺乳动物细胞表达系统 (如 CHO 细胞、HEK293 细胞)。
⚝ 无细胞表达系统 (cell-free expression system):在体外模拟细胞内的翻译过程,利用细胞提取物 (如 E. coli 提取物、小麦胚芽提取物、兔网织红细胞裂解液) 进行蛋白质合成。无细胞表达系统具有表达速度快、易于控制反应条件、可以表达有毒蛋白质等优点,适用于快速筛选蛋白质、制备同位素标记蛋白质、高通量蛋白质表达等。
③ 基因治疗 (gene therapy) 💊
⚝ 遗传病基因治疗 (gene therapy for genetic diseases):对于遗传病,可以通过基因治疗将正常基因导入患者细胞,替代或补偿缺陷基因的功能,达到治疗疾病的目的。基因治疗可以分为体细胞基因治疗 (somatic cell gene therapy) 和生殖细胞基因治疗 (germline gene therapy)。目前基因治疗主要集中在体细胞基因治疗。基因治疗载体常用的有病毒载体 (如腺相关病毒载体、逆转录病毒载体、慢病毒载体) 和非病毒载体 (如质粒载体、脂质体、纳米颗粒)。
⚝ 肿瘤基因治疗 (gene therapy for cancer):利用基因工程技术,将治疗基因 (如抑癌基因、自杀基因、免疫调节基因) 导入肿瘤细胞或肿瘤微环境,抑制肿瘤细胞生长、诱导肿瘤细胞凋亡、增强机体抗肿瘤免疫反应,达到治疗肿瘤的目的。肿瘤基因治疗策略包括基因矫正治疗、自杀基因治疗、免疫基因治疗、溶瘤病毒治疗等。
⚝ 感染性疾病基因治疗 (gene therapy for infectious diseases):利用基因工程技术,增强机体抗感染免疫反应、抑制病原微生物复制,达到治疗感染性疾病的目的。感染性疾病基因治疗策略包括基因疫苗、抗病毒基因治疗、抗菌基因治疗等。
④ 转基因生物 (transgenic organisms) 🌱 🐾
⚝ 转基因植物 (transgenic plants):利用基因工程技术,将外源基因导入植物细胞,获得具有特定优良性状的转基因植物。转基因植物可以提高农作物的产量、改善农作物的品质、增强农作物的抗逆性 (如抗虫、抗病、抗除草剂、抗旱、抗盐碱)、生产生物医药产品 (如植物疫苗、植物抗体、生物塑料)。常用的转基因植物技术有农杆菌介导转化法、基因枪转化法、花粉管通道法、叶盘转化法等。
⚝ 转基因动物 (transgenic animals):利用基因工程技术,将外源基因导入动物受精卵或胚胎干细胞,获得具有特定性状的转基因动物。转基因动物可以用于构建疾病动物模型、生产生物医药产品 (如转基因动物乳腺生物反应器生产重组蛋白药物)、改善家畜的生产性能、进行基因功能研究等。常用的转基因动物技术有显微注射法、逆转录病毒感染法、胚胎干细胞介导法、体细胞核移植法、CRISPR-Cas9 基因编辑技术等。
⚝ 转基因微生物 (transgenic microorganisms):利用基因工程技术,改造微生物 (如细菌、酵母、真菌) 的遗传特性,使其具有生产特定产物 (如酶制剂、抗生素、有机酸、生物燃料、生物塑料) 的能力。转基因微生物是工业生物技术的重要基础,可以用于生物制药、生物化工、生物能源、环境保护等领域。常用的转基因微生物技术有质粒转化法、噬菌体转导法、基因组整合法、代谢工程、合成生物学等。
8. 分子生物学在医学中的应用 (Molecular Biology in Medicine)
本章探讨分子生物学在医学领域的应用,包括疾病的分子机制、分子诊断、基因治疗、药物开发和个性化医疗等,展现分子生物学对现代医学的深刻影响。
8.1 疾病的分子机制 (Molecular Mechanisms of Diseases)
介绍癌症、遗传病、感染性疾病、自身免疫性疾病等常见疾病的分子机制,以及分子生物学在疾病机制研究中的作用。
8.1.1 癌症的分子机制 (Molecular Mechanisms of Cancer)
讲解癌基因 (oncogene)、抑癌基因 (tumor suppressor gene)、肿瘤微环境 (tumor microenvironment)、肿瘤转移 (tumor metastasis) 的分子机制,以及癌症的分子分型和靶向治疗。
癌症是一类由细胞生长失控引起的复杂疾病,其发生发展涉及多个层面的分子机制。分子生物学的进步极大地揭示了癌症的本质,从基因突变到信号通路异常,再到表观遗传改变,都为我们理解和对抗癌症提供了新的视角和策略。
① 癌基因 (Oncogenes):
▮ 癌基因是原癌基因 (proto-oncogene) 突变而来,原癌基因是细胞正常生长和分化所必需的基因。当原癌基因发生激活突变 (activating mutation) 时,例如点突变、基因扩增、染色体易位等,就会转变为癌基因,导致细胞生长失控和肿瘤发生。
▮ 癌基因编码的蛋白质通常参与细胞生长信号通路的调控,例如生长因子、生长因子受体、信号转导分子、转录因子等。
▮ 常见的癌基因包括 RAS 基因家族、MYC 基因、ERBB2 (HER2) 基因、PIK3CA 基因等。例如,RAS 基因突变会导致 RAS 蛋白持续激活,从而持续激活下游的 MAPK 信号通路,促进细胞增殖。ERBB2 基因扩增在乳腺癌中常见,导致 HER2 受体过度表达,过度激活下游信号通路。
② 抑癌基因 (Tumor Suppressor Genes):
▮ 抑癌基因是抑制细胞生长和促进细胞凋亡的基因,在维持细胞正常生长和防止肿瘤发生中起着关键作用。抑癌基因通常需要失活突变 (inactivating mutation) 才会失去功能,这种突变通常是双等位基因失活 (biallelic inactivation),即两个拷贝的基因都需要突变。
▮ 抑癌基因编码的蛋白质参与细胞周期调控、DNA 修复、细胞凋亡等过程。
▮ 常见的抑癌基因包括 TP53 基因、RB 基因、PTEN 基因、BRCA1/2 基因等。例如,TP53 基因被称为“基因组卫士”,其编码的 p53 蛋白在 DNA 损伤应答、细胞周期阻滞和细胞凋亡中起着核心作用。RB 基因编码的 RB 蛋白是细胞周期 G1/S 期转换的关键调控因子。BRCA1/2 基因参与 DNA 同源重组修复,其突变与乳腺癌、卵巢癌等多种癌症的发生风险增加有关。
③ 肿瘤微环境 (Tumor Microenvironment, TME):
▮ 肿瘤微环境是指肿瘤细胞周围的细胞、血管、细胞外基质 (extracellular matrix, ECM) 和各种可溶性分子组成的复杂环境。肿瘤微环境并非被动地支持肿瘤生长,而是与肿瘤细胞相互作用,共同促进肿瘤的发生、发展、转移和耐药。
▮ 肿瘤微环境的主要成分包括:
▮▮▮▮ⓐ 肿瘤血管 (Tumor Vasculature):肿瘤生长需要充足的血液供应,肿瘤细胞会分泌血管生成因子 (angiogenic factor),例如血管内皮生长因子 (vascular endothelial growth factor, VEGF),促进肿瘤血管生成。肿瘤血管通常结构异常,通透性高,有利于肿瘤细胞的侵袭和转移。
▮▮▮▮ⓑ 免疫细胞 (Immune Cells):肿瘤微环境中存在多种免疫细胞,包括肿瘤浸润淋巴细胞 (tumor-infiltrating lymphocytes, TILs)、肿瘤相关巨噬细胞 (tumor-associated macrophages, TAMs)、髓系来源抑制细胞 (myeloid-derived suppressor cells, MDSCs) 等。免疫细胞在肿瘤微环境中扮演着双重角色,既可以发挥抗肿瘤免疫作用,也可以被肿瘤细胞招募和调教,促进肿瘤生长和免疫逃逸。
▮▮▮▮ⓒ 成纤维细胞 (Fibroblasts):肿瘤相关成纤维细胞 (cancer-associated fibroblasts, CAFs) 是肿瘤微环境中主要的基质细胞成分,CAFs 可以分泌多种生长因子、细胞因子和 ECM 成分,促进肿瘤细胞增殖、侵袭和转移,并参与肿瘤耐药的形成。
▮▮▮▮ⓓ 细胞外基质 (Extracellular Matrix, ECM):ECM 是由蛋白质和多糖组成的复杂网络,为肿瘤细胞提供结构支持,并调控细胞的生长、分化和迁移。肿瘤微环境中的 ECM 成分和结构发生改变,可以促进肿瘤细胞的侵袭和转移。
④ 肿瘤转移 (Tumor Metastasis):
▮ 肿瘤转移是指肿瘤细胞从原发部位扩散到身体其他部位,形成转移灶 (metastatic lesion) 的过程。肿瘤转移是导致癌症患者死亡的主要原因。肿瘤转移是一个多步骤、复杂的过程,包括:
▮▮▮▮ⓐ 局部侵袭 (Local Invasion):肿瘤细胞突破基底膜,侵入周围组织。
▮▮▮▮ⓑ 血管内渗 (Intravasation):肿瘤细胞进入血液或淋巴循环系统。
▮▮▮▮ⓒ 循环肿瘤细胞 (Circulating Tumor Cells, CTCs):肿瘤细胞在血液或淋巴液中循环。
▮▮▮▮ⓓ 血管外渗 (Extravasation):循环肿瘤细胞从血管或淋巴管中渗出,到达远处器官。
▮▮▮▮ⓔ 转移灶形成 (Metastatic Colonization):肿瘤细胞在远处器官定植、生长,形成转移灶。
▮ 上皮-间质转化 (epithelial-mesenchymal transition, EMT) 是肿瘤转移的关键步骤,EMT 过程中,上皮细胞失去上皮细胞的特征,获得间质细胞的特征,例如细胞连接减弱、运动能力增强、ECM 降解酶分泌增加等,从而促进肿瘤细胞的侵袭和转移。
⑤ 癌症的分子分型和靶向治疗 (Molecular Subtyping and Targeted Therapy of Cancer):
▮ 基于分子特征,例如基因突变、基因表达谱、蛋白质表达谱等,可以将癌症分为不同的分子亚型。不同分子亚型的癌症在生物学行为、预后和对治疗的反应上存在差异。
▮ 分子分型指导精准医疗 (precision medicine) 的发展,针对不同分子亚型的癌症,可以采取不同的靶向治疗 (targeted therapy) 策略。
▮ 靶向治疗是针对肿瘤细胞特有的分子靶点,例如癌基因、信号通路分子、肿瘤血管等,开发相应的靶向药物,选择性地杀伤肿瘤细胞,同时减少对正常细胞的损伤。
▮ 常见的靶向药物包括:
▮▮▮▮ⓐ 小分子靶向药物 (Small Molecule Targeted Drugs):例如酪氨酸激酶抑制剂 (tyrosine kinase inhibitor, TKI),如吉非替尼 (gefitinib)、伊马替尼 (imatinib)、维罗非尼 (vemurafenib) 等。
▮▮▮▮ⓑ 抗体药物 (Antibody Drugs):例如单克隆抗体,如曲妥珠单抗 (trastuzumab)、贝伐珠单抗 (bevacizumab)、西妥昔单抗 (cetuximab) 等。
8.1.2 遗传病的分子机制 (Molecular Mechanisms of Genetic Diseases)
介绍单基因遗传病 (single-gene disorder)、多基因遗传病 (polygenic disorder)、染色体病 (chromosomal disorder)、线粒体病 (mitochondrial disease) 的分子机制,以及遗传病的基因诊断和基因治疗。
遗传病是指由基因突变或染色体异常引起的疾病。根据遗传方式和突变基因的类型,遗传病可以分为多种类型。分子生物学的发展极大地推动了对遗传病分子机制的理解,并为遗传病的诊断和治疗提供了新的手段。
① 单基因遗传病 (Single-Gene Disorders):
▮ 单基因遗传病是由单个基因突变引起的疾病,通常遵循孟德尔遗传规律,例如常染色体显性遗传、常染色体隐性遗传、X连锁显性遗传、X连锁隐性遗传、Y连锁遗传等。
▮ 单基因突变可以导致蛋白质功能丧失、功能获得或功能异常。
▮ 常见的单基因遗传病包括:
▮▮▮▮ⓐ 常染色体显性遗传病 (Autosomal Dominant Disorders):例如家族性高胆固醇血症 (familial hypercholesterolemia)、马凡综合征 (Marfan syndrome)、亨廷顿舞蹈病 (Huntington's disease) 等。通常一个拷贝的突变基因就足以致病。
▮▮▮▮ⓑ 常染色体隐性遗传病 (Autosomal Recessive Disorders):例如囊性纤维化 (cystic fibrosis)、苯丙酮尿症 (phenylketonuria, PKU)、脊髓性肌萎缩症 (spinal muscular atrophy, SMA) 等。通常需要两个拷贝的突变基因才会致病。
▮▮▮▮ⓒ X连锁遗传病 (X-linked Disorders):例如血友病 (hemophilia)、杜氏肌营养不良症 (Duchenne muscular dystrophy, DMD)、红绿色盲 (red-green color blindness) 等。X连锁隐性遗传病在男性中发病率较高,因为男性只有一个 X 染色体。
② 多基因遗传病 (Polygenic Disorders):
▮ 多基因遗传病是由多个基因共同作用,并受环境因素影响的复杂疾病,不遵循简单的孟德尔遗传规律。
▮ 多基因遗传病的发生通常是多个易感基因 (susceptibility gene) 的微小变异累积效应的结果。
▮ 常见的多基因遗传病包括:
▮▮▮▮ⓐ 常见慢性病 (Common Chronic Diseases):例如高血压 (hypertension)、糖尿病 (diabetes mellitus)、冠心病 (coronary heart disease)、阿尔茨海默病 (Alzheimer's disease)、精神分裂症 (schizophrenia)、哮喘 (asthma) 等。
▮▮▮▮ⓑ 先天性畸形 (Congenital Malformations):例如神经管缺陷 (neural tube defects)、唇腭裂 (cleft lip and palate)、先天性心脏病 (congenital heart disease) 等。
③ 染色体病 (Chromosomal Disorders):
▮ 染色体病是由染色体数目或结构异常引起的疾病。染色体异常可以在减数分裂或有丝分裂过程中发生。
▮ 染色体数目异常包括非整倍体 (aneuploidy),例如三体综合征 (trisomy) (多一条染色体) 和单体综合征 (monosomy) (少一条染色体)。
▮ 染色体结构异常包括缺失 (deletion)、重复 (duplication)、倒位 (inversion)、易位 (translocation) 等。
▮ 常见的染色体病包括:
▮▮▮▮ⓐ 唐氏综合征 (Down Syndrome) (21三体综合征):由 21 号染色体三体引起。
▮▮▮▮ⓑ 特纳综合征 (Turner Syndrome) (XO):由女性少一条 X 染色体引起。
▮▮▮▮ⓒ 克氏综合征 (Klinefelter Syndrome) (XXY):由男性多一条 X 染色体引起。
▮▮▮▮ⓓ 猫叫综合征 (Cri-du-chat Syndrome):由 5 号染色体短臂缺失引起。
④ 线粒体病 (Mitochondrial Diseases):
▮ 线粒体病是由线粒体 DNA (mtDNA) 突变或核基因突变影响线粒体功能引起的疾病。线粒体是细胞的能量工厂,负责氧化磷酸化产生 ATP。
▮ mtDNA 突变通常通过母系遗传,因为受精卵的线粒体几乎全部来自卵细胞。
▮ 线粒体病可以影响身体的任何器官和系统,特别是能量需求高的器官,例如神经系统、肌肉、心脏等。
▮ 常见的线粒体病包括:
▮▮▮▮ⓐ Leigh 综合征 (Leigh Syndrome)
▮▮▮▮ⓑ 线粒体脑肌病伴乳酸酸中毒和卒中样发作 (Mitochondrial Encephalomyopathy, Lactic Acidosis, and Stroke-like episodes, MELAS)
▮▮▮▮ⓒ 慢性进行性眼外肌麻痹 (Chronic Progressive External Ophthalmoplegia, CPEO)
⑤ 遗传病的基因诊断和基因治疗 (Genetic Diagnosis and Gene Therapy of Genetic Diseases):
▮ 基因诊断 (genetic diagnosis) 是指通过检测基因或染色体异常来诊断遗传病的方法。基因诊断技术包括 PCR、基因芯片、NGS、染色体核型分析、荧光原位杂交 (fluorescence in situ hybridization, FISH) 等。基因诊断可以用于产前诊断、新生儿筛查、携带者筛查、确诊诊断等。
▮ 基因治疗 (gene therapy) 是指将外源基因导入患者细胞,以纠正基因缺陷或治疗疾病的方法。基因治疗可以分为体细胞基因治疗 (somatic cell gene therapy) 和生殖细胞基因治疗 (germline gene therapy)。目前,基因治疗在单基因遗传病的治疗中取得了一些进展,例如脊髓性肌萎缩症 (SMA) 的基因治疗药物已经上市。基因编辑技术,例如 CRISPR-Cas9 系统,为遗传病的基因治疗带来了新的希望。
8.1.3 感染性疾病的分子机制 (Molecular Mechanisms of Infectious Diseases)
讲解病毒、细菌、真菌、寄生虫等病原微生物的致病机制,以及宿主与病原微生物相互作用的分子机制。
感染性疾病是由病原微生物感染引起的疾病。病原微生物种类繁多,包括病毒、细菌、真菌、寄生虫等。不同病原微生物具有不同的致病机制,宿主与病原微生物之间的相互作用也十分复杂。分子生物学在揭示感染性疾病的分子机制、开发诊断和治疗方法方面发挥着重要作用。
① 病毒的致病机制 (Pathogenic Mechanisms of Viruses):
▮ 病毒是一类结构简单、必须寄生在活细胞内才能复制的微生物。病毒的致病机制多样,主要包括:
▮▮▮▮ⓐ 细胞损伤和破坏 (Cell Damage and Destruction):病毒复制过程中,可以破坏宿主细胞的结构和功能,甚至导致细胞死亡。例如,病毒可以抑制宿主细胞的蛋白质合成、DNA 合成、RNA 合成等。
▮▮▮▮ⓑ 免疫病理损伤 (Immunopathological Damage):宿主免疫系统清除病毒的过程中,可能引起过度的炎症反应和免疫病理损伤。例如,病毒感染引起的细胞因子风暴 (cytokine storm) 可以导致严重的器官损伤。
▮▮▮▮ⓒ 细胞转化 (Cell Transformation):某些病毒,例如肿瘤病毒,可以整合到宿主细胞基因组中,改变细胞的生长特性,导致细胞转化和肿瘤发生。
▮▮▮▮ⓓ 免疫抑制 (Immunosuppression):某些病毒,例如人类免疫缺陷病毒 (human immunodeficiency virus, HIV),可以感染和破坏免疫细胞,导致免疫功能下降,增加继发感染的风险。
▮ 常见的病毒感染性疾病包括:
▮▮▮▮▮▮▮▮❶ 呼吸道病毒感染 (Respiratory Viral Infections):例如流感 (influenza)、普通感冒 (common cold)、新型冠状病毒肺炎 (COVID-19) 等。
▮▮▮▮▮▮▮▮❷ 肝炎病毒感染 (Hepatitis Viral Infections):例如甲型肝炎 (hepatitis A)、乙型肝炎 (hepatitis B)、丙型肝炎 (hepatitis C) 等。
▮▮▮▮▮▮▮▮❸ 神经系统病毒感染 (Nervous System Viral Infections):例如脊髓灰质炎 (poliomyelitis)、脑膜炎 (meningitis)、脑炎 (encephalitis) 等。
▮▮▮▮▮▮▮▮❹ 艾滋病 (Acquired Immunodeficiency Syndrome, AIDS):由 HIV 感染引起。
② 细菌的致病机制 (Pathogenic Mechanisms of Bacteria):
▮ 细菌是一类单细胞原核生物,种类繁多,分布广泛。细菌的致病机制主要包括:
▮▮▮▮ⓐ 毒素产生 (Toxin Production):某些细菌可以产生外毒素 (exotoxin) 和内毒素 (endotoxin)。外毒素是由细菌分泌的毒性蛋白质,具有高度的特异性和毒性,例如破伤风毒素 (tetanus toxin)、肉毒杆菌毒素 (botulinum toxin)、霍乱毒素 (cholera toxin) 等。内毒素是革兰阴性细菌细胞壁的脂多糖 (lipopolysaccharide, LPS) 成分,可以引起炎症反应和全身炎症反应综合征 (systemic inflammatory response syndrome, SIRS)。
▮▮▮▮ⓑ 侵袭和定植 (Invasion and Colonization):某些细菌可以侵入宿主细胞或组织,并在局部定植和繁殖。细菌的侵袭和定植可以破坏宿主组织的结构和功能,引起炎症反应。
▮▮▮▮ⓒ 免疫逃逸 (Immune Evasion):某些细菌可以逃避宿主免疫系统的清除,例如通过荚膜 (capsule) 保护自身、抗原变异、抑制免疫细胞功能等。
▮▮▮▮ⓓ 生物膜形成 (Biofilm Formation):某些细菌可以形成生物膜,生物膜是由细菌细胞和细菌分泌的胞外聚合物 (extracellular polymeric substance, EPS) 组成的结构,生物膜中的细菌对抗生素和宿主免疫防御更具抵抗力,容易导致慢性感染。
▮ 常见的细菌感染性疾病包括:
▮▮▮▮▮▮▮▮❶ 呼吸道细菌感染 (Respiratory Bacterial Infections):例如肺炎 (pneumonia)、肺结核 (tuberculosis)、百日咳 (pertussis) 等。
▮▮▮▮▮▮▮▮❷ 消化道细菌感染 (Digestive Tract Bacterial Infections):例如细菌性痢疾 (bacterial dysentery)、食物中毒 (food poisoning)、幽门螺杆菌感染 (Helicobacter pylori infection) 等。
▮▮▮▮▮▮▮▮❸ 泌尿生殖系统细菌感染 (Urinary and Reproductive System Bacterial Infections):例如尿路感染 (urinary tract infection, UTI)、淋病 (gonorrhea)、梅毒 (syphilis) 等。
▮▮▮▮▮▮▮▮❹ 皮肤和软组织细菌感染 (Skin and Soft Tissue Bacterial Infections):例如疖 (boil)、痈 (carbuncle)、蜂窝织炎 (cellulitis) 等。
③ 真菌的致病机制 (Pathogenic Mechanisms of Fungi):
▮ 真菌是一类真核微生物,包括酵母菌和霉菌。真菌感染称为真菌病 (mycosis)。真菌的致病机制主要包括:
▮▮▮▮ⓐ 组织侵袭 (Tissue Invasion):某些真菌可以侵入宿主组织,并在局部繁殖,引起炎症反应和组织损伤。
▮▮▮▮ⓑ 毒素产生 (Toxin Production):某些真菌可以产生真菌毒素 (mycotoxin),例如黄曲霉毒素 (aflatoxin)、赭曲霉毒素 (ochratoxin) 等,真菌毒素可以引起中毒反应,甚至致癌。
▮▮▮▮ⓒ 免疫病理损伤 (Immunopathological Damage):宿主免疫系统清除真菌的过程中,可能引起过度的炎症反应和免疫病理损伤。
▮▮▮▮ⓓ 过敏反应 (Allergic Reactions):某些真菌可以引起过敏反应,例如过敏性鼻炎 (allergic rhinitis)、哮喘 (asthma) 等。
▮ 常见的真菌感染性疾病包括:
▮▮▮▮▮▮▮▮❶ 浅部真菌病 (Superficial Mycoses):例如皮肤癣菌病 (dermatophytosis)、花斑癣 (pityriasis versicolor)、念珠菌病 (candidiasis) 等。
▮▮▮▮▮▮▮▮❷ 深部真菌病 (Deep Mycoses):例如肺曲霉病 (pulmonary aspergillosis)、隐球菌脑膜炎 (cryptococcal meningitis)、侵袭性念珠菌病 (invasive candidiasis) 等。
▮▮▮▮▮▮▮▮❸ 机会性真菌感染 (Opportunistic Fungal Infections):例如卡氏肺孢子菌肺炎 (Pneumocystis pneumonia, PCP)、毛霉菌病 (mucormycosis) 等,常见于免疫功能低下的患者。
④ 寄生虫的致病机制 (Pathogenic Mechanisms of Parasites):
▮ 寄生虫是一类寄生在宿主体内或体表的生物,包括原虫和蠕虫。寄生虫感染称为寄生虫病 (parasitic disease)。寄生虫的致病机制复杂多样,主要包括:
▮▮▮▮ⓐ 机械性损伤 (Mechanical Damage):寄生虫的活动、移行、寄生等可以引起宿主组织的机械性损伤。例如,蛔虫 (Ascaris lumbricoides) 幼虫在肺部移行可以引起肺部炎症。
▮▮▮▮ⓑ 营养竞争 (Nutritional Competition):寄生虫可以与宿主竞争营养物质,导致宿主营养不良。例如,钩虫 (hookworm) 寄生在肠道内,吸食宿主血液,可以引起贫血。
▮▮▮▮ⓒ 毒素和代谢产物 (Toxins and Metabolic Products):某些寄生虫可以产生毒素或代谢产物,对宿主造成损害。例如,疟原虫 (Plasmodium) 感染引起的疟疾,疟原虫的代谢产物可以引起发热、贫血等症状。
▮▮▮▮ⓓ 免疫病理损伤 (Immunopathological Damage):宿主免疫系统清除寄生虫的过程中,可能引起过度的炎症反应和免疫病理损伤。例如,血吸虫病 (schistosomiasis) 的肝脏纤维化主要是由宿主对虫卵的免疫反应引起的。
▮▮▮▮ⓔ 免疫抑制 (Immunosuppression):某些寄生虫可以抑制宿主免疫系统的功能,例如通过分泌免疫抑制分子、干扰免疫细胞功能等,从而有利于寄生虫的长期寄生。
▮ 常见的寄生虫感染性疾病包括:
▮▮▮▮▮▮▮▮❶ 原虫感染 (Protozoan Infections):例如疟疾 (malaria)、阿米巴病 (amebiasis)、弓形虫病 (toxoplasmosis)、滴虫病 (trichomoniasis) 等。
▮▮▮▮▮▮▮▮❷ 蠕虫感染 (Helminth Infections):例如蛔虫病 (ascariasis)、钩虫病 (hookworm disease)、血吸虫病 (schistosomiasis)、绦虫病 (tapeworm disease) 等。
⑤ 宿主与病原微生物相互作用的分子机制 (Molecular Mechanisms of Host-Pathogen Interactions):
▮ 宿主与病原微生物之间的相互作用是一个动态、复杂的过程。宿主免疫系统识别和清除病原微生物,病原微生物则发展出各种策略逃避宿主免疫防御,并在宿主体内生存和繁殖。
▮ 宿主识别病原微生物的分子机制主要包括:
▮▮▮▮ⓐ 模式识别受体 (Pattern Recognition Receptors, PRRs):宿主细胞表达多种 PRRs,例如 Toll 样受体 (Toll-like receptors, TLRs)、NOD 样受体 (NOD-like receptors, NLRs)、RIG-I 样受体 (RIG-I-like receptors, RLRs) 等,PRRs 可以识别病原微生物的病原相关分子模式 (pathogen-associated molecular patterns, PAMPs),例如细菌的 LPS、肽聚糖 (peptidoglycan)、病毒的 dsRNA、ssRNA、CpG DNA 等,激活下游信号通路,启动固有免疫应答。
▮▮▮▮ⓑ 补体系统 (Complement System):补体系统是固有免疫的重要组成部分,可以通过经典途径、旁路途径和凝集素途径激活,识别和清除病原微生物。补体激活可以促进病原微生物的调理吞噬、炎症反应和直接裂解。
▮▮▮▮ⓒ 抗体 (Antibodies):抗体是适应性免疫的重要组成部分,B 细胞产生抗体可以特异性识别病原微生物的抗原,通过调理作用、中和作用、补体激活等机制清除病原微生物。
▮▮▮▮ⓓ T 细胞受体 (T Cell Receptors, TCRs):T 细胞受体是 T 细胞识别抗原的受体,T 细胞可以识别被感染细胞表面 MHC 分子提呈的病原微生物抗原肽,激活细胞毒性 T 细胞 (cytotoxic T lymphocytes, CTLs) 杀伤被感染细胞,或激活辅助性 T 细胞 (helper T cells, Th cells) 辅助其他免疫细胞发挥作用。
▮ 病原微生物逃避宿主免疫防御的分子机制主要包括:
▮▮▮▮ⓐ 抗原变异 (Antigenic Variation):某些病原微生物,例如流感病毒、HIV,具有高度的抗原变异能力,通过基因突变或重组,改变表面抗原的结构,逃避宿主抗体的中和作用和 T 细胞的识别。
▮▮▮▮ⓑ 免疫抑制 (Immunosuppression):某些病原微生物可以分泌免疫抑制分子,例如细胞因子类似物、免疫检查点分子配体等,抑制宿主免疫细胞的功能。
▮▮▮▮ⓒ 潜伏感染 (Latency):某些病毒,例如疱疹病毒 (herpesviruses),可以建立潜伏感染,病毒基因组整合到宿主细胞基因组中,或以游离形式存在于细胞核内,不产生或少量产生病毒颗粒,逃避宿主免疫系统的清除。
▮▮▮▮ⓓ 胞内寄生 (Intracellular Parasitism):某些细菌和寄生虫可以侵入宿主细胞内,在细胞内生存和繁殖,逃避细胞外免疫机制的清除。
8.1.4 自身免疫性疾病的分子机制 (Molecular Mechanisms of Autoimmune Diseases)
介绍自身免疫性疾病的发生机制、免疫耐受的破坏、自身抗体的产生,以及自身免疫性疾病的分子治疗。
自身免疫性疾病是指免疫系统将自身正常组织和器官误认为外来抗原,攻击自身组织和器官,导致炎症和组织损伤的疾病。自身免疫性疾病的发生机制复杂,涉及遗传因素、环境因素和免疫调节异常等多个方面。分子生物学在揭示自身免疫性疾病的分子机制、开发诊断和治疗方法方面发挥着重要作用。
① 自身免疫性疾病的发生机制 (Mechanisms of Autoimmune Diseases):
▮ 自身免疫性疾病的发生是多种因素相互作用的结果,主要包括:
▮▮▮▮ⓐ 遗传易感性 (Genetic Susceptibility):自身免疫性疾病具有一定的遗传倾向,某些基因,例如主要组织相容性复合体 (major histocompatibility complex, MHC) 基因 (人类的 HLA 基因),与自身免疫性疾病的发生风险增加有关。HLA 分子参与抗原提呈,HLA 基因的多态性影响抗原提呈的效率和 T 细胞的激活,从而影响自身免疫耐受的建立和维持。
▮▮▮▮ⓑ 环境因素 (Environmental Factors):环境因素,例如感染、药物、化学物质、紫外线照射等,可以诱发或加重自身免疫性疾病。感染可能是自身免疫性疾病的重要诱发因素,分子模拟 (molecular mimicry) 机制认为,某些病原微生物的抗原与自身抗原具有相似的结构,感染后产生的针对病原微生物抗原的抗体或 T 细胞,可能与自身抗原发生交叉反应,攻击自身组织。
▮▮▮▮ⓒ 免疫调节异常 (Immune Dysregulation):免疫调节异常是自身免疫性疾病发生的核心机制。正常的免疫系统具有自身耐受 (self-tolerance) 机制,防止免疫系统攻击自身组织。自身免疫耐受的破坏是自身免疫性疾病发生的基础。自身免疫耐受的破坏可能涉及:
▮▮▮▮▮▮▮▮❹ 中枢耐受缺陷 (Defects in Central Tolerance):中枢耐受是指在胸腺和骨髓中,通过阴性选择 (negative selection) 清除或受体编辑 (receptor editing) 改变识别自身抗原的 T 细胞和 B 细胞,从而建立自身耐受。中枢耐受缺陷可能导致识别自身抗原的 T 细胞和 B 细胞逃脱中枢耐受,进入外周免疫系统。
▮▮▮▮▮▮▮▮❺ 外周耐受缺陷 (Defects in Peripheral Tolerance):外周耐受是指在外周免疫系统中,通过克隆清除 (clonal deletion)、克隆无能 (clonal anergy)、免疫抑制 (immune suppression) 等机制抑制自身反应性 T 细胞和 B 细胞的激活和功能,从而维持自身耐受。外周耐受缺陷可能导致自身反应性 T 细胞和 B 细胞在外周免疫系统中被激活,攻击自身组织。调节性 T 细胞 (regulatory T cells, Tregs) 在外周耐受的维持中起着重要作用,Tregs 功能缺陷与多种自身免疫性疾病的发生有关。
② 免疫耐受的破坏 (Breakdown of Immune Tolerance):
▮ 免疫耐受是指免疫系统对自身抗原不发生免疫应答的状态。自身免疫性疾病的发生是免疫耐受破坏的结果。免疫耐受的破坏机制复杂,可能涉及:
▮▮▮▮ⓐ 自身抗原释放增加 (Increased Release of Self-Antigens):正常情况下,某些自身抗原被隔离在特定组织或细胞内,不与免疫系统接触,称为隐蔽抗原 (sequestered antigens)。组织损伤、细胞坏死、炎症反应等可以导致隐蔽抗原释放,与免疫系统接触,诱发自身免疫应答。
▮▮▮▮ⓑ 抗原提呈异常 (Abnormal Antigen Presentation):抗原提呈细胞 (antigen-presenting cells, APCs),例如树突状细胞 (dendritic cells, DCs)、巨噬细胞 (macrophages)、B 细胞等,负责提呈抗原给 T 细胞,启动免疫应答。抗原提呈异常,例如 MHC 分子异常表达、共刺激分子异常表达、自身抗原修饰等,可以导致自身反应性 T 细胞被激活。
▮▮▮▮ⓒ T 细胞和 B 细胞激活异常 (Abnormal Activation of T and B Cells):自身反应性 T 细胞和 B 细胞逃脱自身耐受后,在外周免疫系统中可能被激活,攻击自身组织。T 细胞和 B 细胞激活异常可能涉及:
▮▮▮▮▮▮▮▮❹ 辅助性 T 细胞 (Th Cells) 功能失调:Th1 细胞、Th17 细胞等效应性 Th 细胞功能亢进,而 Tregs 功能缺陷,导致免疫应答失衡,促进自身免疫反应。
▮▮▮▮▮▮▮▮❺ B 细胞激活过度:B 细胞激活过度,产生大量自身抗体,参与自身免疫病理损伤。
▮▮▮▮ⓕ 免疫清除机制缺陷 (Defects in Immune Clearance Mechanisms):正常的免疫清除机制,例如凋亡细胞清除、免疫复合物清除等,可以清除自身抗原和免疫复合物,防止自身免疫反应。免疫清除机制缺陷可能导致自身抗原和免疫复合物积累,持续刺激免疫系统,诱发自身免疫性疾病。
③ 自身抗体的产生 (Production of Autoantibodies):
▮ 自身抗体是指免疫系统产生的针对自身抗原的抗体。自身抗体是自身免疫性疾病的重要特征性标志物,可以参与自身免疫病理损伤,也可以作为自身免疫性疾病的诊断指标。
▮ 自身抗体的产生机制复杂,可能涉及:
▮▮▮▮ⓐ B 细胞耐受破坏 (Breakdown of B Cell Tolerance):B 细胞耐受的破坏可能导致自身反应性 B 细胞被激活,产生自身抗体。
▮▮▮▮ⓑ T 细胞辅助 (T Cell Help):辅助性 T 细胞 (Th cells) 可以辅助 B 细胞激活和抗体产生。自身反应性 Th 细胞可以辅助自身反应性 B 细胞激活,产生自身抗体。
▮▮▮▮ⓒ 体细胞高频突变和亲和力成熟 (Somatic Hypermutation and Affinity Maturation):B 细胞在生发中心 (germinal center) 发生体细胞高频突变和亲和力成熟,可以提高抗体的亲和力。自身反应性 B 细胞也可能通过体细胞高频突变和亲和力成熟,产生高亲和力的自身抗体。
▮▮▮▮ⓓ 表位扩散 (Epitope Spreading):自身免疫反应初期,可能只针对少数自身抗原表位。随着疾病的进展,免疫反应可能扩散到更多的自身抗原表位,称为表位扩散。表位扩散可以导致自身抗体种类增多,自身免疫反应加重。
▮ 常见的自身抗体类型包括:
▮▮▮▮▮▮▮▮❶ 抗核抗体 (Antinuclear Antibodies, ANAs):例如抗 dsDNA 抗体、抗 Sm 抗体、抗 SSA/Ro 抗体、抗 SSB/La 抗体等,常见于系统性红斑狼疮 (systemic lupus erythematosus, SLE)。
▮▮▮▮▮▮▮▮❷ 类风湿因子 (Rheumatoid Factor, RF):常见于类风湿关节炎 (rheumatoid arthritis, RA)。
▮▮▮▮▮▮▮▮❸ 抗环瓜氨酸肽抗体 (Anti-cyclic Citrullinated Peptide Antibodies, Anti-CCP Antibodies):常见于类风湿关节炎 (RA),特异性较高。
▮▮▮▮▮▮▮▮❹ 抗甲状腺抗体 (Anti-thyroid Antibodies):例如抗甲状腺球蛋白抗体 (anti-thyroglobulin antibodies, TgAb)、抗甲状腺过氧化物酶抗体 (anti-thyroid peroxidase antibodies, TPOAb),常见于桥本甲状腺炎 (Hashimoto's thyroiditis) 和格雷夫斯病 (Graves' disease)。
④ 自身免疫性疾病的分子治疗 (Molecular Therapy of Autoimmune Diseases):
▮ 自身免疫性疾病的治疗目标是控制炎症反应,抑制自身免疫应答,保护靶器官功能。分子治疗是自身免疫性疾病治疗的新方向,主要包括:
▮▮▮▮ⓐ 免疫抑制剂 (Immunosuppressants):传统的免疫抑制剂,例如糖皮质激素 (glucocorticoids)、环磷酰胺 (cyclophosphamide)、硫唑嘌呤 (azathioprine)、甲氨蝶呤 (methotrexate)、环孢素 (cyclosporine)、他克莫司 (tacrolimus) 等,通过抑制免疫细胞的增殖和功能,达到免疫抑制的目的。
▮▮▮▮ⓑ 生物制剂 (Biologics):生物制剂是利用生物技术生产的治疗性蛋白质,靶向特定的免疫分子或细胞,具有更高的靶向性和选择性,副作用相对较小。常见的生物制剂包括:
▮▮▮▮▮▮▮▮❸ 肿瘤坏死因子 α (Tumor Necrosis Factor α, TNF-α) 抑制剂:例如英夫利昔单抗 (infliximab)、阿达木单抗 (adalimumab)、依那西普 (etanercept) 等,用于治疗类风湿关节炎 (RA)、强直性脊柱炎 (ankylosing spondylitis)、克罗恩病 (Crohn's disease) 等。
▮▮▮▮▮▮▮▮❹ 白细胞介素 1 (Interleukin-1, IL-1) 抑制剂:例如阿那白滞素 (anakinra)、卡那奴单抗 (canakinumab) 等,用于治疗类风湿关节炎 (RA)、家族性地中海热 (familial Mediterranean fever) 等。
▮▮▮▮▮▮▮▮❺ 白细胞介素 6 (Interleukin-6, IL-6) 受体抑制剂:例如托珠单抗 (tocilizumab)、沙利度胺 (sarilumab) 等,用于治疗类风湿关节炎 (RA)、幼年特发性关节炎 (juvenile idiopathic arthritis) 等。
▮▮▮▮▮▮▮▮❻ B 细胞靶向治疗药物:例如利妥昔单抗 (rituximab),靶向 B 细胞表面 CD20 分子,清除 B 细胞,用于治疗类风湿关节炎 (RA)、系统性红斑狼疮 (SLE)、血管炎 (vasculitis) 等。
▮▮▮▮▮▮▮▮❼ T 细胞共刺激分子阻断剂:例如阿巴西普 (abatacept),阻断 T 细胞共刺激分子 CD28 与 APC 表面共刺激分子 B7 的结合,抑制 T 细胞激活,用于治疗类风湿关节炎 (RA)。
▮▮▮▮▮▮▮▮❽ 整合素抑制剂:例如维多珠单抗 (vedolizumab),阻断整合素 α4β7 与肠道血管内皮细胞表面黏附分子 MAdCAM-1 的结合,抑制淋巴细胞向肠道迁移,用于治疗炎症性肠病 (inflammatory bowel disease, IBD)。
▮▮▮▮ⓘ 小分子免疫调节剂 (Small Molecule Immunomodulators):例如 JAK 激酶抑制剂 (Janus kinase inhibitors, JAK inhibitors),如托法替尼 (tofacitinib)、巴瑞替尼 (baricitinib)、乌帕替尼 (upadacitinib) 等,抑制 JAK-STAT 信号通路,调节免疫细胞功能,用于治疗类风湿关节炎 (RA)、银屑病关节炎 (psoriatic arthritis)、溃疡性结肠炎 (ulcerative colitis) 等。
▮▮▮▮ⓙ 细胞治疗 (Cell Therapy):例如调节性 T 细胞 (Treg) 治疗、嵌合抗原受体 T 细胞 (Chimeric Antigen Receptor T-cell, CAR-T) 治疗等,处于临床研究阶段,有望为自身免疫性疾病的治疗带来新的突破。
8.2 分子诊断 (Molecular Diagnostics)
介绍分子诊断的原理、方法和应用,包括基因诊断、核酸检测、蛋白质诊断、循环肿瘤细胞检测、液体活检等。
分子诊断是指利用分子生物学技术,检测生物大分子 (核酸、蛋白质等) 的结构、功能和表达水平的变化,从而对疾病进行诊断、预后评估、疗效监测和个体化治疗指导的技术。分子诊断具有灵敏度高、特异性强、快速准确等优点,在疾病的早期诊断、精准分型和个体化治疗中发挥着越来越重要的作用。
8.2.1 基因诊断 (Genetic Diagnosis)
讲解基因诊断的原理、方法 (PCR、基因芯片、NGS)、应用 (遗传病诊断、肿瘤基因检测、药物基因组学) 和伦理问题。
基因诊断是指通过检测基因的结构和功能异常,例如基因突变、基因缺失、基因扩增、染色体异常等,来诊断疾病的方法。基因诊断主要用于遗传病、肿瘤和感染性疾病的诊断。
① 基因诊断的原理 (Principles of Genetic Diagnosis):
▮ 基因诊断的原理是基于基因与疾病的关系 (gene-disease association)。许多疾病的发生与基因的异常有关,例如遗传病是由基因突变引起的,肿瘤的发生发展与癌基因和抑癌基因的突变有关,感染性疾病的病原微生物具有特定的基因序列。
▮ 基因诊断通过检测患者样本 (血液、组织、体液等) 中的 DNA 或 RNA,分析基因的结构和功能是否异常,从而判断患者是否患有某种疾病或具有某种疾病的易感性。
② 基因诊断的方法 (Methods of Genetic Diagnosis):
▮ 基因诊断的方法多种多样,常用的方法包括:
▮▮▮▮ⓐ 聚合酶链式反应 (Polymerase Chain Reaction, PCR):PCR 是一种体外 DNA 扩增技术,可以快速扩增 DNA 片段,用于检测基因突变、基因多态性、病原微生物核酸等。常用的 PCR 技术包括:
▮▮▮▮▮▮▮▮❷ 等位基因特异性 PCR (Allele-Specific PCR, AS-PCR):用于检测已知位点的点突变。
▮▮▮▮▮▮▮▮❸ 实时荧光定量 PCR (Real-time Quantitative PCR, qPCR):用于定量检测 DNA 或 RNA 的含量,例如基因表达水平、病毒载量等。
▮▮▮▮▮▮▮▮❹ 数字 PCR (Digital PCR, dPCR):一种高灵敏度的 PCR 技术,可以对核酸分子进行绝对定量。
▮▮▮▮ⓔ 基因芯片 (DNA Microarray):基因芯片是一种高通量基因检测技术,可以在一块芯片上同时检测数千甚至数万个基因的表达水平或基因突变。基因芯片主要用于基因表达谱分析、基因分型、SNP 检测等。
▮▮▮▮ⓕ 新一代测序 (Next-Generation Sequencing, NGS):NGS 是一种高通量、高效率的 DNA 或 RNA 测序技术,可以一次性对数百万甚至数十亿个 DNA 或 RNA 分子进行测序。NGS 技术包括:
▮▮▮▮▮▮▮▮❼ 全基因组测序 (Whole-Genome Sequencing, WGS):对个体基因组的全部 DNA 序列进行测序,用于发现新的基因突变、基因组结构变异等。
▮▮▮▮▮▮▮▮❽ 全外显子组测序 (Whole-Exome Sequencing, WES):对外显子区域 (编码蛋白质的 DNA 区域) 进行测序,用于检测蛋白质编码基因的突变。
▮▮▮▮▮▮▮▮❾ 靶向基因测序 (Targeted Gene Sequencing):对特定基因或基因区域进行测序,例如肿瘤靶向基因 panel 测序,用于检测已知与疾病相关的基因突变。
▮▮▮▮▮▮▮▮❿ RNA 测序 (RNA Sequencing, RNA-Seq):对 RNA 进行测序,用于分析基因表达谱、可变剪接、新转录本发现等。
▮▮▮▮ⓚ 荧光原位杂交 (Fluorescence In Situ Hybridization, FISH):FISH 是一种细胞遗传学技术,利用荧光标记的 DNA 探针与细胞或染色体上的特定 DNA 序列杂交,检测染色体数目异常、染色体结构变异、基因扩增等。
▮▮▮▮ⓛ 染色体核型分析 (Karyotyping):染色体核型分析是一种传统的细胞遗传学技术,通过显微镜观察染色体的数目和结构,检测染色体数目异常和大的染色体结构变异。
▮▮▮▮ⓜ Southern 印迹杂交 (Southern Blotting):Southern 印迹杂交是一种 DNA 印迹杂交技术,用于检测 DNA 片段的大小和拷贝数,例如基因缺失、基因扩增、基因重排等。
▮▮▮▮ⓝ Sanger 测序 (Sanger Sequencing):Sanger 测序是一种传统的 DNA 测序技术,用于测定 DNA 片段的序列。Sanger 测序的准确性高,但通量较低,成本较高,主要用于小片段 DNA 测序和验证 NGS 结果。
③ 基因诊断的应用 (Applications of Genetic Diagnosis):
▮ 基因诊断在医学领域具有广泛的应用,主要包括:
▮▮▮▮ⓐ 遗传病诊断 (Diagnosis of Genetic Diseases):基因诊断是遗传病诊断的金标准,可以用于诊断单基因遗传病、多基因遗传病、染色体病、线粒体病等。基因诊断可以用于:
▮▮▮▮▮▮▮▮❷ 产前诊断 (Prenatal Diagnosis):在胎儿出生前进行基因诊断,例如通过羊水穿刺、绒毛膜取样、无创产前 DNA 检测 (non-invasive prenatal testing, NIPT) 等方法获取胎儿细胞或游离 DNA,进行基因检测,诊断胎儿是否患有遗传病。
▮▮▮▮▮▮▮▮❸ 新生儿筛查 (Newborn Screening):在新生儿出生后进行基因筛查,早期发现某些遗传代谢病,例如苯丙酮尿症 (PKU)、先天性甲状腺功能减退症 (congenital hypothyroidism) 等,以便早期干预治疗,防止疾病发生或减轻疾病程度。
▮▮▮▮▮▮▮▮❹ 携带者筛查 (Carrier Screening):对健康人群进行基因筛查,检测是否携带某些隐性遗传病的致病基因,例如囊性纤维化 (cystic fibrosis)、脊髓性肌萎缩症 (SMA) 等,为生育指导提供依据。
▮▮▮▮▮▮▮▮❺ 确诊诊断 (Definitive Diagnosis):对已出现临床症状的患者进行基因诊断,明确诊断,指导治疗和预后评估。
▮▮▮▮ⓕ 肿瘤基因检测 (Tumor Genetic Testing):肿瘤基因检测是肿瘤精准医疗的基础,可以用于:
▮▮▮▮▮▮▮▮❼ 肿瘤分子分型 (Tumor Molecular Subtyping):根据肿瘤的基因突变谱,将肿瘤分为不同的分子亚型,例如乳腺癌的 HER2 阳性型、三阴性型等,指导靶向治疗和化疗方案的选择。
▮▮▮▮▮▮▮▮❽ 肿瘤靶向药物指导 (Targeted Therapy Guidance):检测肿瘤组织中是否存在靶向药物的靶点基因突变,例如 EGFR 突变、ALK 融合、BRAF V600E 突变等,指导靶向药物的选择和使用。
▮▮▮▮▮▮▮▮❾ 肿瘤耐药机制检测 (Tumor Resistance Mechanism Detection):在靶向治疗或化疗耐药后,检测肿瘤组织中是否存在耐药基因突变,例如 EGFR T790M 突变、ALK 耐药突变等,指导后续治疗方案的选择。
▮▮▮▮▮▮▮▮❿ 肿瘤预后评估 (Tumor Prognosis Assessment):某些基因突变与肿瘤的预后相关,例如 TP53 突变、BRCA1/2 突变等,基因检测结果可以用于肿瘤预后评估。
▮▮▮▮▮▮▮▮❺ 肿瘤复发监测 (Tumor Recurrence Monitoring):通过检测循环肿瘤 DNA (circulating tumor DNA, ctDNA) 中的肿瘤特异性基因突变,监测肿瘤的复发和转移。
▮▮▮▮ⓛ 药物基因组学 (Pharmacogenomics):药物基因组学是研究个体基因变异对药物反应影响的学科,基因诊断在药物基因组学中具有重要应用,可以用于:
▮▮▮▮▮▮▮▮❶ 预测药物疗效 (Predicting Drug Efficacy):某些基因变异可以影响药物的代谢、转运、靶点结合等,从而影响药物的疗效。基因检测可以预测患者对某种药物的疗效,指导个体化用药。例如,CYP2C19 基因多态性影响氯吡格雷 (clopidogrel) 的代谢,CYP2D6 基因多态性影响他莫昔芬 (tamoxifen) 的代谢。
▮▮▮▮▮▮▮▮❷ 预测药物不良反应 (Predicting Adverse Drug Reactions):某些基因变异可以增加药物不良反应的风险。基因检测可以预测患者对某种药物的不良反应风险,指导个体化用药。例如,HLA-B 57:01 等位基因与阿巴卡韦 (abacavir) 引起超敏反应的风险增加有关,TPMT 基因多态性与硫嘌呤类药物引起骨髓抑制的风险增加有关。
▮▮▮▮▮▮▮▮❸ 指导药物剂量 (Guiding Drug Dosage):某些基因变异可以影响药物的代谢速度,从而影响药物的血药浓度。基因检测可以指导药物剂量的调整,使患者获得最佳的治疗效果,同时减少不良反应。例如,VKORC1 和 CYP2C9 基因多态性影响华法林 (warfarin) 的剂量。
④ 基因诊断的伦理问题 (Ethical Issues of Genetic Diagnosis):
▮ 基因诊断技术的发展带来了一系列伦理问题,需要引起重视和规范管理,主要包括:
▮▮▮▮ⓐ 基因隐私 (Genetic Privacy):基因信息是高度敏感的个人信息,基因诊断结果可能涉及个人及其家属的隐私。基因信息的泄露和滥用可能导致歧视、 stigmatization 等问题。需要加强基因信息的保护,制定严格的基因隐私保护法律法规。
▮▮▮▮ⓑ 知情同意 (Informed Consent):进行基因诊断前,需要充分告知患者基因诊断的目的、意义、风险和局限性,获得患者的知情同意。对于儿童和无行为能力患者,需要获得监护人的知情同意。
▮▮▮▮ⓒ 遗传咨询 (Genetic Counseling):基因诊断结果可能复杂难懂,患者可能需要专业的遗传咨询服务,帮助他们理解基因诊断结果,评估遗传风险,制定生育计划和治疗方案。需要加强遗传咨询服务的普及和规范化。
▮▮▮▮ⓓ 基因歧视 (Genetic Discrimination):基因诊断结果可能被用于歧视,例如就业歧视、保险歧视等。需要制定法律法规,禁止基因歧视,保障基因携带者和患者的平等权利。
▮▮▮▮ⓔ 基因检测的商业化和滥用 (Commercialization and Misuse of Genetic Testing):基因检测的商业化发展迅速,但同时也存在滥用和过度商业化的问题,例如直接面向消费者的基因检测 (direct-to-consumer genetic testing, DTC-GT),可能存在检测质量参差不齐、结果解读不准确、误导消费者等问题。需要加强基因检测市场的监管,规范基因检测服务,保障消费者的权益。
▮▮▮▮ⓕ 基因编辑的伦理问题 (Ethical Issues of Gene Editing):基因编辑技术,例如 CRISPR-Cas9 系统,为遗传病的治疗带来了新的希望,但同时也引发了伦理争议,例如生殖细胞基因编辑的伦理问题、基因编辑技术的安全性和脱靶效应等。需要加强基因编辑技术的伦理监管,制定严格的伦理规范,确保基因编辑技术的安全和负责任的应用。
8.2.2 核酸检测 (Nucleic Acid Detection)
介绍核酸检测技术 (PCR、RT-PCR、qPCR、核酸杂交) 在病原微生物检测、肿瘤标志物检测、基因表达分析中的应用。
核酸检测是指通过检测核酸 (DNA 或 RNA) 的存在、含量、序列等信息,来诊断疾病的方法。核酸检测技术具有灵敏度高、特异性强、快速准确等优点,在感染性疾病、肿瘤、遗传病等领域具有广泛的应用。
① 核酸检测技术 (Nucleic Acid Detection Techniques):
▮ 常用的核酸检测技术包括:
▮▮▮▮ⓐ 聚合酶链式反应 (Polymerase Chain Reaction, PCR):PCR 是一种体外 DNA 扩增技术,可以快速扩增 DNA 片段,用于检测 DNA 的存在、含量、序列等信息。PCR 技术及其变种,例如实时荧光定量 PCR (qPCR)、反转录 PCR (RT-PCR)、数字 PCR (dPCR) 等,是核酸检测中最常用的技术。
▮▮▮▮ⓑ 反转录 PCR (Reverse Transcription PCR, RT-PCR):RT-PCR 是一种将 RNA 反转录为 cDNA,再进行 PCR 扩增的技术,用于检测 RNA 的存在、含量、序列等信息。RT-PCR 常用于检测 RNA 病毒、基因表达分析等。
▮▮▮▮ⓒ 实时荧光定量 PCR (Real-time Quantitative PCR, qPCR):qPCR 是一种在 PCR 反应过程中实时监测荧光信号变化,定量检测 DNA 或 RNA 初始拷贝数的 PCR 技术。qPCR 具有灵敏度高、定量准确、快速高效等优点,广泛应用于病原微生物检测、基因表达分析、肿瘤标志物检测等。
▮▮▮▮ⓓ 核酸杂交 (Nucleic Acid Hybridization):核酸杂交是指两条互补的核酸链 (DNA-DNA、DNA-RNA、RNA-RNA) 通过氢键结合形成双链分子的过程。核酸杂交技术利用标记的核酸探针与待测样本中的核酸进行杂交,检测特定核酸序列的存在。常用的核酸杂交技术包括:
▮▮▮▮▮▮▮▮❺ Southern 印迹杂交 (Southern Blotting):DNA 印迹杂交技术,用于检测 DNA 片段的大小和拷贝数。
▮▮▮▮▮▮▮▮❻ Northern 印迹杂交 (Northern Blotting):RNA 印迹杂交技术,用于检测 RNA 的大小和表达水平。
▮▮▮▮▮▮▮▮❼ 原位杂交 (In Situ Hybridization, ISH):在细胞或组织原位进行核酸杂交,检测特定核酸序列在细胞或组织中的定位和表达水平。FISH (荧光原位杂交) 是常用的原位杂交技术。
▮▮▮▮▮▮▮▮❽ 核酸分子杂交芯片 (Nucleic Acid Hybridization Microarray):将大量核酸探针固定在芯片上,与待测样本中的核酸进行杂交,高通量检测核酸序列。基因芯片 (DNA microarray) 是常用的核酸分子杂交芯片。
▮▮▮▮ⓘ 环介导等温扩增 (Loop-mediated Isothermal Amplification, LAMP):LAMP 是一种等温核酸扩增技术,可以在恒温条件下快速扩增 DNA,无需 PCR 仪。LAMP 技术具有操作简便、快速高效、灵敏度高等优点,适用于现场快速检测。
▮▮▮▮ⓙ 核酸序列扩增技术 (Nucleic Acid Sequence-Based Amplification, NASBA):NASBA 是一种等温 RNA 扩增技术,可以在恒温条件下快速扩增 RNA,无需 PCR 仪。NASBA 技术适用于 RNA 病毒检测、基因表达分析等。
② 核酸检测在病原微生物检测中的应用 (Applications of Nucleic Acid Detection in Pathogen Detection):
▮ 核酸检测技术在病原微生物检测中具有重要应用,可以用于:
▮▮▮▮ⓐ 病原微生物的快速诊断 (Rapid Diagnosis of Pathogens):核酸检测技术具有灵敏度高、特异性强、快速准确等优点,可以快速诊断感染性疾病的病原微生物,例如病毒、细菌、真菌、寄生虫等。PCR、qPCR、RT-PCR、LAMP 等技术广泛应用于病原微生物的快速诊断。例如,qPCR 和 RT-PCR 是新型冠状病毒 (SARS-CoV-2) 核酸检测的金标准。
▮▮▮▮ⓑ 病原微生物的定量检测 (Quantitative Detection of Pathogens):qPCR 和 dPCR 等定量核酸检测技术可以定量检测病原微生物的核酸含量,用于评估病毒载量、细菌负荷等,指导抗感染治疗和疗效监测。例如,HIV 病毒载量检测是艾滋病治疗的重要监测指标。
▮▮▮▮ⓒ 病原微生物的分型和耐药性检测 (Typing and Drug Resistance Detection of Pathogens):核酸检测技术可以用于病原微生物的分型和耐药性检测。通过检测病原微生物的基因序列,可以进行病原微生物的分型,例如病毒基因分型、细菌血清型分型等。通过检测病原微生物的耐药基因突变,可以预测病原微生物的耐药性,指导抗感染药物的选择。例如,结核分枝杆菌 (Mycobacterium tuberculosis) 耐药基因检测可以指导耐药结核病的治疗。
▮▮▮▮ⓓ 新发突发传染病病原体的发现 (Discovery of Novel and Emerging Infectious Disease Pathogens):NGS 等高通量核酸测序技术可以用于新发突发传染病病原体的发现和鉴定。通过对患者样本进行宏基因组学测序 (metagenomic sequencing),可以发现未知的病原微生物,例如新型冠状病毒 (SARS-CoV-2) 的发现就得益于 NGS 技术。
③ 核酸检测在肿瘤标志物检测中的应用 (Applications of Nucleic Acid Detection in Tumor Marker Detection):
▮ 核酸检测技术在肿瘤标志物检测中具有重要应用,可以用于:
▮▮▮▮ⓐ 肿瘤基因突变检测 (Tumor Gene Mutation Detection):核酸检测技术可以检测肿瘤组织或液体活检样本中的肿瘤基因突变,例如癌基因突变、抑癌基因突变、靶向药物靶点基因突变、耐药基因突变等。肿瘤基因突变检测可以用于肿瘤分子分型、靶向治疗指导、耐药机制分析、预后评估、复发监测等。NGS、qPCR、dPCR、AS-PCR 等技术广泛应用于肿瘤基因突变检测。
▮▮▮▮ⓑ 肿瘤基因表达水平检测 (Tumor Gene Expression Level Detection):核酸检测技术可以检测肿瘤组织或液体活检样本中的肿瘤基因表达水平,例如癌基因过表达、抑癌基因低表达、预后相关基因表达水平等。肿瘤基因表达水平检测可以用于肿瘤分子分型、预后评估、疗效预测等。RT-qPCR、RNA-Seq、基因芯片等技术广泛应用于肿瘤基因表达水平检测。
▮▮▮▮ⓒ 肿瘤非编码 RNA 检测 (Tumor Non-coding RNA Detection):非编码 RNA,例如 microRNA (miRNA)、长非编码 RNA (lncRNA) 等,在肿瘤的发生发展中起着重要作用,可以作为肿瘤标志物。核酸检测技术可以检测肿瘤组织或液体活检样本中的肿瘤非编码 RNA 表达水平,用于肿瘤诊断、预后评估、疗效预测等。RT-qPCR、RNA-Seq、miRNA 芯片等技术广泛应用于肿瘤非编码 RNA 检测。
▮▮▮▮ⓓ 循环肿瘤 DNA (ctDNA) 检测 (Circulating Tumor DNA Detection):ctDNA 是肿瘤细胞释放到血液循环中的 DNA 片段,携带肿瘤特异性基因突变和表观遗传学改变,可以作为液体活检的肿瘤标志物。核酸检测技术可以检测血浆或血清中的 ctDNA,用于肿瘤早期诊断、复发监测、疗效评估、耐药机制分析等。NGS、dPCR、qPCR 等技术广泛应用于 ctDNA 检测。
④ 核酸检测在基因表达分析中的应用 (Applications of Nucleic Acid Detection in Gene Expression Analysis):
▮ 核酸检测技术在基因表达分析中具有重要应用,可以用于:
▮▮▮▮ⓐ 基因表达谱分析 (Gene Expression Profiling):核酸检测技术可以高通量、全面地分析细胞、组织或生物样本中的基因表达谱,揭示基因表达模式,研究基因功能,发现疾病相关的基因。RNA-Seq、基因芯片等技术广泛应用于基因表达谱分析。基因表达谱分析可以用于肿瘤分子分型、药物靶点发现、疾病机制研究等。
▮▮▮▮ⓑ 差异基因表达分析 (Differential Gene Expression Analysis):核酸检测技术可以比较不同组别 (例如疾病组 vs. 正常组、治疗组 vs. 对照组) 样本之间的基因表达差异,筛选差异表达基因 (differentially expressed genes, DEGs),研究疾病发生发展相关的基因,寻找药物作用靶点。RNA-Seq、RT-qPCR、基因芯片等技术广泛应用于差异基因表达分析。
▮▮▮▮ⓒ 基因表达调控机制研究 (Study of Gene Expression Regulation Mechanisms):核酸检测技术可以用于研究基因表达调控机制,例如转录调控、转录后调控、翻译调控等。ChIP-Seq (染色质免疫共沉淀测序) 技术可以研究转录因子与 DNA 的结合位点,RNA-Seq 技术可以研究转录本的表达水平和可变剪接,RIP-Seq (RNA 免疫沉淀测序) 技术可以研究 RNA 结合蛋白与 RNA 的相互作用。
8.2.3 蛋白质诊断 (Protein Diagnostics)
讲解蛋白质诊断的原理、方法 (ELISA、Western blotting、质谱分析、免疫组化) 和应用 (疾病标志物检测、药物疗效评估)。
蛋白质诊断是指通过检测蛋白质的表达水平、修饰状态、结构和功能等变化,来诊断疾病的方法。蛋白质是生命活动的主要执行者,许多疾病的发生与蛋白质的异常有关。蛋白质诊断可以提供疾病发生发展的直接证据,在疾病的早期诊断、预后评估、疗效监测和个体化治疗中具有重要价值。
① 蛋白质诊断的原理 (Principles of Protein Diagnostics):
▮ 蛋白质诊断的原理是基于蛋白质与疾病的关系 (protein-disease association)。许多疾病的发生与蛋白质的异常表达、修饰、结构或功能有关。例如,肿瘤细胞可以异常分泌某些蛋白质,作为肿瘤标志物;某些疾病的发生与特定蛋白质的异常修饰有关,例如蛋白质磷酸化、糖基化等;某些疾病的发生与蛋白质的结构或功能异常有关,例如酶缺陷病。
▮ 蛋白质诊断通过检测患者样本 (血液、组织、体液等) 中的蛋白质,分析蛋白质的表达水平、修饰状态、结构或功能是否异常,从而判断患者是否患有某种疾病或具有某种疾病的易感性。
② 蛋白质诊断的方法 (Methods of Protein Diagnostics):
▮ 蛋白质诊断的方法多种多样,常用的方法包括:
▮▮▮▮ⓐ 酶联免疫吸附试验 (Enzyme-Linked Immunosorbent Assay, ELISA):ELISA 是一种常用的免疫学检测技术,利用酶标记的抗体或抗原,检测样本中特定蛋白质的含量。ELISA 具有灵敏度高、特异性强、操作简便、高通量等优点,广泛应用于疾病标志物检测、抗体检测、细胞因子检测等。
▮▮▮▮ⓑ Western 印迹杂交 (Western Blotting):Western 印迹杂交是一种蛋白质印迹杂交技术,通过电泳分离蛋白质,将蛋白质转移到膜上,利用抗体检测特定蛋白质的表达水平和分子量。Western blotting 常用于蛋白质表达水平分析、蛋白质修饰检测、蛋白质相互作用研究等。
▮▮▮▮ⓒ 质谱分析 (Mass Spectrometry, MS):质谱分析是一种高灵敏度、高分辨率的蛋白质分析技术,可以用于蛋白质鉴定、蛋白质定量、蛋白质修饰分析、蛋白质结构分析、蛋白质相互作用研究等。质谱分析技术包括:
▮▮▮▮▮▮▮▮❹ 基质辅助激光解吸电离飞行时间质谱 (Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry, MALDI-TOF MS):MALDI-TOF MS 是一种快速、高通量的质谱分析技术,常用于微生物鉴定、蛋白质鉴定、多肽分析等。
▮▮▮▮▮▮▮▮❺ 液相色谱-质谱联用 (Liquid Chromatography-Mass Spectrometry, LC-MS):LC-MS 是一种高灵敏度、高分辨率的质谱分析技术,将液相色谱与质谱联用,用于复杂生物样本的蛋白质组学分析、代谢组学分析、药物分析等。
▮▮▮▮▮▮▮▮❻ 串联质谱 (Tandem Mass Spectrometry, MS/MS):MS/MS 是一种多级质谱分析技术,通过多次质谱分析,可以进行蛋白质序列鉴定、蛋白质修饰位点鉴定、蛋白质结构分析等。
▮▮▮▮ⓖ 免疫组织化学 (Immunohistochemistry, IHC):IHC 是一种在组织切片上原位检测蛋白质表达水平和定位的技术,利用抗体与组织切片中的特定蛋白质结合,通过显色反应或荧光标记,观察蛋白质在组织细胞中的表达和分布。IHC 常用于肿瘤标志物检测、疾病病理诊断、药物靶点验证等。
▮▮▮▮ⓗ 免疫荧光 (Immunofluorescence, IF):IF 是一种利用荧光标记的抗体检测细胞或组织中特定蛋白质表达水平和定位的技术,与 IHC 原理相似,但使用荧光标记物,观察结果更清晰,灵敏度更高。IF 常用于细胞生物学研究、疾病诊断、药物筛选等。
▮▮▮▮ⓘ 流式细胞术 (Flow Cytometry, FCM):FCM 是一种单细胞水平的蛋白质分析技术,利用荧光标记的抗体与细胞表面的或细胞内的蛋白质结合,通过流式细胞仪检测细胞的荧光信号,分析细胞中特定蛋白质的表达水平和细胞群体分布。FCM 常用于免疫细胞分型、细胞周期分析、细胞凋亡检测、药物筛选等。
▮▮▮▮ⓙ 蛋白质芯片 (Protein Microarray):蛋白质芯片是一种高通量蛋白质检测技术,将大量蛋白质或抗体固定在芯片上,与待测样本中的蛋白质或抗体进行结合,检测蛋白质的表达水平、蛋白质相互作用、抗体谱等。蛋白质芯片主要用于蛋白质组学研究、疾病标志物筛选、药物筛选等。
③ 蛋白质诊断的应用 (Applications of Protein Diagnostics):
▮ 蛋白质诊断在医学领域具有广泛的应用,主要包括:
▮▮▮▮ⓐ 疾病标志物检测 (Disease Marker Detection):蛋白质诊断可以用于检测疾病相关的蛋白质标志物,辅助疾病诊断、预后评估、疗效监测。常见的蛋白质疾病标志物包括:
▮▮▮▮▮▮▮▮❷ 肿瘤标志物 (Tumor Markers):例如癌胚抗原 (carcinoembryonic antigen, CEA)、甲胎蛋白 (alpha-fetoprotein, AFP)、前列腺特异性抗原 (prostate-specific antigen, PSA)、糖类抗原 125 (carbohydrate antigen 125, CA125)、糖类抗原 19-9 (carbohydrate antigen 19-9, CA19-9) 等,用于肿瘤早期诊断、预后评估、复发监测。ELISA、IHC、蛋白质芯片等技术广泛应用于肿瘤标志物检测。
▮▮▮▮▮▮▮▮❸ 心血管疾病标志物 (Cardiovascular Disease Markers):例如肌钙蛋白 (troponin)、肌酸激酶同工酶 (creatine kinase-MB, CK-MB)、脑钠肽 (brain natriuretic peptide, BNP)、N-末端脑钠肽前体 (N-terminal pro-brain natriuretic peptide, NT-proBNP) 等,用于急性心肌梗死、心力衰竭等心血管疾病的诊断和预后评估。ELISA、免疫层析等技术广泛应用于心血管疾病标志物检测。
▮▮▮▮▮▮▮▮❹ 炎症标志物 (Inflammation Markers):例如 C-反应蛋白 (C-reactive protein, CRP)、血沉 (erythrocyte sedimentation rate, ESR)、白细胞介素 6 (interleukin-6, IL-6)、肿瘤坏死因子 α (tumor necrosis factor α, TNF-α) 等,用于感染性疾病、自身免疫性疾病、炎症性疾病的诊断和病情评估。ELISA、免疫层析等技术广泛应用于炎症标志物检测。
▮▮▮▮▮▮▮▮❺ 神经退行性疾病标志物 (Neurodegenerative Disease Markers):例如 β-淀粉样蛋白 (amyloid-β, Aβ)、tau 蛋白、α-突触核蛋白 (α-synuclein) 等,用于阿尔茨海默病 (Alzheimer's disease)、帕金森病 (Parkinson's disease) 等神经退行性疾病的早期诊断和预后评估。ELISA、质谱分析等技术广泛应用于神经退行性疾病标志物检测。
▮▮▮▮ⓕ 药物疗效评估 (Drug Efficacy Evaluation):蛋白质诊断可以用于评估药物的疗效。通过检测药物治疗前后患者样本中特定蛋白质的表达水平、修饰状态或活性变化,评估药物是否达到治疗目标,指导药物剂量调整和治疗方案优化。例如,肿瘤靶向治疗药物的疗效评估可以通过检测肿瘤组织中靶蛋白的磷酸化水平变化来实现。Western blotting、IHC、ELISA 等技术广泛应用于药物疗效评估。
▮▮▮▮ⓖ 个体化药物治疗指导 (Personalized Medicine Guidance):蛋白质诊断可以用于指导个体化药物治疗。通过检测患者样本中与药物反应相关的蛋白质标志物,预测患者对某种药物的反应性,选择最适合患者的药物治疗方案,提高治疗效果,减少不良反应。例如,乳腺癌 HER2 蛋白表达水平检测可以指导曲妥珠单抗 (trastuzumab) 的使用。IHC、ELISA 等技术广泛应用于个体化药物治疗指导。
▮▮▮▮ⓗ 疾病预后评估 (Disease Prognosis Assessment):某些蛋白质标志物的表达水平与疾病的预后相关。蛋白质诊断可以检测这些预后相关蛋白质标志物的表达水平,评估疾病的预后风险,指导临床决策。例如,乳腺癌 Ki-67 蛋白表达水平、ER/PR/HER2 蛋白表达状态等可以用于乳腺癌的预后评估。IHC、ELISA 等技术广泛应用于疾病预后评估。
8.2.4 循环肿瘤细胞检测与液体活检 (Circulating Tumor Cell Detection and Liquid Biopsy)
介绍循环肿瘤细胞检测和液体活检的原理、技术和应用,以及液体活检在肿瘤早期诊断、预后评估和疗效监测中的潜力。
循环肿瘤细胞 (Circulating Tumor Cells, CTCs) 是指从原发肿瘤或转移灶脱落,进入血液循环的肿瘤细胞。液体活检 (Liquid Biopsy) 是指通过检测血液、尿液、唾液等液体样本中的肿瘤来源的生物标志物,例如 CTCs、循环肿瘤 DNA (ctDNA)、外泌体 (exosomes)、循环肿瘤 RNA (ctRNA) 等,来反映肿瘤的发生发展和治疗反应的技术。液体活检具有无创、可重复、动态监测等优点,在肿瘤早期诊断、预后评估、疗效监测、耐药机制分析和个体化治疗指导中具有广阔的应用前景。
① 循环肿瘤细胞 (Circulating Tumor Cells, CTCs) 检测 (Circulating Tumor Cell Detection):
▮ CTCs 检测是指从外周血中分离、富集和鉴定 CTCs 的技术。CTCs 是肿瘤转移的种子细胞,CTCs 检测可以反映肿瘤的转移潜能和预后风险。
▮ CTCs 检测的原理是基于 CTCs 与正常血细胞在形态、大小、表面标志物等方面的差异。常用的 CTCs 检测技术包括:
▮▮▮▮ⓐ 基于物理特性的分离方法 (Physical Property-Based Separation Methods):利用 CTCs 与正常血细胞在大小、密度、电荷等物理特性上的差异进行分离。例如:
▮▮▮▮▮▮▮▮❷ 密度梯度离心 (Density Gradient Centrifugation):利用 CTCs 与正常血细胞密度差异进行分离。
▮▮▮▮▮▮▮▮❸ 膜过滤 (Membrane Filtration):利用 CTCs 比正常血细胞大的特点,通过膜过滤分离 CTCs。
▮▮▮▮▮▮▮▮❹ 微流控芯片 (Microfluidic Chips):利用微流控技术,基于 CTCs 的大小、形状、电荷等物理特性进行分离。
▮▮▮▮ⓔ 基于生物学特性的分离方法 (Biological Property-Based Separation Methods):利用 CTCs 表面特异性标志物进行分离。例如:
▮▮▮▮▮▮▮▮❻ 免疫磁珠法 (Immunomagnetic Bead Method):利用磁珠偶联的抗体,例如抗上皮细胞黏附分子 (epithelial cell adhesion molecule, EpCAM) 抗体,捕获 CTCs。EpCAM 是上皮细胞表面高表达的标志物,但正常血细胞不表达或低表达。
▮▮▮▮▮▮▮▮❼ 免疫细胞化学染色 (Immunocytochemical Staining):利用抗体染色 CTCs,例如抗细胞角蛋白 (cytokeratin, CK) 抗体、抗 EpCAM 抗体等,鉴定 CTCs。CK 是上皮细胞的中间丝蛋白,EpCAM 是上皮细胞黏附分子,CTCs 通常表达 CK 和 EpCAM,而正常血细胞不表达。
▮▮▮▮ⓗ 联合方法 (Combined Methods):将基于物理特性和生物学特性的分离方法联合使用,提高 CTCs 分离的效率和特异性。例如,CellSearch 系统是 FDA 批准的唯一用于临床的 CTCs 检测系统,采用免疫磁珠法富集 CTCs,再通过免疫荧光染色和形态学分析鉴定 CTCs。
▮ CTCs 检测的应用:
▮▮▮▮▮▮▮▮❶ 肿瘤预后评估 (Tumor Prognosis Assessment):CTCs 数量与肿瘤的预后相关,CTCs 数量越多,预后越差。CTCs 检测可以用于肿瘤预后评估,指导临床决策。
▮▮▮▮▮▮▮▮❷ 肿瘤疗效监测 (Tumor Therapy Monitoring):CTCs 数量变化可以反映肿瘤对治疗的反应。治疗有效时,CTCs 数量减少;治疗无效或肿瘤进展时,CTCs 数量增加。CTCs 检测可以用于肿瘤疗效监测,指导治疗方案调整。
▮▮▮▮▮▮▮▮❸ 肿瘤早期诊断 (Tumor Early Diagnosis):CTCs 检测有望用于肿瘤早期诊断,但目前 CTCs 在早期肿瘤患者血液中的含量较低,检测难度较大,灵敏度有待提高。
▮▮▮▮▮▮▮▮❹ 肿瘤转移机制研究 (Study of Tumor Metastasis Mechanisms):CTCs 是肿瘤转移的种子细胞,CTCs 检测可以用于研究肿瘤转移的分子机制,寻找肿瘤转移相关的靶点,开发抗转移治疗药物。
② 液体活检 (Liquid Biopsy) 的其他生物标志物 (Other Biomarkers in Liquid Biopsy):
▮ 除了 CTCs 外,液体活检还可以检测其他肿瘤来源的生物标志物,例如:
▮▮▮▮ⓐ 循环肿瘤 DNA (Circulating Tumor DNA, ctDNA):ctDNA 是肿瘤细胞释放到血液循环中的 DNA 片段,携带肿瘤特异性基因突变和表观遗传学改变。ctDNA 检测可以用于肿瘤基因突变检测、肿瘤分子分型、靶向治疗指导、耐药机制分析、预后评估、复发监测等。ctDNA 检测技术包括 PCR、qPCR、dPCR、NGS 等。
▮▮▮▮ⓑ 外泌体 (Exosomes):外泌体是细胞分泌的直径为 30-150nm 的囊泡,携带细胞来源的蛋白质、RNA、DNA 等生物分子。肿瘤细胞可以分泌外泌体,肿瘤外泌体中含有肿瘤特异性蛋白质、RNA、DNA 等,可以作为液体活检的肿瘤标志物。外泌体检测可以用于肿瘤早期诊断、预后评估、疗效监测、耐药机制分析等。外泌体检测技术包括超速离心、免疫磁珠法、纳米流式细胞术、质谱分析、RNA-Seq 等。
▮▮▮▮ⓒ 循环肿瘤 RNA (Circulating Tumor RNA, ctRNA):ctRNA 是肿瘤细胞释放到血液循环中的 RNA 分子,包括 mRNA、miRNA、lncRNA 等。ctRNA 检测可以用于肿瘤基因表达分析、肿瘤分子分型、预后评估、疗效监测等。ctRNA 检测技术包括 RT-qPCR、RNA-Seq、miRNA 芯片等。
▮▮▮▮ⓓ 肿瘤相关代谢物 (Tumor-Associated Metabolites):肿瘤细胞代谢异常,可以释放肿瘤相关代谢物到血液循环中。代谢组学分析可以检测血液中的肿瘤相关代谢物,用于肿瘤早期诊断、预后评估、疗效监测等。代谢组学分析技术包括质谱分析、核磁共振 (nuclear magnetic resonance, NMR) 等。
▮▮▮▮ⓔ 肿瘤相关蛋白 (Tumor-Associated Proteins):肿瘤细胞可以分泌肿瘤相关蛋白到血液循环中。蛋白质组学分析可以检测血液中的肿瘤相关蛋白,用于肿瘤早期诊断、预后评估、疗效监测等。蛋白质组学分析技术包括 ELISA、质谱分析、蛋白质芯片等。
③ 液体活检在肿瘤诊疗中的潜力 (Potential of Liquid Biopsy in Tumor Diagnosis and Treatment):
▮ 液体活检具有无创、可重复、动态监测等优点,在肿瘤诊疗中具有广阔的应用前景:
▮▮▮▮ⓐ 肿瘤早期诊断 (Tumor Early Diagnosis):液体活检有望用于肿瘤早期诊断,在肿瘤尚未发生转移前,通过检测血液中的肿瘤标志物,早期发现肿瘤,提高肿瘤的治愈率。目前,液体活检在肺癌、结直肠癌、乳腺癌、前列腺癌等多种肿瘤的早期诊断研究中取得了一些进展。
▮▮▮▮ⓑ 肿瘤预后评估 (Tumor Prognosis Assessment):液体活检检测的肿瘤标志物水平与肿瘤的预后相关,液体活检可以用于肿瘤预后评估,指导临床决策。例如,CTCs 数量、ctDNA 突变负荷等可以作为肿瘤预后评估指标。
▮▮▮▮ⓒ 肿瘤疗效监测 (Tumor Therapy Monitoring):液体活检可以动态监测肿瘤治疗过程中的肿瘤标志物水平变化,评估肿瘤对治疗的反应,指导治疗方案调整。例如,靶向治疗药物疗效监测可以通过检测 ctDNA 中靶点基因突变丰度变化来实现。
▮▮▮▮ⓓ 肿瘤耐药机制分析 (Tumor Resistance Mechanism Analysis):液体活检可以用于分析肿瘤耐药机制。在靶向治疗或化疗耐药后,通过检测 ctDNA 或 CTCs 中的耐药基因突变,揭示肿瘤耐药机制,指导后续治疗方案的选择。
▮▮▮▮ⓔ 个体化治疗指导 (Personalized Treatment Guidance):液体活检可以用于指导个体化治疗。通过检测液体活检样本中的肿瘤基因突变谱、基因表达谱、蛋白质谱等,为患者量身定制个体化的治疗方案,提高治疗效果,减少不良反应。
▮▮▮▮ⓕ 伴随诊断 (Companion Diagnostics):液体活检可以作为伴随诊断试剂,指导靶向治疗药物的选择和使用。例如,ctDNA EGFR 突变检测可以作为非小细胞肺癌 EGFR-TKI 靶向治疗的伴随诊断试剂。
8.3 基因治疗 (Gene Therapy)
介绍基因治疗的原理、类型、载体、策略和临床应用,以及基因治疗面临的挑战和未来发展方向。
基因治疗是指将外源基因导入患者细胞,以纠正基因缺陷或治疗疾病的方法。基因治疗为遗传病、肿瘤、感染性疾病等多种疾病的治疗提供了新的思路和策略。基因治疗经历了从最初的理论设想到逐步走向临床应用的过程,近年来,随着基因编辑技术、病毒载体技术和免疫治疗技术的进步,基因治疗领域取得了显著进展。
8.3.1 基因治疗的原理与类型 (Principles and Types of Gene Therapy)
讲解基因治疗的基本原理、体细胞基因治疗和生殖细胞基因治疗、基因添加治疗和基因编辑治疗。
① 基因治疗的基本原理 (Basic Principles of Gene Therapy):
▮ 基因治疗的基本原理是基因矫正 (gene correction) 或基因修饰 (gene modification)。对于遗传病,基因治疗的目标是纠正患者细胞中缺陷基因,恢复基因的正常功能。对于肿瘤、感染性疾病等非遗传病,基因治疗的目标是通过导入外源基因,增强机体抗病能力或直接杀伤病变细胞。
▮ 基因治疗的基本步骤包括:
▮▮▮▮ⓐ 基因克隆与构建 (Gene Cloning and Construction):克隆治疗目的基因,构建基因治疗载体。
▮▮▮▮ⓑ 基因递送 (Gene Delivery):将基因治疗载体导入患者靶细胞。基因递送方法包括病毒载体递送和非病毒载体递送。
▮▮▮▮ⓒ 基因表达 (Gene Expression):导入的基因在靶细胞中表达,产生治疗性蛋白质,发挥治疗作用。
▮▮▮▮ⓓ 疗效评估与安全性监测 (Efficacy Evaluation and Safety Monitoring):评估基因治疗的疗效和安全性,监测不良反应。
② 基因治疗的类型 (Types of Gene Therapy):
▮ 根据基因治疗的作用靶点和目的,基因治疗可以分为多种类型:
▮▮▮▮ⓐ 体细胞基因治疗 (Somatic Cell Gene Therapy):体细胞基因治疗是指将外源基因导入患者的体细胞 (非生殖细胞),例如血液细胞、肝细胞、肌肉细胞等。体细胞基因治疗的遗传改变仅限于患者个体,不遗传给后代。目前,绝大多数基因治疗临床试验都是体细胞基因治疗。
▮▮▮▮ⓑ 生殖细胞基因治疗 (Germline Gene Therapy):生殖细胞基因治疗是指将外源基因导入患者的生殖细胞 (精子、卵细胞或早期胚胎)。生殖细胞基因治疗的遗传改变可以遗传给后代。生殖细胞基因治疗的伦理争议较大,目前在人类中尚未开展临床应用,主要用于动物实验研究。
▮▮▮▮ⓒ 体内基因治疗 (In Vivo Gene Therapy):体内基因治疗是指将基因治疗载体直接注射到患者体内,靶向特定组织或器官,实现基因递送和治疗。体内基因治疗具有操作简便、靶向性好等优点,但载体递送效率和靶向性仍有待提高。
▮▮▮▮ⓓ 体外基因治疗 (Ex Vivo Gene Therapy):体外基因治疗是指先从患者体内取出靶细胞,在体外将基因治疗载体导入靶细胞,再将基因修饰后的细胞回输到患者体内。体外基因治疗可以提高基因递送效率和靶向性,但操作复杂,成本较高。
▮▮▮▮ⓔ 基因添加治疗 (Gene Augmentation Therapy):基因添加治疗是指对于基因功能丧失性疾病,例如单基因遗传病,通过导入正常基因拷贝,补充缺陷基因的功能,达到治疗目的。基因添加治疗适用于隐性遗传病和部分显性遗传病。
▮▮▮▮ⓕ 基因编辑治疗 (Gene Editing Therapy):基因编辑治疗是指利用基因编辑技术,例如 CRISPR-Cas9 系统、TALEN、ZFN 等,对患者细胞基因组进行精确修改,纠正基因突变,或敲除、插入、替换特定基因,达到治疗目的。基因编辑治疗具有靶向性高、精确性好等优点,为遗传病、肿瘤、感染性疾病等多种疾病的治疗带来了新的希望。基因编辑治疗可以分为:
▮▮▮▮▮▮▮▮❼ 基因敲除 (Gene Knockout):敲除特定基因,例如癌基因、病毒基因等,抑制疾病发生发展。
▮▮▮▮▮▮▮▮❽ 基因敲入 (Gene Knockin):将外源基因精确插入到基因组特定位点,例如基因添加治疗、基因矫正治疗等。
▮▮▮▮▮▮▮▮❾ 基因矫正 (Gene Correction):纠正基因突变,恢复基因的正常序列和功能。
▮▮▮▮▮▮▮▮❿ 碱基编辑 (Base Editing):对 DNA 或 RNA 碱基进行精确修改,例如 C-to-T 碱基编辑、A-to-G 碱基编辑等,纠正点突变。
▮▮▮▮▮▮▮▮❺ 先导编辑 (Prime Editing):一种更精确、更灵活的基因编辑技术,可以实现基因的精确插入、删除、替换和碱基编辑。
8.3.2 基因治疗载体 (Gene Therapy Vectors)
介绍病毒载体 (腺病毒载体、腺相关病毒载体、逆转录病毒载体、慢病毒载体) 和非病毒载体 (质粒载体、脂质体、纳米颗粒) 的特点和应用。
基因治疗载体是基因递送系统的核心组成部分,负责将治疗目的基因高效、安全地递送到靶细胞。基因治疗载体可以分为病毒载体和非病毒载体两大类。
① 病毒载体 (Viral Vectors):
▮ 病毒载体是利用病毒的天然感染机制,将外源基因递送到靶细胞的基因治疗载体。病毒载体具有基因递送效率高、靶细胞范围广等优点,是目前基因治疗中最常用的载体类型。常用的病毒载体包括:
▮▮▮▮ⓐ 腺病毒载体 (Adenoviral Vectors, AdV):腺病毒是一种双链 DNA 病毒,具有感染细胞类型广泛、基因递送效率高、滴度高等优点。腺病毒载体通常是复制缺陷型 (replication-defective),即去除了病毒复制必需的基因,使其不能在宿主细胞中复制,提高了安全性。腺病毒载体主要用于体内基因治疗,例如肿瘤基因治疗、疫苗开发等。腺病毒载体的缺点是免疫原性较高,可能引起宿主免疫反应,导致基因表达短暂。
▮▮▮▮ⓑ 腺相关病毒载体 (Adeno-Associated Viral Vectors, AAV):腺相关病毒是一种单链 DNA 病毒,具有免疫原性低、安全性高、感染细胞类型广泛、可以长期稳定表达外源基因等优点。AAV 载体通常是复制缺陷型,需要辅助病毒 (例如腺病毒) 辅助才能复制。AAV 载体是目前基因治疗中最常用的病毒载体之一,广泛应用于遗传病基因治疗、肿瘤基因治疗、神经系统疾病基因治疗等。AAV 载体的缺点是基因包装容量较小,约为 4.7kb,限制了其在递送大基因方面的应用。
▮▮▮▮ⓒ 逆转录病毒载体 (Retroviral Vectors, RV):逆转录病毒是一种 RNA 病毒,具有可以将 RNA 基因组逆转录为 DNA,并整合到宿主细胞基因组中的特点。逆转录病毒载体可以实现外源基因的长期稳定表达,适用于体外基因治疗,例如基因修饰的细胞治疗。逆转录病毒载体的缺点是只能感染分裂细胞,且具有插入突变风险,可能激活癌基因或失活抑癌基因。
▮▮▮▮ⓓ 慢病毒载体 (Lentiviral Vectors, LV):慢病毒是逆转录病毒的一个亚科,例如人类免疫缺陷病毒 (HIV)。慢病毒载体克服了逆转录病毒载体只能感染分裂细胞的缺点,可以感染分裂细胞和非分裂细胞,基因递送效率高,可以长期稳定表达外源基因。慢病毒载体也适用于体外基因治疗和体内基因治疗。慢病毒载体的安全性较高,但仍存在插入突变风险。
▮▮▮▮ⓔ 单纯疱疹病毒载体 (Herpes Simplex Viral Vectors, HSV):单纯疱疹病毒是一种双链 DNA 病毒,具有感染神经细胞能力强、基因包装容量大等优点,适用于神经系统疾病基因治疗。单纯疱疹病毒载体通常是复制缺陷型,或经过改造,使其只能在肿瘤细胞中复制,用于肿瘤溶瘤病毒治疗。单纯疱疹病毒载体的缺点是免疫原性较高,可能引起神经炎症反应。
② 非病毒载体 (Non-viral Vectors):
▮ 非病毒载体是指不利用病毒的基因治疗载体,主要包括质粒载体、脂质体、纳米颗粒等。非病毒载体具有安全性高、免疫原性低、制备简便、基因包装容量大等优点,但基因递送效率相对较低。非病毒载体主要用于体内基因治疗和体外基因治疗。常用的非病毒载体包括:
▮▮▮▮ⓐ 质粒载体 (Plasmid Vectors):质粒载体是一种环状 DNA 分子,通常含有细菌来源的复制起点、抗生素抗性基因和外源基因插入位点。质粒载体是基因克隆和基因表达最常用的载体,也可以作为基因治疗载体。质粒载体可以通过物理方法 (例如电穿孔、基因枪、显微注射) 或化学方法 (例如脂质体转染、阳离子聚合物转染) 导入细胞。质粒载体的优点是制备简便、安全性高、基因包装容量大,缺点是基因递送效率较低,基因表达短暂。
▮▮▮▮ⓑ 脂质体 (Liposomes):脂质体是由磷脂双分子层组成的囊泡,可以包裹 DNA 或 RNA 等核酸分子,通过与细胞膜融合,将核酸分子递送到细胞内。脂质体载体具有生物相容性好、免疫原性低、可以递送大分子等优点。脂质体载体主要用于体内基因治疗和 RNA 干扰治疗。脂质体载体的缺点是基因递送效率较低,靶向性较差。
▮▮▮▮ⓒ 纳米颗粒 (Nanoparticles):纳米颗粒是指尺寸在纳米级别的颗粒材料,例如聚合物纳米颗粒、脂质纳米颗粒、无机纳米颗粒等。纳米颗粒可以包裹 DNA、RNA、蛋白质等治疗分子,通过内吞作用进入细胞,实现基因递送和药物递送。纳米颗粒载体具有靶向性可调、控释性好、生物相容性好等优点。纳米颗粒载体是基因治疗和药物递送领域的研究热点。常用的纳米颗粒载体材料包括聚乳酸-羟基乙酸共聚物 (PLGA)、聚乙烯亚胺 (PEI)、壳聚糖 (chitosan)、金纳米颗粒 (gold nanoparticles) 等。
③ 基因治疗载体的选择 (Selection of Gene Therapy Vectors):
▮ 基因治疗载体的选择需要综合考虑治疗目的、靶细胞类型、基因大小、免疫原性、安全性、制备成本等因素。
▮ 对于需要长期稳定表达外源基因的基因治疗,例如遗传病基因治疗,AAV 载体、慢病毒载体、逆转录病毒载体是较好的选择。对于需要瞬时表达外源基因的基因治疗,例如肿瘤溶瘤病毒治疗、疫苗开发,腺病毒载体、质粒载体是较好的选择。
▮ 对于体内基因治疗,AAV 载体、腺病毒载体、脂质体载体、纳米颗粒载体是常用的选择。对于体外基因治疗,逆转录病毒载体、慢病毒载体、质粒载体是常用的选择。
▮ 对于基因包装容量较大的基因治疗,腺病毒载体、单纯疱疹病毒载体、质粒载体是较好的选择。对于基因包装容量较小的基因治疗,AAV 载体、慢病毒载体、逆转录病毒载体是较好的选择。
▮ 对于免疫原性要求较低的基因治疗,AAV 载体、脂质体载体、纳米颗粒载体是较好的选择。对于免疫原性要求较高的基因治疗,腺病毒载体、单纯疱疹病毒载体需要进行免疫修饰。
▮ 对于安全性要求较高的基因治疗,AAV 载体、质粒载体、脂质体载体、纳米颗粒载体是较好的选择。对于安全性要求较低的基因治疗,逆转录病毒载体、慢病毒载体、腺病毒载体需要进行安全改造。
8.3.3 基因治疗的策略与临床应用 (Strategies and Clinical Applications of Gene Therapy)
讲解基因治疗的策略 (基因矫正、基因沉默、自杀基因治疗、免疫基因治疗),以及基因治疗在遗传病、癌症、感染性疾病等领域的临床应用进展。
① 基因治疗的策略 (Strategies of Gene Therapy):
▮ 根据基因治疗的目的和作用机制,基因治疗可以分为多种策略:
▮▮▮▮ⓐ 基因矫正 (Gene Correction):基因矫正策略是指对于基因突变引起的疾病,通过基因编辑技术,例如 CRISPR-Cas9 系统,精确修改患者细胞基因组,纠正基因突变,恢复基因的正常序列和功能,达到治疗目的。基因矫正策略适用于单基因遗传病,例如 β-地中海贫血、镰状细胞贫血、囊性纤维化、杜氏肌营养不良症等。基因矫正策略是基因治疗的理想策略,但技术难度较高,安全性仍需进一步评估。
▮▮▮▮ⓑ 基因添加 (Gene Augmentation):基因添加策略是指对于基因功能丧失性疾病,通过导入正常基因拷贝,补充缺陷基因的功能,达到治疗目的。基因添加策略适用于隐性遗传病和部分显性遗传病,例如腺苷脱氨酶缺陷症 (ADA-SCID)、Leber 先天性黑矇 (LCA)、脊髓性肌萎缩症 (SMA) 等。基因添加策略是目前基因治疗中最常用的策略之一,已经有多种基因添加治疗药物获批上市。
▮▮▮▮ⓒ 基因沉默 (Gene Silencing):基因沉默策略是指对于基因功能亢进性疾病,或需要抑制特定基因表达的疾病,通过导入基因沉默元件,例如反义寡核苷酸 (antisense oligonucleotides, ASOs)、小干扰 RNA (small interfering RNA, siRNA)、microRNA (miRNA) 等,抑制靶基因的表达,达到治疗目的。基因沉默策略适用于肿瘤、病毒感染、神经退行性疾病等。基因沉默策略的优点是靶向性高、特异性强,缺点是基因沉默效果可能短暂,需要重复给药。
▮▮▮▮ⓓ 自杀基因治疗 (Suicide Gene Therapy):自杀基因治疗策略是指将自杀基因导入肿瘤细胞,自杀基因编码的酶可以将无毒的前药转化为有毒的药物,选择性杀伤肿瘤细胞,而对正常细胞损伤较小。常用的自杀基因/前药系统包括单纯疱疹病毒胸苷激酶/更昔洛韦 (HSV-TK/GCV) 系统、胞嘧啶脱氨酶/5-氟胞嘧啶 (CD/5-FC) 系统等。自杀基因治疗策略适用于肿瘤治疗。自杀基因治疗策略的优点是选择性杀伤肿瘤细胞,缺点是旁观者效应 (bystander effect) 可能导致周围正常细胞损伤。
▮▮▮▮ⓔ 免疫基因治疗 (Immunogene Therapy):免疫基因治疗策略是指通过基因修饰,增强机体抗肿瘤免疫应答,或增强免疫细胞的抗感染能力,达到治疗目的。免疫基因治疗策略包括:
▮▮▮▮▮▮▮▮❻ 肿瘤疫苗 (Tumor Vaccine):将肿瘤抗原基因导入患者体内,诱导机体产生抗肿瘤免疫应答,杀伤肿瘤细胞。肿瘤疫苗可以分为细胞疫苗、基因疫苗、病毒载体疫苗等。
▮▮▮▮▮▮▮▮❼ 细胞因子基因治疗 (Cytokine Gene Therapy):将细胞因子基因,例如白细胞介素 2 (IL-2)、干扰素 γ (IFN-γ)、肿瘤坏死因子 α (TNF-α) 等,导入肿瘤组织或免疫细胞,增强局部免疫应答,杀伤肿瘤细胞。
▮▮▮▮▮▮▮▮❽ 共刺激分子基因治疗 (Co-stimulatory Molecule Gene Therapy):将共刺激分子基因,例如 CD80、CD86、CD40L 等,导入肿瘤细胞或免疫细胞,增强免疫细胞的激活和抗肿瘤免疫应答。
▮▮▮▮▮▮▮▮❾ 免疫检查点阻断基因治疗 (Immune Checkpoint Blockade Gene Therapy):将免疫检查点阻断抗体基因,例如抗 PD-1 抗体、抗 CTLA-4 抗体等,导入患者体内,阻断免疫检查点信号通路,解除免疫抑制,增强抗肿瘤免疫应答。
▮▮▮▮▮▮▮▮❿ 嵌合抗原受体 T 细胞 (CAR-T) 治疗 (CAR-T Cell Therapy):体外基因修饰患者 T 细胞,使其表达 CAR,CAR 可以特异性识别肿瘤细胞表面抗原,激活 T 细胞杀伤肿瘤细胞。CAR-T 细胞治疗在血液肿瘤治疗中取得了显著成功,例如 CD19 CAR-T 细胞治疗 B 细胞淋巴瘤和白血病。
▮▮▮▮▮▮▮▮❻ 基因修饰的溶瘤病毒 (Gene-Modified Oncolytic Virus):将溶瘤病毒进行基因修饰,增强其溶瘤活性、靶向性或免疫刺激能力,用于肿瘤治疗。基因修饰的溶瘤病毒可以分为增强溶瘤活性型、增强靶向性型、增强免疫刺激型等。
② 基因治疗的临床应用进展 (Clinical Applications of Gene Therapy):
▮ 基因治疗在遗传病、肿瘤、感染性疾病等领域的临床应用取得了显著进展。截至目前,已经有多款基因治疗药物获批上市,用于治疗遗传病和肿瘤。
▮▮▮▮ⓐ 遗传病基因治疗 (Gene Therapy for Genetic Diseases):基因治疗在单基因遗传病的治疗中取得了显著成功。已经获批上市的遗传病基因治疗药物包括:
▮▮▮▮▮▮▮▮❷ Glybera:AAV 载体基因治疗药物,用于治疗脂蛋白脂肪酶缺乏症 (LPLD),一种罕见的常染色体隐性遗传病。Glybera 是全球首个获批上市的基因治疗药物,但由于商业原因已撤市。
▮▮▮▮▮▮▮▮❸ Strimvelis:逆转录病毒载体体外基因治疗药物,用于治疗腺苷脱氨酶缺陷症 (ADA-SCID),一种严重的联合免疫缺陷病。
▮▮▮▮▮▮▮▮❹ Luxturna:AAV 载体基因治疗药物,用于治疗 RPE65 基因突变引起的 Leber 先天性黑矇 (LCA),一种遗传性视网膜疾病。Luxturna 是美国 FDA 批准的首个遗传性视网膜疾病基因治疗药物。
▮▮▮▮▮▮▮▮❺ Zolgensma:AAV 载体基因治疗药物,用于治疗脊髓性肌萎缩症 (SMA),一种严重的神经肌肉疾病。Zolgensma 是美国 FDA 批准的首个 SMA 基因治疗药物,也是目前最昂贵的药物之一。
▮▮▮▮▮▮▮▮❻ Skysona:慢病毒载体体外基因治疗药物,用于治疗脑肾上腺脑白质营养不良 (CALD),一种罕见的 X 连锁遗传病。
▮▮▮▮▮▮▮▮❼ Roctavian:腺病毒载体基因治疗药物,用于治疗 A 型血友病,一种 X 连锁隐性遗传病。
▮▮▮▮ⓗ 肿瘤基因治疗 (Gene Therapy for Cancer):基因治疗在肿瘤治疗领域也取得了重要进展,特别是免疫基因治疗和溶瘤病毒治疗。已经获批上市的肿瘤基因治疗药物包括:
▮▮▮▮▮▮▮▮❾ Oncorine:腺病毒载体溶瘤病毒药物,用于治疗晚期鼻咽癌。Oncorine 是全球首个获批上市的溶瘤病毒药物,在中国上市。
▮▮▮▮▮▮▮▮❿ Imlygic (T-VEC):单纯疱疹病毒载体溶瘤病毒药物,用于治疗晚期黑色素瘤。Imlygic 是美国 FDA 批准的首个溶瘤病毒药物。
▮▮▮▮▮▮▮▮❸ Yescarta (Axicabtagene ciloleucel):CD19 CAR-T 细胞治疗药物,用于治疗复发或难治性大 B 细胞淋巴瘤。Yescarta 是美国 FDA 批准的首个 CAR-T 细胞治疗药物。
▮▮▮▮▮▮▮▮❹ Kymriah (Tisagenlecleucel):CD19 CAR-T 细胞治疗药物,用于治疗儿童和年轻成人复发或难治性 B 细胞急性淋巴细胞白血病。Kymriah 是美国 FDA 批准的第二个 CAR-T 细胞治疗药物。
▮▮▮▮▮▮▮▮❺ Tecartus (Brexucabtagene autoleucel):CD19 CAR-T 细胞治疗药物,用于治疗复发或难治性套细胞淋巴瘤。
▮▮▮▮▮▮▮▮❻ Breyanzi (Lisocabtagene maraleucel):CD19 CAR-T 细胞治疗药物,用于治疗复发或难治性大 B 细胞淋巴瘤。
▮▮▮▮▮▮▮▮❼ Abecma (Ide-cel):BCMA CAR-T 细胞治疗药物,用于治疗复发或难治性多发性骨髓瘤。
▮▮▮▮▮▮▮▮❽ Carvykti (Ciltacabtagene autoleucel):BCMA CAR-T 细胞治疗药物,用于治疗复发或难治性多发性骨髓瘤。
▮▮▮▮ⓠ 感染性疾病基因治疗 (Gene Therapy for Infectious Diseases):基因治疗在感染性疾病的治疗中也展现出潜力,例如 HIV 基因治疗、乙型肝炎基因治疗等,但目前尚无获批上市的感染性疾病基因治疗药物。
8.3.4 基因治疗的挑战与未来展望 (Challenges and Future Perspectives of Gene Therapy)
讨论基因治疗的安全性和有效性问题、免疫原性、脱靶效应、伦理问题,以及基因治疗的未来发展方向。
① 基因治疗的挑战 (Challenges of Gene Therapy):
▮ 基因治疗虽然取得了显著进展,但仍面临诸多挑战:
▮▮▮▮ⓐ 安全性和有效性 (Safety and Efficacy):基因治疗的安全性是首要关注的问题。病毒载体可能存在免疫原性、插入突变、复制能力恢复等风险。基因编辑技术可能存在脱靶效应、基因组不稳定等风险。基因治疗的有效性也需要进一步提高,基因递送效率、基因表达水平、治疗持续时间等仍有待优化。
▮▮▮▮ⓑ 免疫原性 (Immunogenicity):病毒载体和外源基因可能引起宿主免疫反应,导致基因表达短暂、治疗效果下降、甚至引起严重不良反应。降低基因治疗的免疫原性是基因治疗研究的重要方向。
▮▮▮▮ⓒ 脱靶效应 (Off-target Effects):基因编辑技术可能存在脱靶效应,即基因编辑酶在非靶位点发生切割和修饰,引起基因组不稳定和潜在的致癌风险。提高基因编辑技术的靶向性和精确性是基因编辑治疗的关键。
▮▮▮▮ⓓ 基因递送效率和靶向性 (Gene Delivery Efficiency and Targeting):基因治疗载体的基因递送效率和靶向性仍有待提高。提高基因递送效率可以降低载体剂量,减少不良反应。提高基因递送靶向性可以使治疗基因更精确地作用于靶细胞,提高治疗效果,减少脱靶效应。
▮▮▮▮ⓔ 基因表达调控 (Gene Expression Regulation):导入的外源基因在靶细胞中的表达水平和表达时间需要精确调控,才能达到最佳的治疗效果。基因表达调控系统,例如诱导型启动子、组织特异性启动子、自调控系统等,是基因治疗研究的重要方向。
▮▮▮▮ⓕ 制备成本和可及性 (Manufacturing Cost and Accessibility):基因治疗药物的制备成本通常较高,导致药物价格昂贵,限制了患者的可及性。降低基因治疗药物的制备成本,提高药物的可及性,是基因治疗走向普及的关键。
▮▮▮▮ⓖ 伦理问题 (Ethical Issues):基因治疗,特别是生殖细胞基因治疗和基因编辑治疗,涉及伦理问题,例如基因编辑的伦理边界、基因增强的伦理争议、基因隐私保护、基因歧视等。需要加强基因治疗的伦理监管,制定严格的伦理规范,确保基因治疗的安全和负责任的应用。
② 基因治疗的未来展望 (Future Perspectives of Gene Therapy):
▮ 基因治疗领域未来发展前景广阔,主要发展方向包括:
▮▮▮▮ⓐ 新型基因治疗载体开发 (Development of Novel Gene Therapy Vectors):开发更安全、更有效、靶向性更强、免疫原性更低、基因包装容量更大的新型基因治疗载体,例如新型 AAV 变体、非病毒纳米载体、工程化外泌体载体等。
▮▮▮▮ⓑ 基因编辑技术优化与应用拓展 (Optimization and Application Expansion of Gene Editing Technologies):优化基因编辑技术,提高靶向性和精确性,降低脱靶效应,开发新型基因编辑工具,例如碱基编辑、先导编辑、RNA 编辑等,拓展基因编辑技术在遗传病、肿瘤、感染性疾病、自身免疫性疾病等领域的应用。
▮▮▮▮ⓒ 免疫基因治疗和肿瘤溶瘤病毒治疗发展 (Development of Immunogene Therapy and Oncolytic Virus Therapy):免疫基因治疗和肿瘤溶瘤病毒治疗是肿瘤基因治疗的重要方向,未来将进一步发展新型肿瘤疫苗、CAR-T 细胞治疗、基因修饰的溶瘤病毒等,提高肿瘤治疗的疗效和安全性。
▮▮▮▮ⓓ RNA 治疗发展 (Development of RNA Therapy):RNA 治疗,例如 mRNA 疫苗、siRNA 治疗、ASO 治疗、miRNA 治疗等,具有制备快速、安全性高、作用机制多样等优点,未来将在遗传病、肿瘤、感染性疾病等领域发挥重要作用。
▮▮▮▮ⓔ 基因治疗与其他疗法联合应用 (Combination of Gene Therapy with Other Therapies):将基因治疗与传统疗法 (例如药物治疗、手术治疗、放疗) 或其他新型疗法 (例如免疫治疗、细胞治疗) 联合应用,有望提高治疗效果,克服单一疗法的局限性。
▮▮▮▮ⓕ 基因治疗的个体化和精准化 (Personalization and Precision of Gene Therapy):根据患者的基因背景、疾病类型、病情程度等个体化特征,制定个体化的基因治疗方案,选择最合适的基因治疗策略、载体、剂量和给药途径,提高基因治疗的疗效和安全性。
▮▮▮▮ⓖ 基因治疗的可及性和普及化 (Accessibility and Popularization of Gene Therapy):降低基因治疗药物的制备成本,简化生产工艺,提高药物的可及性,使更多患者能够受益于基因治疗。
9. 分子生物学在生物技术中的应用 (Molecular Biology in Biotechnology)
本章探讨分子生物学在生物技术领域的广泛应用,包括基因工程、蛋白质工程、酶工程、细胞工程、代谢工程和合成生物学等,展现分子生物学对生物技术产业的推动作用。
9.1 基因工程与重组 DNA 技术 (Genetic Engineering and Recombinant DNA Technology)
介绍基因工程的基本原理、重组 DNA 技术的步骤和应用,包括基因克隆、基因表达、转基因生物、基因编辑等。
9.1.1 基因克隆与表达 (Gene Cloning and Expression)
讲解基因克隆的步骤、表达载体的构建、原核表达系统、真核表达系统、蛋白质表达的优化。
基因克隆 (gene cloning) 和表达 (expression) 是基因工程 (genetic engineering) 的核心技术,它允许科学家分离、复制和表达特定的基因,从而深入研究基因功能,并生产有价值的蛋白质产品。
① 基因克隆的步骤 (Steps of Gene Cloning)
基因克隆通常包括以下几个关键步骤:
▮▮▮▮ⓐ 目的基因的获取 (Obtaining the Target Gene):
获取目标基因是克隆的第一步。目的基因可以来源于基因组 DNA (genomic DNA)、cDNA (互补DNA) 或人工合成。
⚝ 基因组 DNA 获取:从细胞或组织中提取基因组 DNA,然后通过 PCR (聚合酶链式反应) 或限制性内切酶 (restriction enzyme) 酶切等方法获得含有目的基因的 DNA 片段。
⚝ cDNA 获取:从细胞或组织中提取 mRNA (信使RNA),通过逆转录酶 (reverse transcriptase) 将 mRNA 反转录成 cDNA。cDNA 文库 (cDNA library) 包含了细胞中所有表达基因的 cDNA 序列,从中可以筛选和扩增目的基因。
⚝ 人工基因合成:对于序列已知的基因,可以通过化学方法人工合成 DNA 片段。随着 DNA 合成技术的发展,合成长片段基因变得越来越经济高效。
▮▮▮▮ⓑ 载体的选择与制备 (Vector Selection and Preparation):
载体 (vector) 是将目的基因导入宿主细胞并进行复制的 DNA 分子。常用的载体包括质粒 (plasmid)、噬菌体 (bacteriophage)、病毒载体 (viral vector) 和人工染色体 (artificial chromosome) 等。
⚝ 质粒载体:是最常用的克隆载体,通常为环状双链 DNA 分子,具有复制起点 (origin of replication)、多克隆位点 (multiple cloning site, MCS)、抗生素抗性基因 (antibiotic resistance gene) 等元件。
⚝ 噬菌体载体:如 λ 噬菌体载体,适用于克隆较大片段的 DNA。
⚝ 病毒载体:如腺病毒载体 (adenovirus vector)、慢病毒载体 (lentivirus vector) 等,具有高效的基因导入能力,常用于基因治疗和真核细胞基因表达。
⚝ 人工染色体:如 BAC (细菌人工染色体)、YAC (酵母人工染色体),可以克隆非常大的 DNA 片段,用于基因组研究。
载体的制备通常包括用限制性内切酶酶切载体 DNA,使其线性化并产生与目的基因片段相匹配的末端。
▮▮▮▮ⓒ 重组 DNA 的构建 (Construction of Recombinant DNA):
将目的基因片段插入到线性化的载体 DNA 中,构建重组 DNA 分子 (recombinant DNA)。这一过程通常使用 DNA 连接酶 (DNA ligase) 将目的基因片段与载体 DNA 的末端连接起来。连接反应后,形成环状的重组质粒分子。
▮▮▮▮ⓓ 转化 (Transformation):
将重组 DNA 分子导入宿主细胞 (host cell) 的过程称为转化。常用的转化方法包括:
⚝ 细菌转化:常用方法包括热激转化 (heat shock transformation) 和电穿孔转化 (electroporation)。
⚝ 酵母转化:常用方法包括锂离子转化 (lithium acetate transformation) 和电穿孔转化。
⚝ 真核细胞转染:对于哺乳动物细胞等真核细胞,常用的转染方法包括脂质体转染 (lipofection)、磷酸钙转染 (calcium phosphate transfection) 和病毒感染 (viral transduction)。
▮▮▮▮ⓔ 筛选重组克隆 (Screening of Recombinant Clones):
转化后,需要从大量的宿主细胞中筛选出含有重组 DNA 分子的细胞,即重组克隆 (recombinant clone)。常用的筛选方法包括:
⚝ 抗生素筛选:利用载体上的抗生素抗性基因,在含有相应抗生素的培养基上培养转化后的细胞。只有含有重组质粒的细胞才能在抗生素选择压力下存活。
⚝ 蓝白斑筛选:对于含有 lacZ 基因的质粒载体,插入目的基因会破坏 lacZ 基因的表达,导致菌落颜色由蓝色变为白色,从而筛选出重组克隆。
⚝ 核酸杂交 (nucleic acid hybridization):利用与目的基因序列互补的探针 (probe) 与菌落或噬菌斑进行杂交,检测含有目的基因的克隆。
⚝ PCR 筛选:提取菌落或噬菌斑的 DNA,通过 PCR 扩增目的基因片段,快速鉴定重组克隆。
② 表达载体的构建 (Construction of Expression Vectors)
表达载体 (expression vector) 不仅能够复制目的基因,还能驱动目的基因在宿主细胞中高效表达,产生蛋白质产物。表达载体通常比克隆载体具有更复杂的结构,包含以下关键元件:
▮▮▮▮ⓐ 强启动子 (Strong Promoter):
启动子 (promoter) 是 RNA 聚合酶 (RNA polymerase) 结合和起始转录 (transcription) 的 DNA 序列。表达载体需要使用强启动子,以确保目的基因能够高效转录。常用的启动子包括:
⚝ 原核启动子:如 lac 启动子、tac 启动子、T7 启动子等,适用于原核表达系统。
⚝ 真核启动子:如 CMV 启动子、SV40 启动子、EF-1α 启动子等,适用于真核表达系统。
▮▮▮▮ⓑ 核糖体结合位点 (Ribosome Binding Site, RBS):
在原核表达系统中,需要核糖体结合位点 (RBS),如 Shine-Dalgarno 序列,引导核糖体 (ribosome) 正确结合 mRNA (信使RNA) 并起始翻译 (translation)。真核表达系统则依赖 mRNA 5' 端的帽子结构 (5' cap) 进行核糖体结合。
▮▮▮▮ⓒ 终止子 (Terminator):
终止子是 RNA 聚合酶停止转录的 DNA 序列,确保 mRNA 的正确终止。
▮▮▮▮ⓓ 编码序列 (Coding Sequence):
目的基因的编码序列,即开放阅读框 (open reading frame, ORF)。
▮▮▮▮ⓔ 选择标记 (Selectable Marker):
如抗生素抗性基因,用于筛选含有表达载体的宿主细胞。
▮▮▮▮ⓕ 复制起点 (Origin of Replication, Ori):
确保表达载体在宿主细胞中能够复制和维持。
▮▮▮▮ⓖ 多克隆位点 (Multiple Cloning Site, MCS):
方便目的基因插入的含有多个限制性内切酶酶切位点的区域。
此外,表达载体还可以包含:
▮▮▮▮ⓗ 信号肽序列 (Signal Peptide Sequence):
引导分泌性蛋白质 (secretory protein) 分泌到细胞外或特定细胞器的信号序列。
▮▮▮▮ⓘ 标签序列 (Tag Sequence):
如 His 标签、FLAG 标签、GST 标签等,用于蛋白质纯化 (protein purification) 和检测。
③ 原核表达系统 (Prokaryotic Expression Systems)
原核表达系统 (prokaryotic expression system) 最常用的是细菌表达系统,尤其是大肠杆菌 (Escherichia coli) 表达系统。大肠杆菌具有生长快速、遗传背景清楚、操作简便、成本低廉等优点,是生产重组蛋白质 (recombinant protein) 的重要工具。
▮▮▮▮ⓐ 大肠杆菌表达系统的优点 (Advantages of E. coli Expression System):
⚝ 生长快速:大肠杆菌生长周期短,繁殖速度快,可以在短时间内大量扩增。
⚝ 遗传背景清楚:大肠杆菌的遗传学研究深入,基因操作技术成熟。
⚝ 操作简便:大肠杆菌培养条件简单,转化效率高,易于大规模培养和操作。
⚝ 成本低廉:培养基成分简单,成本较低。
▮▮▮▮ⓑ 大肠杆菌表达系统的缺点 (Disadvantages of E. coli Expression System):
⚝ 不能进行真核蛋白质的正确折叠和修饰:大肠杆菌缺乏真核细胞的蛋白质折叠 (protein folding) 机制和翻译后修饰 (post-translational modification, PTM) 系统,如糖基化 (glycosylation)。因此,表达复杂的真核蛋白质,尤其是需要糖基化的蛋白质,可能无法获得具有生物活性的产物。
⚝ 可能形成包涵体 (inclusion body):在大肠杆菌中过量表达外源蛋白质,容易导致蛋白质错误折叠和聚集,形成无活性的包涵体。包涵体需要经过变性复性等复杂步骤才能获得可溶性活性蛋白质。
⚝ 内毒素污染 (endotoxin contamination):大肠杆菌细胞壁含有脂多糖 (lipopolysaccharide, LPS),即内毒素,对人体具有毒性。生产的重组蛋白质如果用于医药领域,需要去除内毒素。
▮▮▮▮ⓒ 优化大肠杆菌表达的方法 (Methods to Optimize E. coli Expression):
⚝ 选择合适的表达菌株:不同的 E. coli 菌株具有不同的蛋白酶活性、密码子偏好性等,选择合适的菌株可以提高表达效率和蛋白质质量。例如,蛋白酶缺陷型菌株可以减少蛋白质降解,密码子优化菌株可以提高稀有密码子基因的表达。
⚝ 优化表达载体:选择合适的启动子强度、RBS 序列、终止子等,可以调控基因表达水平。使用可诱导型启动子 (inducible promoter),如 lac 启动子、T7 启动子,可以在细胞生长到一定密度后再诱导蛋白质表达,减少对细胞生长的影响。
⚝ 优化培养条件:优化培养温度、pH 值、营养成分、诱导剂浓度和诱导时间等,可以提高蛋白质表达水平和可溶性。降低培养温度通常可以提高蛋白质的可溶性,减少包涵体形成。
⚝ 密码子优化 (codon optimization):根据大肠杆菌的密码子偏好性,优化目的基因的密码子,提高翻译效率。
⚝ 融合表达 (fusion expression):将目的基因与易于可溶表达的标签蛋白 (tag protein),如 GST、MBP、SUMO 等融合表达,可以提高蛋白质的可溶性,并方便后续纯化。
⚝ 分子伴侣共表达 (co-expression with molecular chaperones):共表达分子伴侣 (molecular chaperone),如 GroEL/ES、DnaK/DnaJ 等,可以辅助蛋白质正确折叠,提高可溶性活性蛋白质的产量。
④ 真核表达系统 (Eukaryotic Expression Systems)
真核表达系统 (eukaryotic expression system) 包括酵母表达系统 (yeast expression system)、昆虫细胞-杆状病毒表达系统 (insect cell-baculovirus expression system)、哺乳动物细胞表达系统 (mammalian cell expression system) 和植物细胞表达系统 (plant cell expression system) 等。真核表达系统能够进行真核蛋白质的正确折叠和翻译后修饰,适用于表达复杂的真核蛋白质,尤其是用于生物医药领域的蛋白质药物。
▮▮▮▮ⓐ 酵母表达系统 (Yeast Expression System):
常用酵母表达系统包括酿酒酵母 (Saccharomyces cerevisiae) 和毕赤酵母 (Pichia pastoris)。酵母表达系统具有以下优点:
⚝ 真核细胞:能够进行真核蛋白质的正确折叠和一些简单的翻译后修饰,如 N-糖基化。
⚝ 遗传背景清楚:酵母的遗传学研究深入,基因操作技术成熟。
⚝ 培养条件相对简单:培养成本低于哺乳动物细胞,易于大规模培养。
⚝ 分泌表达:毕赤酵母等酵母可以高效分泌表达外源蛋白质到培养基中,方便蛋白质纯化。
酵母表达系统的缺点是糖基化类型与哺乳动物细胞不同,可能产生免疫原性。
▮▮▮▮ⓑ 昆虫细胞-杆状病毒表达系统 (Insect Cell-Baculovirus Expression System):
利用杆状病毒 (baculovirus) 感染昆虫细胞 (insect cell),如 Sf9、Sf21 细胞,进行重组蛋白质表达。昆虫细胞-杆状病毒表达系统具有以下优点:
⚝ 真核细胞:能够进行较为复杂的真核蛋白质折叠和翻译后修饰,包括糖基化、磷酸化 (phosphorylation) 等。
⚝ 表达水平高:杆状病毒感染效率高,可以获得较高的蛋白质表达水平。
⚝ 安全性较高:杆状病毒不感染脊椎动物,安全性较高。
昆虫细胞-杆状病毒表达系统的缺点是培养成本较高,表达周期较长。
▮▮▮▮ⓒ 哺乳动物细胞表达系统 (Mammalian Cell Expression System):
常用哺乳动物细胞表达系统包括 CHO 细胞 (Chinese Hamster Ovary cell)、HEK293 细胞 (Human Embryonic Kidney 293 cell) 等。哺乳动物细胞表达系统具有以下优点:
⚝ 最接近天然状态的翻译后修饰:能够进行最接近天然状态的真核蛋白质折叠和翻译后修饰,包括正确的糖基化类型。
⚝ 表达产物生物活性高:表达的蛋白质生物活性高,免疫原性低,适用于生产治疗性蛋白质药物,如单克隆抗体 (monoclonal antibody)、重组酶等。
哺乳动物细胞表达系统的缺点是培养成本高昂,生长速度慢,表达水平相对较低,操作复杂。
▮▮▮▮ⓓ 植物细胞表达系统 (Plant Cell Expression System):
利用植物细胞或转基因植物 (transgenic plant) 进行重组蛋白质表达。植物细胞表达系统具有以下优点:
⚝ 成本低廉:植物培养成本低,易于大规模生产。
⚝ 安全性高:植物源性产品安全性较高。
⚝ 可进行真核蛋白质的折叠和修饰:植物细胞可以进行一些真核蛋白质的折叠和翻译后修饰。
植物细胞表达系统的缺点是表达水平相对较低,糖基化类型与哺乳动物细胞不同。
⑤ 蛋白质表达的优化 (Optimization of Protein Expression)
为了获得高产量、高活性、高质量的重组蛋白质,需要对蛋白质表达进行优化。优化的策略包括:
▮▮▮▮ⓐ 载体优化:选择合适的启动子、RBS、终止子、标签序列等。
▮▮▮▮ⓑ 宿主细胞优化:选择合适的表达菌株或细胞系。
▮▮▮▮ⓒ 培养条件优化:优化培养温度、pH 值、营养成分、诱导条件等。
▮▮▮▮ⓓ 密码子优化:根据宿主细胞的密码子偏好性优化目的基因序列。
▮▮▮▮ⓔ 翻译后修饰优化:对于需要特定翻译后修饰的蛋白质,可以选择能够进行相应修饰的表达系统,或进行体外酶修饰。
▮▮▮▮ⓕ 蛋白质纯化工艺优化:优化蛋白质纯化方法和步骤,提高纯化效率和蛋白质回收率。
通过综合运用以上优化策略,可以显著提高重组蛋白质的表达水平和质量,满足科研和产业需求。基因克隆与表达技术是分子生物学和生物技术领域最基础和最重要的技术之一,为基因功能研究、蛋白质工程、药物开发、诊断试剂生产等领域提供了强大的技术支撑。
9.1.2 转基因生物 (Transgenic Organisms)
介绍转基因植物、转基因动物、转基因微生物的制备方法、应用和安全性评价。
转基因生物 (transgenic organism),也称为基因修饰生物 (genetically modified organism, GMO),是指通过基因工程技术将外源基因 (foreign gene) 导入生物体基因组 (genome) 中,并使其稳定遗传和表达的生物。转基因技术 (transgenic technology) 广泛应用于植物、动物和微生物,在农业、医药、工业和科研领域具有重要应用价值。
① 转基因植物 (Transgenic Plants)
转基因植物 (transgenic plant) 是指通过基因工程技术导入外源基因并稳定整合到植物基因组中的植物。转基因植物的制备方法主要包括农杆菌介导转化法 (Agrobacterium-mediated transformation) 和基因枪转化法 (gene gun transformation)。
▮▮▮▮ⓐ 农杆菌介导转化法 (Agrobacterium-mediated Transformation):
农杆菌 (Agrobacterium tumefaciens) 是一种天然的植物病原菌,具有将自身 Ti 质粒 (Ti plasmid) 上的 T-DNA (转移DNA) 转移并整合到植物细胞基因组中的能力。农杆菌介导转化法是制备转基因植物最常用的方法。
⚝ T-DNA 载体的构建:将含有目的基因的 DNA 片段克隆到去除致瘤基因的 T-DNA 区域,构建植物表达载体 (plant expression vector)。
⚝ 农杆菌的转化:将植物表达载体导入农杆菌。
⚝ 植物组织的侵染:将植物组织 (如叶片、茎段、愈伤组织) 与含有重组质粒的农杆菌共培养,使农杆菌将 T-DNA 转移到植物细胞中。
⚝ 筛选与再生:利用植物表达载体上的选择标记基因 (如抗生素抗性基因、除草剂抗性基因),在选择性培养基上筛选转化成功的植物细胞。通过植物组织培养技术,将转化成功的细胞再生为完整的转基因植株。
农杆菌介导转化法适用于大多数双子叶植物和部分单子叶植物。
▮▮▮▮ⓑ 基因枪转化法 (Gene Gun Transformation):
基因枪转化法,也称为生物弹轰击法 (biolistic transformation),是将包裹着 DNA 的微小金颗粒或钨颗粒高速射入植物细胞,使 DNA 进入细胞核并整合到基因组中的方法。基因枪转化法适用于各种植物,尤其是农杆菌转化困难的单子叶植物,如玉米、水稻、小麦等。
⚝ DNA 包裹微弹:将含有目的基因的 DNA 沉淀到金颗粒或钨颗粒表面,制备 DNA 包裹的微弹。
⚝ 基因枪轰击:利用基因枪装置,将 DNA 包裹的微弹高速射入植物细胞或组织。
⚝ 筛选与再生:与农杆菌介导转化法类似,通过选择性培养基筛选转化成功的植物细胞,并再生为转基因植株。
▮▮▮▮ⓒ 转基因植物的应用 (Applications of Transgenic Plants):
转基因植物在农业生产、食品工业、医药产业和环境保护等领域具有广泛应用。
⚝ 抗虫转基因植物:导入苏云金芽孢杆菌 (Bacillus thuringiensis, Bt) 毒蛋白基因,提高植物的抗虫能力,减少农药使用,如 Bt 棉花、Bt 玉米。
⚝ 抗除草剂转基因植物:导入抗除草剂基因,使植物能够耐受广谱除草剂,方便田间杂草管理,如抗草甘膦大豆、抗草甘膦玉米。
⚝ 抗病转基因植物:导入抗病毒、抗真菌、抗细菌基因,提高植物的抗病能力,减少病害损失。
⚝ 改善农产品品质:通过基因工程手段,提高农产品的营养价值、改善口感、延长保鲜期,如高油酸大豆、富含 β-胡萝卜素的“黄金大米”。
⚝ 植物生物反应器 (plant bioreactor):利用转基因植物生产医药用蛋白质、工业酶、生物塑料等高附加值产品,降低生产成本。
⚝ 植物修复 (phytoremediation):利用转基因植物吸收、降解土壤中的重金属、有机污染物,修复污染环境。
▮▮▮▮ⓓ 转基因植物的安全性评价 (Safety Assessment of Transgenic Plants):
转基因植物的安全性是公众关注的焦点。各国政府和国际组织都制定了严格的转基因植物安全性评价体系,包括:
⚝ 环境安全性评价:评估转基因植物对生态环境的影响,如对非靶标生物的影响、基因漂移、杂草化风险等。
⚝ 食品安全性评价:评估转基因食品对人体健康的影响,如毒性、过敏性、营养成分变化等。
⚝ 田间试验与风险管理:进行严格的田间试验,监测转基因植物的生长、性状和环境影响。建立完善的风险管理体系,确保转基因植物的安全应用。
经过严格安全性评价并获得批准的转基因植物,可以安全地应用于农业生产和食品工业。
② 转基因动物 (Transgenic Animals)
转基因动物 (transgenic animal) 是指通过基因工程技术导入外源基因并稳定整合到动物基因组中的动物。转基因动物的制备方法主要包括显微注射法 (microinjection)、逆转录病毒介导法 (retrovirus-mediated transduction) 和干细胞介导法 (stem cell-mediated transduction)。近年来,基因编辑技术 (genome editing technology),如 CRISPR-Cas9 系统,也成为制备转基因动物的重要手段。
▮▮▮▮ⓐ 显微注射法 (Microinjection):
显微注射法是将含有目的基因的 DNA 溶液直接注射到动物受精卵 (fertilized egg) 的原核 (pronucleus) 中,使外源 DNA 随机整合到基因组中的方法。显微注射法是最早发展起来的转基因动物制备方法,适用于多种动物,尤其是大型家畜,如小鼠、猪、牛、羊等。
⚝ DNA 的制备:线性化含有目的基因的 DNA 片段。
⚝ 受精卵的获取与显微注射:从雌性动物体内获取受精卵,在显微镜下将 DNA 溶液注射到受精卵的原核中。
⚝ 胚胎移植:将注射 DNA 的受精卵移植到代孕母体子宫内发育。
⚝ 后代鉴定:待动物出生后,通过 PCR、Southern blotting 等方法鉴定转基因后代。
显微注射法的优点是操作相对简单,适用于多种动物。缺点是转化效率较低,外源基因整合位点随机,可能引起插入突变 (insertional mutagenesis)。
▮▮▮▮ⓑ 逆转录病毒介导法 (Retrovirus-mediated Transduction):
逆转录病毒 (retrovirus) 具有感染细胞并将自身基因组整合到宿主细胞基因组中的能力。利用改造后的逆转录病毒作为载体,可以将外源基因高效导入动物细胞,制备转基因动物。
⚝ 逆转录病毒载体的构建:将目的基因克隆到去除致病基因的逆转录病毒载体中。
⚝ 病毒包装与感染:将重组逆转录病毒载体包装成病毒颗粒,感染早期胚胎细胞或受精卵。
⚝ 胚胎移植与后代鉴定:与显微注射法类似,将感染病毒的胚胎移植到代孕母体,并鉴定转基因后代。
逆转录病毒介导法的优点是转化效率高,外源基因整合效率较高。缺点是病毒载体可能存在安全性问题,外源基因整合位点仍然具有一定的随机性。
▮▮▮▮ⓒ 干细胞介导法 (Stem Cell-mediated Transduction):
利用胚胎干细胞 (embryonic stem cell, ES cell) 或诱导多能干细胞 (induced pluripotent stem cell, iPSC) 作为中间载体,将外源基因导入干细胞,再将转基因干细胞导入早期胚胎,最终获得嵌合体动物 (chimeric animal),通过杂交繁育获得纯合转基因动物。
⚝ 干细胞的培养与转染:培养动物 ES 细胞或 iPSC 细胞,通过转染方法将外源基因导入干细胞。
⚝ 筛选转基因干细胞:筛选含有外源基因的干细胞克隆。
⚝ 干细胞注射与嵌合体动物:将转基因干细胞注射到早期胚胎 (如囊胚) 中,移植到代孕母体,发育为嵌合体动物。
⚝ 杂交繁育与纯合子:通过嵌合体动物与野生型动物杂交,筛选携带外源基因的后代,再通过近亲繁殖获得纯合转基因动物。
干细胞介导法的优点是可以进行基因的靶向修饰 (gene targeting),实现基因敲除 (gene knockout)、基因敲入 (gene knockin) 等精确的基因改造。缺点是操作复杂,ES 细胞技术仅在小鼠等少数动物中成熟。
▮▮▮▮ⓓ 基因编辑技术 (Genome Editing Technologies):
基因编辑技术,如锌指核酸酶 (zinc finger nuclease, ZFN)、转录激活因子样效应物核酸酶 (transcription activator-like effector nuclease, TALEN) 和 CRISPR-Cas9 系统,可以实现对基因组 DNA 的精确修饰。利用基因编辑技术制备转基因动物,可以实现基因敲除、基因敲入、基因点突变、基因片段插入等多种基因改造。CRISPR-Cas9 系统因其操作简便、效率高、成本低廉等优点,成为制备转基因动物最有力的工具。
⚝ CRISPR-Cas9 系统:包括 Cas9 核酸酶和向导 RNA (guide RNA, gRNA)。gRNA 指导 Cas9 核酸酶靶向切割基因组 DNA 的特定位点,利用细胞的 DNA 修复机制 (非同源末端连接 NHEJ 或同源重组 HR),实现基因的敲除或敲入。
⚝ 基因编辑制备转基因动物的步骤:设计 gRNA 靶向目的基因;将 Cas9 mRNA 和 gRNA 共注射到受精卵中;或将 Cas9 蛋白和 gRNA 复合体 (RNP) 注射到受精卵中;或通过病毒载体将 CRISPR-Cas9 系统导入细胞;进行胚胎移植和后代鉴定。
基因编辑技术制备转基因动物具有高效、精确、多基因编辑等优点,大大加速了转基因动物的研究和应用。
▮▮▮▮ⓔ 转基因动物的应用 (Applications of Transgenic Animals):
转基因动物在生物医药、农业生产、基础科研等领域具有重要应用。
⚝ 生物医药:
▮▮▮▮⚝ 生物反应器 (animal bioreactor):利用转基因动物乳腺、血液等生产治疗性蛋白质药物,如抗体、酶、凝血因子等,降低生产成本,实现大规模生产。如转基因羊、转基因牛生产人乳铁蛋白、人凝血因子 IX 等。
▮▮▮▮⚝ 疾病模型动物:构建人类疾病的动物模型,用于研究疾病发生机制、药物筛选和疗效评价。如肿瘤模型小鼠、阿尔茨海默病模型小鼠、糖尿病模型小鼠等。
▮▮▮▮⚝ 异种器官移植 (xenotransplantation):利用转基因猪等动物作为异种器官供体,解决人体器官移植供体短缺问题。通过基因改造,去除猪器官的免疫原性,降低排斥反应。
⚝ 农业生产:
▮▮▮▮⚝ 提高畜产品品质:通过基因工程手段,提高畜产品的生长速度、瘦肉率、产奶量、产蛋量、毛纤维品质等。如转基因快速生长猪、转基因高产奶牛、转基因抗病家禽。
▮▮▮▮⚝ 抗病抗逆转基因动物:提高动物的抗病能力、抗逆能力,减少疾病损失,提高养殖效益。如抗疯牛病转基因牛、抗禽流感转基因鸡。
⚝ 基础科研:
▮▮▮▮⚝ 基因功能研究:利用转基因动物研究基因的功能,揭示基因在发育、生理、疾病等过程中的作用。
▮▮▮▮⚝ 发育生物学研究:利用转基因动物研究胚胎发育、器官发生、细胞分化等过程的分子机制。
▮▮▮▮ⓕ 转基因动物的伦理与安全性问题 (Ethical and Safety Issues of Transgenic Animals):
转基因动物的制备和应用涉及伦理、动物福利和生物安全等问题,需要严格监管和规范。
⚝ 动物福利:转基因操作可能对动物健康和福利产生负面影响,如疾病、畸形、生理功能紊乱等。需要关注转基因动物的动物福利,减少动物痛苦,遵循 3R 原则 (替代、减少、优化)。
⚝ 生物安全:转基因动物可能对生态环境和人类健康产生潜在风险,如基因逃逸、外源基因传播、疾病传播等。需要进行严格的生物安全评价和风险管理,确保转基因动物的安全应用。
⚝ 伦理问题:转基因动物的制备和应用涉及伦理争议,如基因改造的界限、动物的权利、人类对动物的支配权等。需要进行伦理讨论和规范,平衡科学发展与伦理道德。
③ 转基因微生物 (Transgenic Microorganisms)
转基因微生物 (transgenic microorganism),也称为基因工程微生物 (genetically engineered microorganism, GEM),是指通过基因工程技术改造基因组的微生物,包括细菌、酵母、真菌、病毒等。转基因微生物在工业生产、环境保护、生物医药等领域具有广泛应用。
▮▮▮▮ⓐ 转基因微生物的制备方法 (Methods for Preparing Transgenic Microorganisms):
转基因微生物的制备方法主要包括转化 (transformation)、转导 (transduction) 和接合 (conjugation)。
⚝ 转化 (Transformation):将外源 DNA (如质粒 DNA、线性 DNA 片段) 直接导入微生物细胞,使其获得新的遗传特性。细菌转化常用热激转化、电穿孔转化、化学转化等方法。酵母转化常用锂离子转化、电穿孔转化等方法。
⚝ 转导 (Transduction):利用噬菌体 (bacteriophage) 或病毒 (virus) 作为载体,将外源基因导入微生物细胞。转导方法适用于细菌、酵母、真菌等多种微生物。
⚝ 接合 (Conjugation):利用细菌的接合作用,将携带外源基因的质粒 DNA 从供体菌转移到受体菌。接合方法适用于细菌等微生物。
⚝ 基因编辑技术:利用基因编辑技术,如 CRISPR-Cas9 系统,可以对微生物基因组进行精确修饰,实现基因敲除、基因敲入、基因突变等。基因编辑技术在转基因微生物制备中应用越来越广泛。
▮▮▮▮ⓑ 转基因微生物的应用 (Applications of Transgenic Microorganisms):
转基因微生物在工业生产、环境保护、生物医药等领域具有广泛应用。
⚝ 工业生产:
▮▮▮▮⚝ 酶制剂生产:利用转基因微生物大规模生产工业酶制剂,如蛋白酶、淀粉酶、脂肪酶、纤维素酶等,应用于食品、洗涤剂、纺织、造纸等行业。
▮▮▮▮⚝ 发酵产品生产:利用转基因微生物生产发酵产品,如氨基酸、有机酸、维生素、抗生素、生物燃料、生物塑料等。如转基因大肠杆菌生产胰岛素、人生长激素、青蒿素等。
▮▮▮▮⚝ 生物转化 (biotransformation):利用转基因微生物进行生物转化,将廉价原料转化为高附加值产品,如甾体药物中间体、手性化合物等。
⚝ 环境保护:
▮▮▮▮⚝ 生物修复 (bioremediation):利用转基因微生物降解环境污染物,如石油烃、农药、重金属等,修复污染土壤、水体。
▮▮▮▮⚝ 生物监测 (biomonitoring):利用转基因微生物作为生物传感器,监测环境污染物,如重金属、毒性物质等。
⚝ 生物医药:
▮▮▮▮⚝ 疫苗生产:利用转基因微生物生产疫苗,如重组亚单位疫苗、减毒活疫苗、DNA 疫苗等。如转基因酵母生产乙肝疫苗、HPV 疫苗。
▮▮▮▮⚝ 诊断试剂生产:利用转基因微生物生产诊断试剂,如酶联免疫吸附试验 (ELISA) 试剂、免疫层析试剂等。
▮▮▮▮⚝ 基因治疗:利用转基因微生物作为基因治疗载体,将治疗基因导入人体细胞,治疗遗传病、癌症等疾病。
▮▮▮▮ⓒ 转基因微生物的安全性评价与监管 (Safety Assessment and Regulation of Transgenic Microorganisms):
转基因微生物的安全性是应用的关键。需要进行严格的安全性评价和监管,确保转基因微生物的安全应用。
⚝ 生物安全性评价:评估转基因微生物对人类健康和生态环境的潜在风险,如毒性、致病性、基因水平转移、生态影响等。
⚝ 风险管理与控制:建立完善的风险管理体系,采取生物安全措施,如物理隔离、生物隔离、化学隔离等,防止转基因微生物泄漏和扩散。
⚝ 监管与审批:各国政府都制定了转基因微生物的监管法规,对转基因微生物的研发、生产、应用进行严格审批和监管。
经过严格安全性评价和监管的转基因微生物,可以在工业生产、环境保护、生物医药等领域发挥重要作用,为社会经济发展和人类健康做出贡献。
9.1.3 基因编辑技术在生物技术中的应用 (Applications of Genome Editing Technologies in Biotechnology)
讲解 CRISPR-Cas9 系统、TALEN、ZFN 等基因编辑技术在基因功能研究、基因治疗、农业育种、工业微生物改造等生物技术领域的应用。
基因编辑技术 (genome editing technology) 是一类能够精确修饰生物体基因组 DNA 的新兴技术,包括锌指核酸酶 (zinc finger nuclease, ZFN)、转录激活因子样效应物核酸酶 (transcription activator-like effector nuclease, TALEN) 和 CRISPR-Cas9 系统等。这些技术利用人工设计的核酸酶 (engineered nuclease) 靶向切割基因组 DNA 的特定位点,然后利用细胞自身的 DNA 修复机制 (非同源末端连接 NHEJ 或同源重组 HR),实现基因的敲除、敲入、点突变、片段插入等精确修饰。CRISPR-Cas9 系统因其操作简便、效率高、成本低廉等优点,成为目前最主流、应用最广泛的基因编辑技术。
① CRISPR-Cas9 系统 (CRISPR-Cas9 System)
CRISPR-Cas9 系统 (clustered regularly interspaced short palindromic repeats and CRISPR-associated protein 9) 源于细菌和古菌的适应性免疫系统,用于抵抗病毒和噬菌体的入侵。CRISPR-Cas9 系统主要由两个组分构成:Cas9 核酸酶 (Cas9 nuclease) 和向导 RNA (guide RNA, gRNA)。
▮▮▮▮ⓐ Cas9 核酸酶 (Cas9 Nuclease):
Cas9 是一种 DNA 内切酶,能够切割双链 DNA。常用的 Cas9 蛋白来源于 Streptococcus pyogenes (SpCas9)。Cas9 蛋白具有两个核酸酶结构域 (RuvC 和 HNH),分别切割 DNA 双链的两条链。Cas9 蛋白的活性依赖于 gRNA 的引导和 PAM 序列 (protospacer adjacent motif) 的存在。
▮▮▮▮ⓑ 向导 RNA (Guide RNA, gRNA):
gRNA 是一段约 20 个核苷酸的 RNA 序列,与目标基因组 DNA 序列互补,负责引导 Cas9 核酸酶靶向切割 DNA 的特定位点。gRNA 的结构包括 crRNA (CRISPR RNA) 和 tracrRNA (trans-activating crRNA) 两部分,或将 crRNA 和 tracrRNA 融合为单链 sgRNA (single guide RNA)。
▮▮▮▮ⓒ PAM 序列 (Protospacer Adjacent Motif):
PAM 序列是 Cas9 核酸酶识别和切割 DNA 的必要条件。SpCas9 的 PAM 序列为 5'-NGG-3',位于 gRNA 靶序列的 3' 端。PAM 序列的存在限制了 CRISPR-Cas9 系统的靶向范围,但也为基因编辑提供了特异性。
▮▮▮▮ⓓ CRISPR-Cas9 系统的工作机制 (Mechanism of CRISPR-Cas9 System):
⚝ gRNA 设计:根据目标基因组 DNA 序列,设计与靶序列互补的 20 nt gRNA 序列,并确保靶序列附近存在 PAM 序列。
⚝ gRNA 与 Cas9 蛋白结合:gRNA 与 Cas9 蛋白形成核糖核蛋白复合体 (ribonucleoprotein complex, RNP)。
⚝ 靶向 DNA:gRNA 引导 Cas9-gRNA 复合体结合到基因组 DNA 的靶序列,通过碱基配对识别靶序列。
⚝ DNA 切割:Cas9 核酸酶切割靶序列上游 3-4 bp 处的 DNA 双链,产生双链断裂 (double-strand break, DSB)。
⚝ DNA 修复:细胞通过两种主要的 DNA 修复途径修复 DSB:
▮▮▮▮⚝ 非同源末端连接 (Non-Homologous End Joining, NHEJ):NHEJ 是一种易错修复途径,直接连接 DNA 断裂末端,容易产生插入或缺失 (insertion or deletion, indel) 突变,导致基因失活 (gene knockout)。
▮▮▮▮⚝ 同源重组 (Homology-Directed Repair, HDR):HDR 是一种精确修复途径,利用同源模板 (donor template) 进行修复,可以实现基因的精确编辑,如基因敲入、基因点突变、基因片段替换等。
② TALEN 和 ZFN 技术 (TALEN and ZFN Technologies)
TALEN (transcription activator-like effector nuclease) 和 ZFN (zinc finger nuclease) 是较早发展的基因编辑技术,也利用人工设计的核酸酶靶向切割基因组 DNA。
▮▮▮▮ⓐ TALEN 技术 (TALEN Technology):
TALEN 由转录激活因子样效应物 (transcription activator-like effector, TALE) DNA 结合域和 FokI 核酸酶结构域组成。TALE DNA 结合域可以识别 DNA 序列,通过模块化组装 TALE 蛋白,可以设计识别特定 DNA 序列的 TALEN。FokI 核酸酶结构域只有二聚体形式才具有活性,因此需要设计一对 TALEN 作用于 DNA 靶位点两侧,形成 FokI 二聚体,才能切割 DNA。
▮▮▮▮ⓑ ZFN 技术 (ZFN Technology):
ZFN 由锌指蛋白 (zinc finger protein, ZFP) DNA 结合域和 FokI 核酸酶结构域组成。锌指蛋白可以识别 DNA 序列,通过组合不同的锌指模块,可以设计识别特定 DNA 序列的 ZFN。与 TALEN 类似,ZFN 也需要成对使用,形成 FokI 二聚体才能切割 DNA。
▮▮▮▮ⓒ TALEN 和 ZFN 技术的应用 (Applications of TALEN and ZFN Technologies):
TALEN 和 ZFN 技术也广泛应用于基因功能研究、基因治疗、农业育种、工业微生物改造等领域。但与 CRISPR-Cas9 系统相比,TALEN 和 ZFN 技术的设计和构建较为复杂,成本较高,应用受到一定限制。
③ 基因编辑技术在生物技术领域的应用 (Applications of Genome Editing Technologies in Biotechnology)
基因编辑技术,尤其是 CRISPR-Cas9 系统,在生物技术领域具有广泛的应用前景,正在深刻改变生物技术产业。
▮▮▮▮ⓐ 基因功能研究 (Gene Function Study):
基因编辑技术是研究基因功能的强大工具。通过 CRISPR-Cas9 系统,可以快速、高效地敲除、敲入或修饰细胞或模式生物的特定基因,研究基因在细胞生理、发育、疾病等过程中的作用。
⚝ 基因敲除文库 (gene knockout library):利用 CRISPR-Cas9 系统构建大规模基因敲除文库,进行高通量基因功能筛选。
⚝ 基因功能验证:通过基因编辑技术敲除或突变候选基因,验证基因功能,揭示基因作用机制。
⚝ 模式生物基因改造:利用基因编辑技术快速改造模式生物,如小鼠、斑马鱼、线虫、果蝇等,构建疾病模型、研究发育生物学问题。
▮▮▮▮ⓑ 基因治疗 (Gene Therapy):
基因编辑技术为基因治疗提供了新的策略和方法。利用 CRISPR-Cas9 系统,可以直接在患者体内或体外细胞中精确修复致病基因,治疗遗传病、癌症、感染性疾病等。
⚝ 遗传病治疗:利用 CRISPR-Cas9 系统修复单基因遗传病,如 β-地中海贫血、囊性纤维化、杜氏肌营养不良症等。
⚝ 癌症治疗:利用 CRISPR-Cas9 系统进行肿瘤免疫治疗,如 CAR-T 细胞治疗,或直接靶向癌基因,杀伤肿瘤细胞。
⚝ 感染性疾病治疗:利用 CRISPR-Cas9 系统靶向病毒基因,清除病毒感染,如 HIV 治疗、乙肝治疗。
▮▮▮▮ⓒ 农业育种 (Agricultural Breeding):
基因编辑技术为农作物育种提供了高效、精确的手段,可以快速培育高产、优质、抗病、抗逆的新品种。
⚝ 作物改良:利用基因编辑技术改良作物的产量、品质、营养成分、抗病虫害能力、抗逆能力等重要农艺性状。如高产水稻、抗病小麦、耐盐碱玉米。
⚝ 家畜改良:利用基因编辑技术改良家畜的生长速度、肉质、产奶量、抗病能力等。如抗病猪、高产奶牛。
⚝ 分子育种加速:基因编辑技术可以加速分子育种进程,缩短育种周期,提高育种效率。
▮▮▮▮ⓓ 工业微生物改造 (Industrial Microorganism Modification):
基因编辑技术可以精确改造工业微生物,提高其生产效率、产品质量、底物利用范围、环境适应性等,应用于生物制药、生物化工、生物能源等领域。
⚝ 代谢途径优化:利用基因编辑技术优化微生物的代谢途径,提高目标产物的合成效率,降低副产物生成。
⚝ 底物利用拓展:利用基因编辑技术拓展微生物的底物利用范围,使其能够利用廉价原料,如纤维素、木质素等,生产生物燃料、生物基化学品。
⚝ 环境适应性增强:利用基因编辑技术增强微生物的环境适应性,使其能够在极端条件下 (如高温、高盐、酸碱) 生长和生产。
▮▮▮▮ⓔ 合成生物学 (Synthetic Biology):
基因编辑技术是合成生物学的重要工具。利用基因编辑技术,可以精确构建和改造生物元件、生物器件、生物系统,实现人工设计生物功能,应用于生物能源、生物医药、生物材料等领域。
⚝ 生物元件标准化:利用基因编辑技术精确构建和标准化生物元件,如启动子、RBS、编码序列、终止子等,方便生物元件的组装和模块化设计。
⚝ 生物器件构建:利用基因编辑技术精确组装生物元件,构建具有特定功能的生物器件,如基因开关、生物传感器、代谢通路模块等。
⚝ 生物系统设计与构建:利用基因编辑技术精确设计和构建复杂的生物系统,实现人工设计生物功能,如生物燃料生产、药物合成、疾病诊断与治疗。
基因编辑技术作为一项革命性的生物技术,正在不断拓展其应用领域,为生物技术产业带来新的发展机遇。随着技术的不断进步和完善,基因编辑技术将在未来生物技术领域发挥越来越重要的作用。
9.1.4 重组 DNA 技术在疫苗和药物开发中的应用 (Applications of Recombinant DNA Technology in Vaccine and Drug Development)
介绍重组疫苗、基因工程抗体、重组蛋白药物的开发和生产。
重组 DNA 技术 (recombinant DNA technology) 是现代生物技术的核心技术之一,在疫苗 (vaccine) 和药物 (drug) 开发领域发挥着至关重要的作用。利用重组 DNA 技术,可以开发新型疫苗、基因工程抗体 (genetically engineered antibody) 和重组蛋白药物 (recombinant protein drug),为疾病预防和治疗提供新的手段。
① 重组疫苗 (Recombinant Vaccines)
重组疫苗 (recombinant vaccine) 是指利用重组 DNA 技术制备的新型疫苗。与传统疫苗相比,重组疫苗具有安全性高、免疫原性好、生产成本低等优点。重组疫苗主要包括以下几种类型:
▮▮▮▮ⓐ 亚单位疫苗 (Subunit Vaccines):
亚单位疫苗是指提取病原微生物 (pathogen) 的特定抗原 (antigen) 成分,如蛋白质、多糖等,通过重组 DNA 技术在宿主细胞中大量表达,纯化后制成的疫苗。亚单位疫苗只包含病原体的部分成分,不含活的或灭活的病原体,因此安全性高,不会引起感染。
⚝ 制备方法:
▮▮▮▮⚝ 抗原基因克隆与表达:克隆病原体的抗原基因,构建表达载体,在细菌、酵母、细胞等宿主细胞中表达抗原蛋白。
▮▮▮▮⚝ 抗原蛋白纯化:纯化表达的抗原蛋白。
▮▮▮▮⚝ 疫苗制剂:将纯化的抗原蛋白与佐剂 (adjuvant) 等辅料混合,制成疫苗制剂。
⚝ 代表疫苗:乙型肝炎疫苗 (Hepatitis B vaccine)、人乳头瘤病毒疫苗 (Human Papillomavirus vaccine, HPV vaccine)。
▮▮▮▮ⓑ 基因工程减毒活疫苗 (Live Attenuated Vaccines Engineered by Genetic Engineering):
基因工程减毒活疫苗是指利用重组 DNA 技术对病原体的毒力基因 (virulence gene) 进行改造,使其毒力减弱或丧失,但仍保留免疫原性的活疫苗。基因工程减毒活疫苗具有免疫效果好、免疫持久性强等优点,但安全性仍需关注。
⚝ 制备方法:
▮▮▮▮⚝ 毒力基因鉴定与敲除:鉴定病原体的毒力基因,利用基因编辑技术 (如 CRISPR-Cas9 系统) 或基因敲除技术敲除毒力基因。
▮▮▮▮⚝ 减毒株筛选:筛选毒力减弱或丧失,但仍保留免疫原性的减毒株。
▮▮▮▮⚝ 疫苗制剂:将减毒株制成疫苗制剂。
⚝ 代表疫苗:基因工程减毒流感疫苗 (Influenza vaccine)。
▮▮▮▮ⓒ 载体疫苗 (Vector Vaccines):
载体疫苗是指利用无害的病毒或细菌作为载体,将病原体的抗原基因插入载体基因组中,制成重组载体疫苗。接种载体疫苗后,载体在体内复制,表达病原体抗原,诱导免疫应答。载体疫苗具有免疫原性好、免疫应答类型多样等优点。
⚝ 制备方法:
▮▮▮▮⚝ 载体选择:常用载体包括腺病毒 (adenovirus)、痘苗病毒 (vaccinia virus)、细菌 (如沙门氏菌 Salmonella) 等。
▮▮▮▮⚝ 抗原基因插入载体:将病原体的抗原基因插入载体基因组中,构建重组载体。
▮▮▮▮⚝ 疫苗制剂:将重组载体制成疫苗制剂。
⚝ 代表疫苗:埃博拉疫苗 (Ebola vaccine)、新冠疫苗 (COVID-19 vaccine) (腺病毒载体疫苗)。
▮▮▮▮ⓓ DNA 疫苗 (DNA Vaccines):
DNA 疫苗是指将编码病原体抗原的 DNA 质粒直接注射到机体,利用宿主细胞表达抗原蛋白,诱导免疫应答的疫苗。DNA 疫苗具有制备简便、稳定性好、安全性高等优点,但免疫原性相对较弱。
⚝ 制备方法:
▮▮▮▮⚝ 抗原基因克隆与质粒构建:克隆病原体的抗原基因,构建 DNA 疫苗质粒,质粒包含启动子、抗原基因、终止子等元件。
▮▮▮▮⚝ 疫苗制剂:将 DNA 质粒制成疫苗制剂。
⚝ 代表疫苗:兽用 DNA 疫苗 (如鱼类 DNA 疫苗)。
② 基因工程抗体 (Genetically Engineered Antibodies)
基因工程抗体 (genetically engineered antibody) 是指利用重组 DNA 技术改造和构建的抗体。与传统抗体相比,基因工程抗体具有特异性高、亲和力强、人源化程度高、生产成本低等优点,在疾病诊断、治疗和科研领域具有广泛应用。基因工程抗体主要包括以下几种类型:
▮▮▮▮ⓐ 单克隆抗体 (Monoclonal Antibodies, mAbs):
单克隆抗体是指由单一 B 细胞克隆产生的,只识别单一抗原表位的抗体。单克隆抗体具有特异性高、均一性好等优点,是基因工程抗体的基础。
⚝ 杂交瘤技术 (Hybridoma Technology):传统单克隆抗体制备方法是杂交瘤技术,将免疫动物的脾 B 细胞与骨髓瘤细胞融合,筛选能产生特定抗体的杂交瘤细胞克隆,进行体外培养或动物体内生产单克隆抗体。
⚝ 噬菌体展示技术 (Phage Display Technology):利用噬菌体展示抗体片段 (如 Fab、scFv),通过筛选高亲和力抗体片段,再通过基因工程技术构建完整抗体或抗体衍生物。
⚝ B 细胞克隆技术 (B Cell Cloning Technology):直接克隆免疫动物 B 细胞的抗体基因,在体外表达生产单克隆抗体。
▮▮▮▮ⓑ 人源化抗体 (Humanized Antibodies):
人源化抗体是指将鼠源单克隆抗体的互补决定区 (complementarity-determining region, CDR) 嫁接到人抗体的骨架区 (framework region) 上,降低鼠源抗体的免疫原性,提高在人体内的安全性和有效性。
⚝ CDR 嫁接 (CDR Grafting):将鼠源抗体的 CDR 序列替换人抗体的骨架区序列,构建人源化抗体基因,在细胞中表达生产人源化抗体。
▮▮▮▮ⓒ 全人源抗体 (Fully Human Antibodies):
全人源抗体是指完全来源于人源基因的抗体,免疫原性最低,安全性最高。全人源抗体制备方法主要包括:
⚝ 转基因小鼠技术 (Transgenic Mouse Technology):构建携带人抗体基因座的转基因小鼠,免疫转基因小鼠后,可以获得全人源单克隆抗体。
⚝ 噬菌体展示人抗体库技术 (Phage Display Human Antibody Library Technology):构建噬菌体展示人抗体库,通过筛选高亲和力人抗体片段,构建全人源抗体。
▮▮▮▮ⓓ 抗体片段与衍生物 (Antibody Fragments and Derivatives):
为了进一步优化抗体的特性,可以利用基因工程技术构建抗体片段和衍生物,如 Fab 片段、scFv 片段、双特异性抗体 (bispecific antibody)、抗体药物偶联物 (antibody-drug conjugate, ADC) 等。
⚝ Fab 片段、scFv 片段:抗体片段具有分子量小、组织穿透性好、清除速度快等优点,适用于肿瘤诊断和治疗。
⚝ 双特异性抗体:双特异性抗体可以同时结合两个不同的抗原或表位,具有独特的治疗应用,如肿瘤免疫治疗、靶向药物递送。
⚝ 抗体药物偶联物:将抗体与细胞毒性药物偶联,利用抗体的靶向性将药物精确递送到肿瘤细胞,提高疗效,降低毒副作用。
③ 重组蛋白药物 (Recombinant Protein Drugs)
重组蛋白药物 (recombinant protein drug) 是指利用重组 DNA 技术在宿主细胞中表达生产的具有治疗作用的蛋白质药物。与传统药物相比,重组蛋白药物具有靶向性强、疗效好、副作用小等优点,是生物医药领域的重要组成部分。重组蛋白药物种类繁多,包括:
▮▮▮▮ⓐ 治疗性酶 (Therapeutic Enzymes):
如重组人胰岛素 (recombinant human insulin)、重组人组织型纤溶酶原激活剂 (recombinant human tissue plasminogen activator, rt-PA)、重组人凝血因子 (recombinant human coagulation factor) 等,用于治疗糖尿病、血栓性疾病、凝血功能障碍等疾病。
▮▮▮▮ⓑ 细胞因子与生长因子 (Cytokines and Growth Factors):
如重组人干扰素 (recombinant human interferon)、重组人白细胞介素 (recombinant human interleukin)、重组人促红细胞生成素 (recombinant human erythropoietin, EPO)、重组人粒细胞集落刺激因子 (recombinant human granulocyte colony-stimulating factor, G-CSF) 等,用于治疗病毒感染、肿瘤、贫血、免疫缺陷等疾病。
▮▮▮▮ⓒ 疫苗抗原 (Vaccine Antigens):
如重组乙肝表面抗原 (recombinant Hepatitis B surface antigen, HBsAg)、重组 HPV 病毒样颗粒 (recombinant HPV virus-like particles, VLPs) 等,用于制备亚单位疫苗。
▮▮▮▮ⓓ 单克隆抗体药物 (Monoclonal Antibody Drugs):
如人源化抗体药物、全人源抗体药物,用于治疗肿瘤、自身免疫性疾病、移植排斥反应等疾病。
▮▮▮▮ⓔ 融合蛋白药物 (Fusion Protein Drugs):
将两个或多个具有不同功能的蛋白质或蛋白片段融合表达,构建具有新功能的融合蛋白药物,如肿瘤坏死因子受体-抗体 Fc 段融合蛋白 (TNF-α receptor-Fc fusion protein)、CTLA-4-Ig 融合蛋白等,用于治疗自身免疫性疾病、肿瘤等疾病。
重组 DNA 技术在疫苗和药物开发中的应用,极大地推动了生物医药产业的发展,为人类健康做出了重要贡献。随着技术的不断进步,重组 DNA 技术将在未来疫苗和药物开发领域发挥更加重要的作用,为疾病预防和治疗提供更多、更有效的手段。
10. 生物信息学导论 (Introduction to Bioinformatics)
本章作为生物信息学的入门,概述了生物信息学的定义、发展历程、研究内容和应用领域,为后续深入学习生物信息学奠定基础。
10.1 生物信息学的定义与范畴 (Definition and Scope of Bioinformatics)
明确生物信息学的定义,阐述其研究对象、研究内容和与其他学科的关系,例如分子生物学、计算机科学、统计学。
10.1.1 生物信息学的核心概念 (Core Concepts of Bioinformatics)
生物信息学 (Bioinformatics),又称计算生物学 (Computational Biology),是一门交叉学科,它综合运用数学、统计学和计算机科学的工具,来理解和组织生物数据。随着高通量生物技术的迅猛发展,例如基因组测序 (Genome Sequencing)、蛋白质组学 (Proteomics) 和转录组学 (Transcriptomics) 等,生物数据呈现爆炸式增长,生物信息学应运而生并迅速成为生命科学研究中不可或缺的关键领域。
生物信息学的核心目标在于从海量的生物数据中提取有价值的信息,并将其转化为生物学知识,从而揭示生命的本质和规律。其核心概念主要包括:
① 生物数据 (Biological Data):生物信息学处理的数据类型极其广泛,涵盖了从分子到生态系统的各个层面。主要包括:
▮▮▮▮ⓑ 核酸序列数据 (Nucleic Acid Sequence Data):DNA 和 RNA 序列是生命信息的数字化载体。例如,基因组序列、转录组序列、宏基因组序列等。这些数据存储在如 GenBank、EMBL 和 DDBJ 等核酸序列数据库中。
▮▮▮▮ⓒ 蛋白质序列数据 (Protein Sequence Data):蛋白质是生命活动的主要执行者。蛋白质序列数据描述了蛋白质的氨基酸排列顺序,存储在如 UniProt、Swiss-Prot 等蛋白质序列数据库中。
▮▮▮▮ⓓ 生物结构数据 (Biological Structure Data):生物大分子(如蛋白质、核酸)的三维结构信息对于理解其功能至关重要。蛋白质结构数据库 PDB (Protein Data Bank) 存储了大量的蛋白质和核酸的实验解析结构。
▮▮▮▮ⓔ 基因组数据 (Genomic Data):基因组数据包含了生物体完整的遗传信息,包括基因的定位、结构、功能以及基因组的变异信息。Ensembl、UCSC Genome Browser 等基因组浏览器提供了丰富的基因组数据资源。
▮▮▮▮ⓕ 基因表达数据 (Gene Expression Data):基因表达数据反映了基因的活跃程度,例如 RNA-Seq 数据、微阵列数据等。GEO (Gene Expression Omnibus) 和 ArrayExpress 等数据库存储了大量的基因表达数据。
▮▮▮▮ⓖ 代谢组数据 (Metabolomic Data):代谢组数据描述了细胞或生物体内的所有代谢小分子,反映了生物体的生理状态。MetaboLights、HMDB (Human Metabolome Database) 等数据库存储了代谢组数据。
▮▮▮▮ⓗ 蛋白质相互作用数据 (Protein-Protein Interaction Data):蛋白质之间的相互作用是细胞功能的基础。STRING、IntAct 等数据库存储了蛋白质相互作用信息。
▮▮▮▮ⓘ 生物通路数据 (Biological Pathway Data):生物通路数据描述了细胞内的生物化学反应和信号传导途径。KEGG (Kyoto Encyclopedia of Genes and Genomes)、Reactome 等数据库提供了生物通路信息。
② 生物数据库 (Biological Databases):生物数据库是生物信息学研究的基础设施,用于存储、管理和检索各种生物数据。生物数据库的类型繁多,根据数据类型可分为序列数据库、结构数据库、基因组数据库、表达数据库、通路数据库等;根据数据来源可分为一级数据库(原始数据)和二级数据库(注释数据)。常用的生物数据库包括 NCBI (National Center for Biotechnology Information)、EBI (European Bioinformatics Institute)、UCSC (University of California, Santa Cruz) 等。
③ 序列比对 (Sequence Alignment):序列比对是生物信息学中最基本、最常用的分析方法之一,用于比较两条或多条生物序列(DNA、RNA 或蛋白质)之间的相似性。序列比对可以用于:
▮▮▮▮ⓑ 同源性搜索 (Homology Search):在数据库中搜索与目标序列相似的序列,从而推断目标序列的功能和进化关系。BLAST (Basic Local Alignment Search Tool) 和 FASTA 是常用的同源性搜索工具。
▮▮▮▮ⓒ 进化树构建 (Phylogenetic Tree Construction):利用序列比对结果构建进化树,研究物种或基因的进化关系。常用的进化树构建方法包括邻接法 (Neighbor-Joining)、最大简约法 (Maximum Parsimony) 和最大似然法 (Maximum Likelihood)。
▮▮▮▮ⓓ motif 识别 (Motif Discovery):在序列中寻找保守的模式 (motif),例如 DNA 结合位点、蛋白质结构域等。MEME (Multiple Em for Motif Elicitation) 和 HOMER (Hypergeometric Optimization of Motif EnRichment) 是常用的 motif 识别工具。
④ 基因组注释 (Genome Annotation):基因组注释是指对基因组序列进行解读,识别基因、调控元件、重复序列等基因组组成成分,并赋予其生物学功能。基因组注释包括:
▮▮▮▮ⓑ 结构注释 (Structural Annotation):预测基因组中的基因位置、外显子 (exon)、内含子 (intron)、启动子 (promoter)、终止子 (terminator) 等结构信息。
▮▮▮▮ⓒ 功能注释 (Functional Annotation):推断基因的功能,例如基因本体论 (Gene Ontology, GO) 注释、通路注释、蛋白质结构域注释等。InterProScan、Blast2GO 等工具可以用于基因功能注释。
⑤ 蛋白质结构预测 (Protein Structure Prediction):蛋白质的三维结构决定其功能。蛋白质结构预测旨在从蛋白质序列出发,预测其三维结构。蛋白质结构预测方法主要分为:
▮▮▮▮ⓑ 同源建模 (Homology Modeling):基于已知结构的同源蛋白质模板,预测目标蛋白质的结构。SWISS-MODEL、MODELLER 等软件可以用于同源建模。
▮▮▮▮ⓒ 从头预测 (Ab initio Prediction):不依赖于模板,仅根据物理化学原理和统计学方法预测蛋白质结构。ROSETTA、AlphaFold 等软件可以进行从头预测。
▮▮▮▮ⓓ 穿线法 (Threading):将蛋白质序列与已知结构的蛋白质结构库进行比对,寻找最佳匹配的结构模板。
⑥ 系统生物学建模 (Systems Biology Modeling):系统生物学旨在从系统层面研究生物体的复杂性。系统生物学建模利用数学模型和计算方法,模拟生物系统的行为,例如代谢网络模型、信号通路模型、基因调控网络模型等。COBRA Toolbox、CellDesigner 等工具可以用于系统生物学建模。
生物信息学的核心概念是相互关联、相互支撑的,共同构成了生物信息学分析和研究的基础框架。理解这些核心概念,有助于我们更好地利用生物信息学工具和方法,解决生命科学中的复杂问题。
10.1.2 生物信息学的发展简史 (Brief History of Bioinformatics)
生物信息学的发展与生物学和计算机科学的进步紧密相连,大致可以划分为以下几个阶段:
① 萌芽期 (1960s-1970s):
▮▮▮▮ⓑ 理论和算法的奠基:最早的生物信息学研究可以追溯到 20 世纪 60 年代,当时分子生物学开始兴起,对生物序列的分析需求逐渐显现。Margaret Dayhoff 在 1965 年出版了《蛋白质序列图谱》(Atlas of Protein Sequence and Structure),这是生物信息学领域的开创性工作,书中收集了大量的蛋白质序列数据,并提出了序列比对和进化分析的早期方法。Needleman-Wunsch 算法 (1970) 和 Smith-Waterman 算法 (1981) 等经典序列比对算法的提出,为序列分析奠定了理论基础。
▮▮▮▮ⓒ 数据库的雏形:随着生物数据的积累,早期的生物数据库开始出现。Dayhoff 的蛋白质序列数据库是现代蛋白质序列数据库的雏形。
② 发展期 (1980s-1990s):
▮▮▮▮ⓑ DNA 测序技术的突破:Sanger 测序法 (1977) 和自动化 DNA 测序仪的出现,使得 DNA 测序速度大大提高,产生了大量的 DNA 序列数据。GenBank (1982) 等核酸序列数据库的建立,为生物信息学的发展提供了数据基础。
▮▮▮▮ⓒ 序列分析工具的涌现:BLAST (1990) 和 FASTA (1985) 等快速序列比对工具的开发,使得大规模序列数据库搜索成为可能。PHYLIP (1980s) 等进化分析软件包的出现,推动了分子进化研究的发展。
▮▮▮▮ⓓ 蛋白质结构预测的进步:蛋白质结构预测方法,如同源建模和穿线法,在这一时期得到了发展。PDB (1971) 蛋白质结构数据库的不断扩充,为结构生物信息学研究提供了资源。
③ 成熟期 (2000s-至今):
▮▮▮▮ⓑ 基因组时代的到来:人类基因组计划 (Human Genome Project, HGP) (1990-2003) 的完成,标志着基因组时代的到来。基因组学、蛋白质组学、转录组学等高通量组学技术迅速发展,产生了海量的生物数据。
▮▮▮▮ⓒ 新一代测序技术 (NGS) 的革命:新一代测序技术 (NGS) 的出现,使得测序成本大大降低,测序速度大幅提高,推动了基因组学研究的普及化和深入化。RNA-Seq、ChIP-Seq、全外显子组测序 (Whole Exome Sequencing, WES)、全基因组测序 (Whole Genome Sequencing, WGS) 等 NGS 技术广泛应用于生命科学研究的各个领域。
▮▮▮▮ⓓ 生物信息学工具和平台的完善:生物信息学工具和平台不断完善和发展,例如 Bioconductor、Biopython 等生物信息学软件包的出现,使得生物信息学分析更加便捷和高效。在线生物信息学资源,如 NCBI、Ensembl、UCSC Genome Browser 等,为研究者提供了丰富的数据和分析工具。
▮▮▮▮ⓔ 人工智能 (AI) 在生物信息学中的应用:近年来,人工智能技术,特别是深度学习 (Deep Learning),在生物信息学领域取得了显著进展。AlphaFold (2020) 在蛋白质结构预测方面取得了革命性突破。AI 技术还被应用于基因组注释、药物发现、疾病诊断等领域。
▮▮▮▮ⓕ 单细胞生物信息学 (Single-Cell Bioinformatics) 的兴起:单细胞测序技术的发展,推动了单细胞生物信息学的兴起。单细胞 RNA-Seq (scRNA-Seq)、单细胞 ATAC-Seq (scATAC-Seq) 等技术,使得在单细胞分辨率上研究基因表达、染色质开放性等成为可能。
生物信息学的发展历程是一部不断创新、不断进步的历史。从早期的序列比对算法和数据库,到基因组学、蛋白质组学、系统生物学,再到人工智能和单细胞生物信息学,生物信息学始终紧跟生物技术的发展步伐,不断拓展研究领域,深化研究内容,为生命科学研究提供了强大的支撑。
10.1.3 生物信息学在生命科学中的地位 (Role of Bioinformatics in Life Sciences)
生物信息学在现代生命科学中占据着核心地位,其作用和影响日益凸显。主要体现在以下几个方面:
① 数据驱动的科学发现 (Data-Driven Scientific Discovery):
▮▮▮▮ⓑ 海量数据分析:生物信息学能够处理和分析海量的生物数据,例如基因组数据、蛋白质组数据、转录组数据等。通过生物信息学分析,研究者可以从这些数据中发现新的生物学规律和知识。
▮▮▮▮ⓒ 假设生成与验证:生物信息学分析可以帮助研究者从数据中生成新的科学假设,并通过进一步的实验验证这些假设,加速科学发现的进程。
▮▮▮▮ⓓ 系统性研究方法:生物信息学强调系统性的研究方法,从整体层面研究生物系统的复杂性,例如系统生物学、网络生物学等。
② 加速生物学研究进程 (Accelerating Biological Research):
▮▮▮▮ⓑ 高效的数据处理:生物信息学工具和平台能够高效地处理和分析生物数据,例如基因组注释、序列比对、蛋白质结构预测等,大大缩短了研究周期。
▮▮▮▮ⓒ 降低实验成本:生物信息学分析可以在一定程度上替代或减少湿实验,例如 in silico 药物筛选、基因功能预测等,降低了实验成本。
▮▮▮▮ⓓ 促进跨学科合作:生物信息学作为一门交叉学科,促进了生物学、计算机科学、数学、统计学等学科的交叉融合和合作,共同解决生命科学中的复杂问题。
③ 推动精准医学发展 (Promoting Precision Medicine):
▮▮▮▮ⓑ 疾病分子机制研究:生物信息学在疾病分子机制研究中发挥着重要作用,例如癌症基因组学、遗传病基因诊断等。通过生物信息学分析,可以揭示疾病的分子基础,为疾病的诊断和治疗提供理论依据。
▮▮▮▮ⓒ 分子诊断与生物标志物发现:生物信息学可以用于开发新的分子诊断方法和生物标志物,例如液体活检、基因芯片诊断等,提高疾病诊断的准确性和早期性。
▮▮▮▮ⓓ 药物研发与靶向治疗:生物信息学在药物研发和靶向治疗中发挥着关键作用,例如药物靶点发现、药物虚拟筛选、药物基因组学等,加速了新药研发和个性化治疗的进程。
④ 支撑生物技术产业 (Supporting Biotechnology Industry):
▮▮▮▮ⓑ 基因工程与重组 DNA 技术:生物信息学在基因工程和重组 DNA 技术中发挥着重要作用,例如基因克隆、基因表达、转基因生物开发等。
▮▮▮▮ⓒ 蛋白质工程与酶工程:生物信息学可以用于蛋白质结构预测、蛋白质定向进化、酶改造等,推动蛋白质工程和酶工程的发展。
▮▮▮▮ⓓ 合成生物学与代谢工程:生物信息学在合成生物学和代谢工程中发挥着关键作用,例如代谢途径设计、微生物细胞工厂构建、生物元件设计等,推动生物技术产业的创新发展。
⑤ 促进生物多样性研究与保护 (Promoting Biodiversity Research and Conservation):
▮▮▮▮ⓑ 基因组学与宏基因组学:生物信息学在生物多样性研究中发挥着重要作用,例如基因组测序、宏基因组分析、系统发育分析等,揭示了生物多样性的遗传基础和进化规律。
▮▮▮▮ⓒ 物种鉴定与保护:生物信息学可以用于物种鉴定、种群遗传学分析、濒危物种保护等,为生物多样性保护提供科学依据。
总而言之,生物信息学已经成为现代生命科学研究不可或缺的重要组成部分,其在数据分析、科学发现、技术创新和产业发展等方面都发挥着至关重要的作用。随着生物技术的不断进步和生物数据的持续增长,生物信息学在生命科学中的地位将更加重要,其发展前景将更加广阔。
10.2 生物信息学的主要研究内容 (Main Research Areas of Bioinformatics)
生物信息学的研究内容十分广泛,涵盖了从分子到生态系统的各个层面。根据研究对象和方法,可以将其主要研究内容归纳为以下几个方面:
10.2.1 生物数据库 (Biological Databases)
生物数据库是生物信息学研究的基础设施,是存储、管理和检索生物数据的电子资源。生物数据库的建设和维护是生物信息学的重要组成部分。
① 生物数据库的类型:生物数据库类型多样,可以根据不同的标准进行分类:
▮▮▮▮ⓑ 按数据类型分类:
▮▮▮▮▮▮▮▮❸ 核酸序列数据库 (Nucleic Acid Sequence Databases):存储 DNA 和 RNA 序列数据,如 GenBank (NCBI)、EMBL-Bank (EBI)、DDBJ (DNA Data Bank of Japan)。这些数据库收录了来自世界各地的研究者提交的核酸序列数据,是进行序列分析和同源性搜索的重要资源。
▮▮▮▮▮▮▮▮❹ 蛋白质序列数据库 (Protein Sequence Databases):存储蛋白质序列数据,如 UniProt (Universal Protein Resource)、Swiss-Prot (高质量人工注释蛋白质序列数据库)、PIR (Protein Information Resource)。UniProt 是最全面的蛋白质序列数据库,整合了多种蛋白质序列资源。
▮▮▮▮▮▮▮▮❺ 生物结构数据库 (Biological Structure Databases):存储生物大分子(蛋白质、核酸等)的三维结构数据,如 PDB (Protein Data Bank)。PDB 是最重要的生物结构数据库,收录了通过 X 射线晶体学、核磁共振 (NMR) 等实验方法解析的生物大分子结构。
▮▮▮▮▮▮▮▮❻ 基因组数据库 (Genome Databases):存储基因组序列、基因注释信息、基因组变异信息等,如 Ensembl、UCSC Genome Browser、NCBI Genome。这些数据库提供了基因组的综合信息,是进行基因组学研究的重要平台。
▮▮▮▮▮▮▮▮❼ 基因表达数据库 (Gene Expression Databases):存储基因表达数据,如 GEO (Gene Expression Omnibus)、ArrayExpress。这些数据库收录了来自微阵列、RNA-Seq 等高通量技术的基因表达数据,用于研究基因表达调控和差异表达分析。
▮▮▮▮▮▮▮▮❽ 代谢途径数据库 (Metabolic Pathway Databases):存储代谢途径信息,如 KEGG (Kyoto Encyclopedia of Genes and Genomes)、Reactome、MetaCyc。这些数据库提供了代谢途径的图形化展示和详细信息,用于研究代谢网络和代谢调控。
▮▮▮▮▮▮▮▮❾ 蛋白质相互作用数据库 (Protein-Protein Interaction Databases):存储蛋白质相互作用信息,如 STRING、IntAct、BioGRID (Biological General Repository for Interaction Datasets)。这些数据库提供了蛋白质相互作用的实验证据和预测信息,用于研究蛋白质相互作用网络。
▮▮▮▮ⓙ 按数据来源分类:
▮▮▮▮▮▮▮▮❶ 一级数据库 (Primary Databases):直接存储实验产生的原始数据,如核酸序列数据库、蛋白质序列数据库、生物结构数据库等。
▮▮▮▮▮▮▮▮❷ 二级数据库 (Secondary Databases):在原始数据的基础上进行加工、整理和注释,提供更高级的信息,如 UniProt、InterPro (蛋白质结构域数据库)、GO (基因本体论数据库) 等。
▮▮▮▮ⓜ 按物种分类:
▮▮▮▮▮▮▮▮❶ 物种特异性数据库 (Species-Specific Databases):专注于特定物种的数据库,如 FlyBase (果蝇数据库)、WormBase (线虫数据库)、SGD (酵母基因组数据库) 等。这些数据库提供了特定模式生物的详细信息,是研究这些生物的重要资源。
▮▮▮▮▮▮▮▮❷ 综合性数据库 (Comprehensive Databases):收录多种物种数据的数据库,如 NCBI、EBI、UniProt 等。
② 生物数据库的检索与应用:生物数据库是生物信息学研究的重要工具。研究者可以通过数据库检索,获取所需的生物数据,并利用这些数据进行各种生物信息学分析。常用的数据库检索方法包括:
▮▮▮▮ⓑ 关键词检索 (Keyword Search):根据关键词(如基因名、蛋白质名、疾病名等)在数据库中进行检索。
▮▮▮▮ⓒ 序列相似性检索 (Sequence Similarity Search):利用 BLAST、FASTA 等工具,将目标序列与数据库中的序列进行比对,查找相似序列。
▮▮▮▮ⓓ 结构相似性检索 (Structure Similarity Search):在生物结构数据库中,根据结构相似性进行检索。
▮▮▮▮ⓔ 高级检索 (Advanced Search):利用数据库提供的高级检索功能,根据多种条件组合进行检索,例如物种、组织、实验方法等。
生物数据库的应用非常广泛,例如:
▮▮▮▮ⓐ 基因功能预测:通过在数据库中搜索与未知基因序列相似的已知基因,可以推断未知基因的功能。
▮▮▮▮ⓑ 蛋白质结构预测:利用同源建模方法,基于已知结构的同源蛋白质模板,预测未知蛋白质的结构。
▮▮▮▮ⓒ 药物靶点发现:在数据库中查找与疾病相关的基因或蛋白质,作为药物靶点。
▮▮▮▮ⓓ 生物标志物发现:分析基因表达数据库、代谢组数据库等,寻找疾病的生物标志物。
▮▮▮▮ⓔ 进化关系研究:利用序列数据库和进化分析工具,研究物种或基因的进化关系。
生物数据库是生物信息学研究的基础和支撑,其不断发展和完善,为生命科学研究提供了强大的数据资源和分析平台。
10.2.2 序列分析 (Sequence Analysis)
序列分析是生物信息学中最核心、最基础的研究内容之一。通过对生物序列(DNA、RNA、蛋白质)进行分析,可以揭示序列中蕴含的生物学信息。
① 序列比对 (Sequence Alignment):序列比对是比较两条或多条序列相似性的方法,是序列分析的基础。序列比对可以分为:
▮▮▮▮ⓑ 两两序列比对 (Pairwise Sequence Alignment):比较两条序列的相似性,分为全局比对 (Global Alignment) 和局部比对 (Local Alignment)。
▮▮▮▮▮▮▮▮❸ 全局比对 (Global Alignment):旨在找到两条序列整体的最佳比对,Needleman-Wunsch 算法是经典的全局比对算法。
▮▮▮▮▮▮▮▮❹ 局部比对 (Local Alignment):旨在找到两条序列中相似性最高的局部区域,Smith-Waterman 算法是经典的局部比对算法。BLAST 和 FASTA 等工具采用启发式局部比对算法,用于快速数据库搜索。
▮▮▮▮ⓔ 多序列比对 (Multiple Sequence Alignment, MSA):同时比对三条或更多条序列,揭示序列之间的保守区域和变异区域。ClustalW、MUSCLE、MAFFT 等是常用的多序列比对工具。多序列比对是进化分析、motif 识别等后续分析的基础。
② 序列数据库搜索 (Sequence Database Searching):利用序列比对算法,在序列数据库中搜索与目标序列相似的序列。BLAST 和 FASTA 是最常用的序列数据库搜索工具。序列数据库搜索可以用于:
▮▮▮▮ⓑ 同源性搜索 (Homology Search):查找与目标序列同源的序列,推断目标序列的功能和进化关系。
▮▮▮▮ⓒ 基因家族鉴定 (Gene Family Identification):在基因组中搜索与已知基因家族成员相似的序列,鉴定新的基因家族成员。
▮▮▮▮ⓓ 物种鉴定 (Species Identification):利用 16S rRNA 基因序列、COI 基因序列等,在数据库中搜索相似序列,进行物种鉴定。
③ motif 识别 (Motif Discovery):motif 是序列中保守的模式,通常与特定的生物学功能相关,例如 DNA 结合位点、蛋白质结构域等。motif 识别旨在从一组序列中发现共同的 motif。常用的 motif 识别方法包括:
▮▮▮▮ⓑ 从头 motif 识别 (De novo Motif Discovery):不依赖于先验知识,直接从序列数据中发现新的 motif。MEME、HOMER 等工具可以进行从头 motif 识别。
▮▮▮▮ⓒ 数据库驱动的 motif 识别 (Database-Driven Motif Discovery):利用已知 motif 数据库,在序列中搜索已知的 motif。JASPAR、TRANSFAC 等数据库存储了大量的转录因子结合位点 motif。
④ 基因预测 (Gene Prediction):基因预测旨在从基因组序列中识别基因的位置和结构。基因预测方法主要分为:
▮▮▮▮ⓑ 从头基因预测 (Ab initio Gene Prediction):基于基因的统计学特征(如密码子偏好性、外显子-内含子边界信号等)进行基因预测。GENSCAN、AUGUSTUS 等工具可以进行从头基因预测。
▮▮▮▮ⓒ 同源基因预测 (Homology-Based Gene Prediction):基于已知基因的序列信息,在基因组中搜索同源基因。GeneWise、Exonerate 等工具可以进行同源基因预测。
▮▮▮▮ⓓ 整合基因预测 (Integrated Gene Prediction):结合从头预测和同源预测方法,以及 RNA-Seq、EST 等实验数据,进行更准确的基因预测。MAKER、EvidenceModeler 等工具可以进行整合基因预测。
⑤ RNA 结构预测 (RNA Structure Prediction):RNA 分子不仅具有序列信息,还具有复杂的二级和三级结构,RNA 结构与其功能密切相关。RNA 结构预测旨在从 RNA 序列出发,预测其二级结构和三级结构。常用的 RNA 结构预测方法包括:
▮▮▮▮ⓑ 二级结构预测 (Secondary Structure Prediction):基于热力学模型和动态规划算法,预测 RNA 分子的二级结构。RNAfold、ViennaRNA package 等工具可以进行 RNA 二级结构预测。
▮▮▮▮ⓒ 三级结构预测 (Tertiary Structure Prediction):RNA 三级结构预测比蛋白质结构预测更具挑战性。RNAPuzzle、RNAComposer 等工具可以进行 RNA 三级结构预测。
序列分析是生物信息学研究的基础工具,其应用贯穿于生物信息学的各个研究领域。随着算法和技术的不断进步,序列分析方法将更加高效、准确,为生命科学研究提供更强大的支撑。
10.2.3 基因组学与基因组信息学 (Genomics and Genome Informatics)
基因组学 (Genomics) 是研究生物体基因组结构、功能、进化和调控的学科。基因组信息学 (Genome Informatics) 是生物信息学在基因组学领域的应用,利用生物信息学方法分析和解读基因组数据。
① 基因组组装 (Genome Assembly):基因组组装是将 DNA 测序产生的短片段 (reads) 拼接成完整基因组序列的过程。基因组组装是基因组学研究的第一步,也是最关键的步骤之一。基因组组装方法主要分为:
▮▮▮▮ⓑ 从头组装 (De novo Assembly):不依赖于参考基因组,直接从测序 reads 拼接基因组。SPAdes、Velvet、SOAPdenovo 等是常用的从头组装软件。
▮▮▮▮ⓒ 参考基因组引导的组装 (Reference-Based Assembly):利用已有的参考基因组,将测序 reads 比对到参考基因组上,构建新的基因组序列。BWA、Bowtie2 等比对软件常用于参考基因组引导的组装。
② 基因组注释 (Genome Annotation):基因组注释是对基因组序列进行解读,识别基因、调控元件、重复序列等基因组组成成分,并赋予其生物学功能。基因组注释包括结构注释和功能注释,前面已经介绍过,此处不再赘述。
③ 比较基因组学 (Comparative Genomics):比较基因组学是利用基因组数据比较不同物种或不同个体基因组之间的异同,研究基因组的进化、功能和多样性。比较基因组学研究内容包括:
▮▮▮▮ⓑ 基因组比对 (Genome Alignment):将不同基因组进行比对,查找基因组之间的同源区域和差异区域。MUMmer、Mauve 等工具可以进行基因组比对。
▮▮▮▮ⓒ 基因组进化分析 (Genome Evolution Analysis):研究基因组的进化历史和进化机制,例如基因组重排、基因组重复、基因组水平转移等。
▮▮▮▮ⓓ 基因组共线性分析 (Genome Synteny Analysis):研究不同基因组之间基因顺序的保守性,揭示基因组进化的保守性和变异性。
④ 功能基因组学 (Functional Genomics):功能基因组学是研究基因组中基因的功能和调控的学科。功能基因组学研究方法主要包括:
▮▮▮▮ⓑ 转录组学 (Transcriptomics):研究细胞或组织中所有 RNA 分子的种类和丰度,揭示基因表达模式和调控机制。RNA-Seq 是转录组学研究的主要技术。
▮▮▮▮ⓒ 蛋白质组学 (Proteomics):研究细胞或组织中所有蛋白质的种类、丰度和修饰状态,揭示蛋白质的功能和调控网络。质谱分析是蛋白质组学研究的主要技术。
▮▮▮▮ⓓ 表观基因组学 (Epigenomics):研究表观遗传修饰(如 DNA 甲基化、组蛋白修饰)在基因表达调控中的作用。ChIP-Seq、甲基化测序 (Methyl-Seq) 等技术是表观基因组学研究的主要技术。
▮▮▮▮ⓔ 基因组编辑 (Genome Editing):利用 CRISPR-Cas9、TALEN 等基因组编辑技术,对基因组进行精确修改,研究基因功能和基因调控。
⑤ 基因组变异分析 (Genome Variation Analysis):基因组变异是生物多样性的遗传基础,也是疾病发生的重要原因。基因组变异分析旨在识别和分析基因组中的各种变异类型,例如单核苷酸多态性 (Single Nucleotide Polymorphism, SNP)、插入缺失 (Insertion/Deletion, InDel)、结构变异 (Structural Variation, SV) 等。基因组变异分析方法主要包括:
▮▮▮▮ⓑ SNP Calling:识别基因组中的 SNP 位点。GATK、Samtools 等工具可以进行 SNP Calling。
▮▮▮▮ⓒ InDel Calling:识别基因组中的 InDel 变异。GATK、Samtools 等工具也可以进行 InDel Calling。
▮▮▮▮ⓓ SV Calling:识别基因组中的 SV 变异,例如拷贝数变异 (Copy Number Variation, CNV)、基因组重排等。
基因组学与基因组信息学是生物信息学研究的重要领域,其研究成果对于理解生命本质、疾病机制、生物进化和生物技术发展都具有重要意义。随着测序技术的不断进步和生物数据的持续增长,基因组学与基因组信息学将迎来更加广阔的发展前景。
10.2.4 蛋白质组学与蛋白质信息学 (Proteomics and Proteome Informatics)
蛋白质组学 (Proteomics) 是研究细胞、组织或生物体中所有蛋白质的学科,旨在全面分析蛋白质的种类、丰度、修饰、相互作用和功能。蛋白质信息学 (Proteome Informatics) 是生物信息学在蛋白质组学领域的应用,利用生物信息学方法分析和解读蛋白质组数据。
① 蛋白质鉴定 (Protein Identification):蛋白质鉴定是蛋白质组学研究的基础,旨在确定样品中包含哪些蛋白质。质谱分析 (Mass Spectrometry, MS) 是蛋白质鉴定的主要技术。蛋白质鉴定流程通常包括:
▮▮▮▮ⓑ 蛋白质样品制备:包括蛋白质提取、酶解 (通常使用胰蛋白酶 trypsin 将蛋白质酶解成肽段)。
▮▮▮▮ⓒ 质谱分析:利用质谱仪分析肽段的质荷比 (m/z) 和强度。
▮▮▮▮ⓓ 数据库搜索:将质谱数据与蛋白质序列数据库进行比对,鉴定肽段和蛋白质。Mascot、Sequest、MaxQuant 等软件可以进行质谱数据数据库搜索。
② 蛋白质定量 (Protein Quantification):蛋白质定量是蛋白质组学研究的重要内容,旨在测定不同样品中蛋白质的相对或绝对丰度差异。蛋白质定量方法主要分为:
▮▮▮▮ⓑ Label-Free 定量:不使用同位素标记,直接比较不同样品中肽段的质谱信号强度。Label-free 定量方法相对简单,但定量精度较低。
▮▮▮▮ⓒ Label-Based 定量:使用同位素标记技术,对不同样品中的蛋白质进行标记,然后混合样品进行质谱分析。Label-based 定量方法定量精度较高,常用的标记技术包括 iTRAQ (isobaric Tags for Relative and Absolute Quantification)、TMT (Tandem Mass Tags)、SILAC (Stable Isotope Labeling by Amino acids in Cell culture) 等。
③ 蛋白质修饰分析 (Protein Modification Analysis):蛋白质翻译后修饰 (Post-Translational Modification, PTM) 是蛋白质功能调控的重要机制。蛋白质修饰分析旨在鉴定和定量蛋白质的各种修饰类型,例如磷酸化 (Phosphorylation)、糖基化 (Glycosylation)、泛素化 (Ubiquitination)、乙酰化 (Acetylation)、甲基化 (Methylation) 等。蛋白质修饰分析方法通常需要结合富集技术和质谱分析。
④ 蛋白质相互作用网络分析 (Protein-Protein Interaction Network Analysis):蛋白质相互作用是细胞功能的基础。蛋白质相互作用网络分析旨在研究蛋白质之间的相互作用关系,构建蛋白质相互作用网络,揭示蛋白质的功能和调控机制。蛋白质相互作用研究方法主要包括:
▮▮▮▮ⓑ 酵母双杂交 (Yeast Two-Hybrid, Y2H):一种经典的蛋白质相互作用检测方法,基于转录因子的重构原理,在酵母细胞中检测蛋白质之间的直接相互作用。
▮▮▮▮ⓒ 免疫共沉淀 (Co-Immunoprecipitation, Co-IP) 结合质谱分析 (Co-IP-MS):利用抗体富集目标蛋白质及其相互作用蛋白,然后通过质谱分析鉴定相互作用蛋白。
▮▮▮▮ⓓ 亲和纯化结合质谱分析 (Affinity Purification-Mass Spectrometry, AP-MS):利用亲和标签纯化目标蛋白质及其相互作用蛋白,然后通过质谱分析鉴定相互作用蛋白。
▮▮▮▮ⓔ 蛋白质芯片 (Protein Microarray):将大量蛋白质固定在芯片上,用于高通量筛选蛋白质相互作用。
▮▮▮▮ⓕ 生物信息学预测:利用蛋白质序列信息、结构信息、基因组信息等,预测蛋白质相互作用。STRING、IntAct 等数据库提供了蛋白质相互作用的预测和实验证据。
⑤ 蛋白质结构预测与功能预测 (Protein Structure Prediction and Function Prediction):蛋白质的三维结构决定其功能。蛋白质结构预测和功能预测旨在从蛋白质序列出发,预测其三维结构和生物学功能。蛋白质结构预测方法和功能预测方法前面已经介绍过,此处不再赘述。
蛋白质组学与蛋白质信息学是生物信息学研究的重要领域,其研究成果对于理解蛋白质功能、细胞调控、疾病机制和药物研发都具有重要意义。随着质谱技术的不断进步和生物信息学方法的不断发展,蛋白质组学与蛋白质信息学将迎来更加广阔的发展前景。
10.2.5 系统生物学与系统生物信息学 (Systems Biology and Systems Bioinformatics)
系统生物学 (Systems Biology) 是一门新兴的交叉学科,旨在从系统层面研究生物体的复杂性,强调从整体、动态和多层次的角度理解生物系统。系统生物信息学 (Systems Bioinformatics) 是生物信息学在系统生物学领域的应用,利用生物信息学方法构建和分析生物系统模型。
① 系统生物学建模与仿真 (Systems Biology Modeling and Simulation):系统生物学建模是系统生物学的核心方法,利用数学模型和计算方法,模拟生物系统的行为。系统生物学模型主要包括:
▮▮▮▮ⓑ 代谢网络模型 (Metabolic Network Models):描述细胞内的代谢反应网络,用于研究代谢途径、代谢调控和代谢工程。基于约束的建模方法 (Constraint-Based Modeling, CBM),如通量平衡分析 (Flux Balance Analysis, FBA),是代谢网络建模的常用方法。COBRA Toolbox、Metabolic Network Expansion (MNE) 等工具可以用于代谢网络建模和分析。
▮▮▮▮ⓒ 信号通路模型 (Signaling Pathway Models):描述细胞内的信号传导途径,用于研究信号转导、细胞通讯和疾病发生机制。基于常微分方程 (Ordinary Differential Equations, ODEs) 的动力学模型是信号通路建模的常用方法。CellDesigner、SBML-NET 等工具可以用于信号通路建模和分析。
▮▮▮▮ⓓ 基因调控网络模型 (Gene Regulatory Network Models):描述基因之间的调控关系,用于研究基因表达调控、发育和进化。基于布尔网络 (Boolean Network)、贝叶斯网络 (Bayesian Network)、微分方程 (Differential Equation) 等的模型可以用于基因调控网络建模。
② 代谢网络分析 (Metabolic Network Analysis):代谢网络分析旨在研究细胞代谢系统的结构和功能,揭示代谢途径、代谢调控和代谢通量分布。代谢网络分析方法主要包括:
▮▮▮▮ⓑ 通量平衡分析 (Flux Balance Analysis, FBA):基于约束条件(如化学计量方程、热力学约束、酶容量约束等),计算代谢网络中各反应的稳态通量分布。FBA 可以用于预测细胞的代谢能力、代谢产物产量和基因敲除效应。
▮▮▮▮ⓒ 代谢通量控制分析 (Metabolic Control Analysis, MCA):研究酶活性变化对代谢通量的影响,揭示代谢途径的限速步骤和关键酶。
▮▮▮▮ⓓ 代谢组学数据整合分析 (Metabolomics Data Integration Analysis):将代谢组学数据与代谢网络模型相结合,研究代谢网络的状态和调控。
③ 信号通路分析 (Signaling Pathway Analysis):信号通路分析旨在研究细胞信号传导途径的结构和功能,揭示信号转导机制、细胞通讯和疾病发生机制。信号通路分析方法主要包括:
▮▮▮▮ⓑ 通路富集分析 (Pathway Enrichment Analysis):分析一组基因或蛋白质是否在特定的信号通路中富集,揭示基因或蛋白质的功能和调控网络。GO 富集分析、KEGG 通路富集分析等是常用的通路富集分析方法。
▮▮▮▮ⓒ 信号通路动力学建模与仿真:利用动力学模型模拟信号通路的动态行为,研究信号转导过程和调控机制。
▮▮▮▮ⓓ 信号通路网络分析:构建信号通路网络,研究信号通路之间的相互作用和调控关系。
④ 基因调控网络分析 (Gene Regulatory Network Analysis):基因调控网络分析旨在研究基因之间的调控关系,构建基因调控网络,揭示基因表达调控机制、发育和进化。基因调控网络分析方法主要包括:
▮▮▮▮ⓑ 基因共表达网络分析 (Gene Co-expression Network Analysis):基于基因表达数据,构建基因共表达网络,揭示基因之间的协同调控关系。WGCNA (Weighted Gene Co-expression Network Analysis) 是常用的基因共表达网络分析方法。
▮▮▮▮ⓒ 转录因子调控网络分析 (Transcription Factor Regulatory Network Analysis):研究转录因子与靶基因之间的调控关系,构建转录因子调控网络。ChIP-Seq 数据、motif 识别结果等可以用于构建转录因子调控网络。
▮▮▮▮ⓓ 基因调控网络动力学建模与仿真:利用动力学模型模拟基因调控网络的动态行为,研究基因表达调控过程和机制。
系统生物学与系统生物信息学是生物信息学研究的前沿领域,其研究成果对于理解生物系统的复杂性、疾病发生机制、药物研发和生物技术发展都具有重要意义。随着多组学数据的不断积累和计算方法的不断进步,系统生物学与系统生物信息学将迎来更加广阔的发展前景。
10.2.6 药物信息学 (Chemoinformatics and Drug Informatics)
药物信息学 (Chemoinformatics and Drug Informatics),也称化学信息学和药物信息学,是生物信息学在药物研发领域的应用,利用计算机和信息科学技术,加速药物发现和开发过程。药物信息学研究内容主要包括:
① 药物数据库 (Drug Databases):药物数据库存储了药物的化学结构、药理性质、靶点信息、临床试验信息等。常用的药物数据库包括:
▮▮▮▮ⓑ DrugBank:一个综合性的药物数据库,收录了 FDA 批准的药物、实验性药物、生物技术药物等信息。
▮▮▮▮ⓒ PubChem:NCBI 维护的化学分子数据库,收录了大量的化学小分子信息,包括药物分子。
▮▮▮▮ⓓ ChEMBL:EBI 维护的药物化学数据库,收录了药物分子的生物活性数据、靶点信息等。
▮▮▮▮ⓔ KEGG DRUG:KEGG 数据库的药物模块,收录了药物的代谢途径、靶点信息等。
② 药物靶点预测 (Drug Target Prediction):药物靶点预测旨在预测药物分子的作用靶点,为药物设计和药物作用机制研究提供线索。药物靶点预测方法主要包括:
▮▮▮▮ⓑ 基于配体的药物靶点预测 (Ligand-Based Drug Target Prediction):基于已知活性药物分子的结构信息,预测新的药物靶点。配体相似性搜索、药效团模型 (Pharmacophore Model)、机器学习方法等可以用于基于配体的药物靶点预测。
▮▮▮▮ⓒ 基于结构的药物靶点预测 (Structure-Based Drug Target Prediction):基于药物靶点的三维结构信息,预测药物分子的结合位点和结合亲和力。分子对接 (Molecular Docking)、分子动力学模拟 (Molecular Dynamics Simulation) 等方法可以用于基于结构的药物靶点预测。
▮▮▮▮ⓓ 基于网络的药物靶点预测 (Network-Based Drug Target Prediction):利用生物网络(如蛋白质相互作用网络、基因调控网络),预测药物分子的作用靶点。网络传播算法、网络拓扑分析等方法可以用于基于网络的药物靶点预测。
③ 药物虚拟筛选 (Virtual Screening):药物虚拟筛选是利用计算机模拟方法,从化合物库中筛选具有潜在药物活性的化合物。药物虚拟筛选方法主要分为:
▮▮▮▮ⓑ 基于配体的虚拟筛选 (Ligand-Based Virtual Screening):基于已知活性药物分子的结构信息,筛选与活性药物分子相似的化合物。形状相似性搜索、药效团模型匹配等方法可以用于基于配体的虚拟筛选。
▮▮▮▮ⓒ 基于结构的虚拟筛选 (Structure-Based Virtual Screening):基于药物靶点的三维结构信息,筛选能够与靶点结合的化合物。分子对接是基于结构的虚拟筛选的主要方法。
④ 药物分子设计 (Drug Molecule Design):药物分子设计旨在设计具有特定药理性质和靶点结合特异性的新药分子。药物分子设计方法主要包括:
▮▮▮▮ⓑ 基于结构的药物设计 (Structure-Based Drug Design, SBDD):基于药物靶点的三维结构信息,设计能够与靶点结合的新药分子。分子对接、从头设计 (De novo Design) 等方法可以用于基于结构的药物设计。
▮▮▮▮ⓒ 基于配体的药物设计 (Ligand-Based Drug Design, LBDD):基于已知活性药物分子的结构信息,设计与活性药物分子相似的新药分子。QSAR (Quantitative Structure-Activity Relationship) 模型、药效团模型等方法可以用于基于配体的药物设计。
▮▮▮▮ⓓ 计算机辅助药物设计 (Computer-Aided Drug Design, CADD):综合利用各种计算方法和生物信息学资源,进行药物分子设计。
⑤ 药物代谢与毒性预测 (Drug Metabolism and Toxicity Prediction):药物代谢与毒性是药物研发的重要考虑因素。药物代谢与毒性预测旨在利用计算机模型,预测药物分子的代谢途径和毒性。ADMET (Absorption, Distribution, Metabolism, Excretion, Toxicity) 预测模型、QSAR 模型、机器学习方法等可以用于药物代谢与毒性预测。
药物信息学是生物信息学在药物研发领域的重要应用,其研究成果对于加速新药研发、降低研发成本、提高研发成功率都具有重要意义。随着计算方法和生物信息学资源的不断发展,药物信息学将在药物研发中发挥越来越重要的作用。
10.3 生物信息学常用工具与平台 (Common Bioinformatics Tools and Platforms)
生物信息学研究离不开各种工具和平台的支持。本节介绍生物信息学常用的软件、数据库和在线平台,为读者提供生物信息学分析的工具箱。
10.3.1 序列分析工具 (Sequence Analysis Tools)
序列分析工具是生物信息学中最常用的工具之一,用于进行序列比对、数据库搜索、motif 识别、进化分析等。
① 序列比对工具:
▮▮▮▮ⓑ BLAST (Basic Local Alignment Search Tool):NCBI 开发的快速序列比对工具,用于在核酸序列数据库和蛋白质序列数据库中进行同源性搜索。BLAST 提供了多种变体,如 BLASTN (核酸序列比对核酸序列)、BLASTP (蛋白质序列比对蛋白质序列)、BLASTX (核酸序列翻译成蛋白质序列比对蛋白质序列) 等。
▮▮▮▮ⓒ FASTA:另一种常用的快速序列比对工具,与 BLAST 类似,也用于在序列数据库中进行同源性搜索。
▮▮▮▮ⓓ ClustalW:经典的多序列比对工具,用于比对多条核酸序列或蛋白质序列。ClustalW 算法基于渐进比对策略,逐步构建多序列比对结果。
▮▮▮▮ⓔ MUSCLE (Multiple Sequence Comparison by Log-Expectation):一种高效的多序列比对工具,比 ClustalW 更快速、更准确。
▮▮▮▮ⓕ MAFFT (Multiple Alignment using Fast Fourier Transform):另一种快速且准确的多序列比对工具,特别适用于大规模序列比对。
② motif 识别工具:
▮▮▮▮ⓑ MEME (Multiple Em for Motif Elicitation):一种从头 motif 识别工具,用于从一组序列中发现共同的 motif。MEME 基于期望最大化 (Expectation Maximization, EM) 算法,寻找序列中的保守模式。
▮▮▮▮ⓒ HOMER (Hypergeometric Optimization of Motif EnRichment):一种用于分析基因组区域 motif 富集情况的工具,常用于分析 ChIP-Seq 数据和转录因子结合位点。
▮▮▮▮ⓓ JASPAR:一个转录因子结合位点 motif 数据库,提供了大量的转录因子结合位点 motif 信息。研究者可以利用 JASPAR 数据库搜索已知 motif,或利用 JASPAR 工具进行 motif 扫描。
③ 进化分析工具:
▮▮▮▮ⓑ PHYLIP (Phylogenetic Inference Package):一个经典的进化分析软件包,包含了多种进化树构建方法,如邻接法 (Neighbor-Joining)、最大简约法 (Maximum Parsimony)、最大似然法 (Maximum Likelihood) 等。
▮▮▮▮ⓒ MEGA (Molecular Evolutionary Genetics Analysis):一个用户友好的进化分析软件,提供了多种进化树构建方法、进化模型和可视化工具。MEGA 适用于初学者和专业研究者。
▮▮▮▮ⓓ RAxML (Randomized Axelerated Maximum Likelihood):一种快速的最大似然法进化树构建工具,适用于大规模数据集的进化分析。
④ RNA 结构预测工具:
▮▮▮▮ⓑ RNAfold:ViennaRNA package 中的一个工具,用于预测 RNA 分子的二级结构。RNAfold 基于热力学模型和动态规划算法,预测 RNA 分子的最小自由能结构和碱基配对概率。
▮▮▮▮ⓒ ViennaRNA package:一个 RNA 生物信息学软件包,包含了 RNA 二级结构预测、RNA-RNA 相互作用预测、RNA 结构比较等多种工具。
▮▮▮▮ⓓ RNAstructure:另一个 RNA 二级结构预测软件包,提供了多种 RNA 结构预测算法和可视化工具。
这些序列分析工具是生物信息学研究的常用工具,掌握这些工具的使用方法,可以有效地进行序列分析、功能预测和进化研究。
10.3.2 基因组学分析工具 (Genomics Analysis Tools)
基因组学分析工具用于基因组组装、基因组注释、基因组变异分析等基因组学研究。
① 基因组组装软件:
▮▮▮▮ⓑ SPAdes (St. Petersburg genome assembler):一种常用的从头基因组组装软件,特别适用于细菌基因组组装。SPAdes 采用了多 k-mer 策略,能够有效地处理测序错误和重复序列。
▮▮▮▮ⓒ Velvet:另一种常用的从头基因组组装软件,也适用于细菌基因组组装。Velvet 基于 de Bruijn 图算法,能够高效地组装短 reads。
▮▮▮▮ⓓ SOAPdenovo:华大基因 (BGI) 开发的基因组组装软件,适用于大型基因组组装。SOAPdenovo 采用了 de Bruijn 图算法,并针对大型基因组的特点进行了优化。
▮▮▮▮ⓔ Flye:一种用于组装长 reads (如 PacBio reads、Nanopore reads) 的基因组组装软件。Flye 能够有效地处理长 reads 的高错误率,组装出高质量的基因组。
② 基因组注释软件:
▮▮▮▮ⓑ Prokka (Prokaryotic Genome Annotation Toolkit):一种快速的细菌基因组注释工具,能够自动进行基因预测、功能注释和代谢途径分析。Prokka 适用于细菌基因组的快速注释。
▮▮▮▮ⓒ MAKER (Model-based Annotation of Eukaryotic Repeats):一种用于真核生物基因组注释的工具,能够整合多种证据(如 ab initio 基因预测、同源基因预测、EST 数据、蛋白质序列数据),进行更准确的基因注释。
▮▮▮▮ⓓ AUGUSTUS:一种 ab initio 基因预测软件,适用于真核生物基因组基因预测。AUGUSTUS 基于隐马尔可夫模型 (Hidden Markov Model, HMM),能够预测基因的结构和外显子-内含子边界。
▮▮▮▮ⓔ InterProScan:一种蛋白质结构域注释工具,能够将蛋白质序列与 InterPro 数据库中的结构域、功能位点和家族信息进行比对,进行蛋白质功能注释。
③ 基因组变异分析软件:
▮▮▮▮ⓑ GATK (Genome Analysis Toolkit):Broad Institute 开发的基因组变异分析工具包,用于 SNP Calling、InDel Calling、SV Calling 等基因组变异分析。GATK 提供了多种变异检测算法和流程,适用于人类基因组和模式生物基因组的变异分析。
▮▮▮▮ⓒ Samtools:一个用于处理 BAM/SAM 格式测序数据的工具包,可以进行测序数据比对、排序、过滤、变异检测等操作。Samtools 是基因组变异分析流程中常用的工具。
▮▮▮▮ⓓ VarScan:一种用于体细胞变异检测的工具,适用于肿瘤基因组和正常基因组配对样本的变异分析。VarScan 能够检测 SNP、InDel 和拷贝数变异。
▮▮▮▮ⓔ CNVnator:一种用于拷贝数变异 (CNV) 检测的工具,基于测序深度 (Read Depth) 方法,检测基因组中的拷贝数变异区域。
这些基因组学分析工具是基因组学研究的常用工具,掌握这些工具的使用方法,可以有效地进行基因组组装、注释和变异分析,深入研究基因组结构、功能和进化。
10.3.3 蛋白质组学分析工具 (Proteomics Analysis Tools)
蛋白质组学分析工具用于质谱数据分析、蛋白质鉴定、蛋白质定量、蛋白质结构预测、蛋白质相互作用网络分析等蛋白质组学研究。
① 质谱数据分析软件:
▮▮▮▮ⓑ MaxQuant:一种常用的质谱数据分析软件,用于蛋白质鉴定和定量。MaxQuant 能够处理多种质谱数据格式,进行肽段鉴定、蛋白质鉴定、Label-Free 定量、Label-Based 定量 (如 SILAC、iTRAQ、TMT) 等分析。
▮▮▮▮ⓒ Mascot:一种经典的质谱数据数据库搜索软件,用于肽段鉴定和蛋白质鉴定。Mascot 能够将质谱数据与蛋白质序列数据库进行比对,鉴定肽段和蛋白质。
▮▮▮▮ⓓ Proteome Discoverer:Thermo Fisher Scientific 公司开发的质谱数据分析软件,集成了多种质谱数据分析模块,包括蛋白质鉴定、定量、修饰分析等。
② 蛋白质结构预测软件:
▮▮▮▮ⓑ AlphaFold:DeepMind 公司开发的蛋白质结构预测软件,在蛋白质结构预测领域取得了革命性突破。AlphaFold 基于深度学习方法,能够高精度地预测蛋白质的三维结构。
▮▮▮▮ⓒ RoseTTAFold:华盛顿大学 Baker 实验室开发的蛋白质结构预测软件,与 AlphaFold 类似,也基于深度学习方法,能够高精度地预测蛋白质的三维结构。
▮▮▮▮ⓓ SWISS-MODEL:一个在线蛋白质同源建模服务器,用于基于已知结构的同源蛋白质模板,预测目标蛋白质的结构。SWISS-MODEL 提供了用户友好的界面和多种建模选项。
▮▮▮▮ⓔ MODELLER:一种常用的蛋白质同源建模软件,可以根据用户提供的序列比对结果和模板结构,构建蛋白质的三维模型。
③ 蛋白质相互作用网络分析软件:
▮▮▮▮ⓑ STRING (Search Tool for Retrieval of Interacting Genes/Proteins):一个蛋白质相互作用数据库和分析平台,提供了蛋白质相互作用的实验证据、预测信息和功能注释。STRING 可以用于构建蛋白质相互作用网络、进行网络分析和功能富集分析。
▮▮▮▮ⓒ Cytoscape:一个开源的网络可视化和分析平台,可以用于可视化和分析各种生物网络,包括蛋白质相互作用网络、基因调控网络、代谢网络等。Cytoscape 提供了丰富的网络布局算法、网络分析算法和插件。
▮▮▮▮ⓓ IntAct:一个蛋白质相互作用数据库,收录了蛋白质相互作用的实验证据,并提供了数据下载和检索功能。
这些蛋白质组学分析工具是蛋白质组学研究的常用工具,掌握这些工具的使用方法,可以有效地进行质谱数据分析、蛋白质鉴定、定量、结构预测和相互作用网络分析,深入研究蛋白质功能和调控机制。
10.3.4 生物信息学编程语言与环境 (Bioinformatics Programming Languages and Environments)
生物信息学分析通常需要编写程序来处理和分析生物数据。常用的生物信息学编程语言和环境包括 R 语言、Python 语言、Bioconductor 和 Biopython。
① R 语言:R 语言是一种用于统计计算和图形化的编程语言,在生物信息学领域应用广泛。R 语言具有丰富的统计分析函数和图形绘制功能,适用于生物数据的统计分析、可视化和建模。Bioconductor 是 R 语言的一个软件包,专门用于生物信息学数据分析。
② Python 语言:Python 语言是一种通用的编程语言,也广泛应用于生物信息学领域。Python 语言具有简洁、易学、高效的特点,适用于生物数据的处理、分析和流程自动化。Biopython 是 Python 语言的一个软件包,专门用于生物信息学数据分析。
③ Bioconductor:Bioconductor 是一个基于 R 语言的开源软件包,专门用于生物信息学数据分析。Bioconductor 提供了丰富的软件包,涵盖了基因组学、转录组学、蛋白质组学、系统生物学等多个领域的数据分析方法和工具。Bioconductor 适用于高通量组学数据的分析和可视化。
④ Biopython:Biopython 是一个基于 Python 语言的开源软件包,专门用于生物信息学数据分析。Biopython 提供了处理生物序列、生物结构、生物数据库等生物数据的模块和工具。Biopython 适用于生物序列分析、生物结构分析、生物数据库操作等。
掌握 R 语言和 Python 语言,以及 Bioconductor 和 Biopython 等生物信息学软件包的使用,可以有效地进行生物信息学数据分析和程序开发,提高生物信息学研究的效率和质量。
10.3.5 生物信息学在线资源与平台 (Online Bioinformatics Resources and Platforms)
生物信息学在线资源与平台为研究者提供了丰富的数据、工具和计算资源,方便研究者进行生物信息学分析和研究。常用的生物信息学在线资源与平台包括 NCBI、Ensembl、UCSC Genome Browser、KEGG、GO 和 UniProt。
① NCBI (National Center for Biotechnology Information):NCBI 是美国国立生物技术信息中心,提供了丰富的生物信息学资源,包括:
▮▮▮▮ⓑ PubMed:生物医学文献数据库,收录了大量的生物医学文献摘要和全文链接。
▮▮▮▮ⓒ GenBank:核酸序列数据库,收录了大量的核酸序列数据。
▮▮▮▮ⓓ BLAST:序列比对工具,用于在核酸序列数据库和蛋白质序列数据库中进行同源性搜索。
▮▮▮▮ⓔ GEO (Gene Expression Omnibus):基因表达数据库,收录了大量的基因表达数据。
▮▮▮▮ⓕ dbSNP (Single Nucleotide Polymorphism Database):SNP 数据库,收录了大量的 SNP 变异信息。
▮▮▮▮ⓖ NCBI Genome:基因组数据库,提供了多种物种的基因组信息。
② Ensembl:Ensembl 是 EBI 和 Wellcome Trust Sanger Institute 合作维护的基因组浏览器,提供了多种物种的基因组注释信息、基因变异信息和比较基因组学数据。Ensembl 基因组浏览器界面友好,功能强大,是基因组学研究的重要平台。
③ UCSC Genome Browser (University of California, Santa Cruz Genome Browser):UCSC Genome Browser 是加州大学圣克鲁兹分校维护的基因组浏览器,提供了多种物种的基因组注释信息、基因变异信息和表观基因组学数据。UCSC Genome Browser 以其丰富的 track 数据和灵活的自定义功能而著称。
④ KEGG (Kyoto Encyclopedia of Genes and Genomes):KEGG 是京都基因与基因组百科全书,提供了生物通路、代谢途径、疾病通路、药物信息等生物系统信息。KEGG 数据库以其精美的通路图和全面的通路信息而著称,是系统生物学和代谢组学研究的重要资源。
⑤ GO (Gene Ontology):GO 是基因本体论数据库,提供了基因和蛋白质的功能注释信息。GO 注释体系采用层次结构,描述基因和蛋白质的分子功能、生物过程和细胞组分。GO 富集分析是功能基因组学研究常用的方法。
⑥ UniProt (Universal Protein Resource):UniProt 是一个综合性的蛋白质资源库,整合了多种蛋白质序列数据库和注释信息。UniProt 数据库提供了全面的蛋白质序列、功能、结构、修饰、相互作用等信息,是蛋白质组学研究的重要资源。
这些生物信息学在线资源与平台为研究者提供了丰富的数据、工具和计算资源,方便研究者进行生物信息学分析和研究,加速生命科学研究的进程。
Appendix A: 分子生物学常用缩略语 (Common Abbreviations in Molecular Biology)
Appendix A1: 核酸相关缩略语 (Abbreviations Related to Nucleic Acids)
① DNA - 脱氧核糖核酸 (Deoxyribonucleic Acid)
▮▮▮▮描述: 携带遗传信息的核酸分子。
② RNA - 核糖核酸 (Ribonucleic Acid)
▮▮▮▮描述: 在基因表达中起重要作用的核酸分子。
③ mRNA - 信使RNA (Messenger RNA)
▮▮▮▮描述: 携带基因编码信息到核糖体用于蛋白质合成的RNA。
④ tRNA - 转移RNA (Transfer RNA)
▮▮▮▮描述: 在蛋白质翻译过程中将氨基酸运送到核糖体的RNA。
⑤ rRNA - 核糖体RNA (Ribosomal RNA)
▮▮▮▮描述: 核糖体的组成成分,参与蛋白质合成。
⑥ cDNA - 互补DNA (Complementary DNA)
▮▮▮▮描述: 由mRNA逆转录酶合成的DNA,用于克隆和表达。
⑦ gDNA - 基因组DNA (Genomic DNA)
▮▮▮▮描述: 细胞或生物体的总DNA。
⑧ ssDNA - 单链DNA (Single-stranded DNA)
▮▮▮▮描述: 单链形式的DNA分子。
⑨ dsDNA - 双链DNA (Double-stranded DNA)
▮▮▮▮描述: 双链形式的DNA分子。
⑩ nt - 核苷酸 (Nucleotide)
▮▮▮▮描述: 核酸的基本组成单位。
⑪ bp - 碱基对 (Base Pair)
▮▮▮▮描述: DNA双链中配对的碱基,如A-T, G-C。
⑫ kb - 千碱基对 (Kilobase Pair)
▮▮▮▮描述: 1000个碱基对。
⑬ Mb - 兆碱基对 (Megabase Pair)
▮▮▮▮描述: 1,000,000个碱基对。
⑭ UTR - 非翻译区 (Untranslated Region)
▮▮▮▮描述: mRNA分子5'端或3'端不编码蛋白质的区域。
⑮ ORF - 开放阅读框 (Open Reading Frame)
▮▮▮▮描述: mRNA分子中可能编码蛋白质的连续核苷酸序列。
Appendix A2: 蛋白质相关缩略语 (Abbreviations Related to Proteins)
① 蛋白 (Protein) - 蛋白质 (Protein)
▮▮▮▮描述: 由氨基酸组成,执行多种生物学功能的生物大分子。
② AA - 氨基酸 (Amino Acid)
▮▮▮▮描述: 蛋白质的基本组成单元。
③ 肽 (Peptide) - 肽 (Peptide)
▮▮▮▮描述: 由少量氨基酸通过肽键连接形成的短链分子。
④ 多肽 (Polypeptide) - 多肽 (Polypeptide)
▮▮▮▮描述: 由多个氨基酸通过肽键连接形成的长链分子,是蛋白质的结构基础。
⑤ 酶 (Enzyme) - 酶 (Enzyme)
▮▮▮▮描述: 生物催化剂,加速生物化学反应的蛋白质。
⑥ Ab - 抗体 (Antibody)
▮▮▮▮描述: 免疫系统产生的蛋白质,特异性识别并结合抗原。
⑦ Ag - 抗原 (Antigen)
▮▮▮▮描述: 能被抗体或免疫细胞特异性识别的分子。
⑧ 分子量 (MW) - 分子量 (Molecular Weight)
▮▮▮▮描述: 分子的质量,通常以道尔顿 (Dalton, Da) 或千道尔顿 (kDa) 为单位。
⑨ pI - 等电点 (Isoelectric Point)
▮▮▮▮描述: 蛋白质净电荷为零时的pH值。
⑩ PTM - 翻译后修饰 (Post-translational Modification)
▮▮▮▮描述: 蛋白质合成后发生的化学修饰,影响蛋白质的功能和特性。
Appendix A3: 基因与基因组相关缩略语 (Abbreviations Related to Genes and Genomes)
① 基因 (Gene) - 基因 (Gene)
▮▮▮▮描述: 携带遗传信息的DNA片段,编码蛋白质或RNA分子。
② 基因组 (Genome) - 基因组 (Genome)
▮▮▮▮描述: 一个生物体或病毒的完整遗传物质,包括所有基因和非编码序列。
③ 染色体 (Chromosome) - 染色体 (Chromosome)
▮▮▮▮描述: 细胞核内携带遗传物质的结构,由DNA和蛋白质组成。
④ 基因座 (Locus) - 基因座 (Locus)
▮▮▮▮描述: 基因在染色体上的特定位置。
⑤ 等位基因 (Allele) - 等位基因 (Allele)
▮▮▮▮描述: 同一基因座上基因的不同版本。
⑥ SNP - 单核苷酸多态性 (Single Nucleotide Polymorphism)
▮▮▮▮描述: 基因组DNA序列中单个核苷酸的变异。
⑦ CNV - 拷贝数变异 (Copy Number Variation)
▮▮▮▮描述: 基因组DNA序列中大片段DNA拷贝数的变异。
⑧ UTR - 非翻译区 (Untranslated Region)
▮▮▮▮描述: mRNA分子5'端或3'端不编码蛋白质的区域。
⑨ ORF - 开放阅读框 (Open Reading Frame)
▮▮▮▮描述: mRNA分子中可能编码蛋白质的连续核苷酸序列。
⑩ CDS - 编码序列 (Coding Sequence)
▮▮▮▮描述: 基因中直接编码蛋白质氨基酸序列的DNA序列。
⑪ 启动子 (Promoter) - 启动子 (Promoter)
▮▮▮▮描述: 基因上游调控基因转录起始的DNA序列。
⑫ 增强子 (Enhancer) - 增强子 (Enhancer)
▮▮▮▮描述: 基因上游或下游增强基因转录活性的DNA序列。
⑬ 沉默子 (Silencer) - 沉默子 (Silencer)
▮▮▮▮描述: 基因上游或下游抑制基因转录活性的DNA序列。
Appendix A4: 分子生物学实验技术相关缩略语 (Abbreviations Related to Molecular Biology Experimental Techniques)
① PCR - 聚合酶链式反应 (Polymerase Chain Reaction)
▮▮▮▮描述: 用于扩增特定DNA片段的分子生物学技术。
② qPCR - 实时荧光定量PCR (Quantitative PCR)
▮▮▮▮描述: 用于实时定量检测PCR产物的技术。
③ RT-PCR - 反转录PCR (Reverse Transcription PCR)
▮▮▮▮描述: 先将RNA反转录为cDNA,再进行PCR扩增的技术。
④ NGS - 新一代测序 (Next-Generation Sequencing)
▮▮▮▮描述: 高通量DNA测序技术的统称,如Illumina, PacBio, Nanopore测序。
⑤ Sanger 测序 (Sanger Sequencing) - Sanger 测序 (Sanger Sequencing)
▮▮▮▮描述: 基于双脱氧核苷酸的DNA测序方法,也称一代测序。
⑥ Southern blotting - Southern 印迹杂交 (Southern Blotting)
▮▮▮▮描述: 用于检测DNA特定序列的分子杂交技术。
⑦ Northern blotting - Northern 印迹杂交 (Northern Blotting)
▮▮▮▮描述: 用于检测RNA特定序列的分子杂交技术。
⑧ Western blotting - Western 印迹杂交 (Western Blotting)
▮▮▮▮描述: 用于检测蛋白质特定序列的免疫印迹技术。
⑨ ELISA - 酶联免疫吸附测定 (Enzyme-Linked Immunosorbent Assay)
▮▮▮▮描述: 基于酶标记抗体的免疫学定量检测方法。
⑩ ChIP - 染色质免疫共沉淀 (Chromatin Immunoprecipitation)
▮▮▮▮描述: 用于研究蛋白质与DNA相互作用的技术。
⑪ ChIP-Seq - 染色质免疫共沉淀测序 (Chromatin Immunoprecipitation Sequencing)
▮▮▮▮描述: 结合ChIP和NGS技术,用于全基因组范围研究蛋白质与DNA相互作用。
⑫ RNA-Seq - RNA 测序 (RNA Sequencing)
▮▮▮▮描述: 基于NGS技术的RNA定量和转录组分析方法。
⑬ FISH - 荧光原位杂交 (Fluorescence In Situ Hybridization)
▮▮▮▮描述: 利用荧光标记探针检测细胞或组织中特定核酸序列的技术。
⑭ SPR - 表面等离子共振 (Surface Plasmon Resonance)
▮▮▮▮描述: 用于实时检测生物分子相互作用的技术。
⑮ BLI - 生物膜干涉 (Bio-Layer Interferometry)
▮▮▮▮描述: 另一种实时检测生物分子相互作用的技术,与SPR类似。
⑯ SDS-PAGE - SDS-聚丙烯酰胺凝胶电泳 (SDS-Polyacrylamide Gel Electrophoresis)
▮▮▮▮描述: 常用于分离蛋白质的电泳技术。
⑰ PAGE - 聚丙烯酰胺凝胶电泳 (Polyacrylamide Gel Electrophoresis)
▮▮▮▮描述: 常用于分离核酸或蛋白质的电泳技术。
Appendix A5: 其他常用缩略语 (Other Common Abbreviations)
① 细胞 (Cell) - 细胞 (Cell)
▮▮▮▮描述: 生命的基本结构和功能单位。
② 体外 (in vitro) - 体外 (in vitro)
▮▮▮▮描述: 在试管、培养皿等人工环境中进行的实验。
③ 体内 (in vivo) - 体内 (in vivo)
▮▮▮▮描述: 在生物体内部进行的实验。
④ siRNA - 小干扰RNA (Small interfering RNA)
▮▮▮▮描述: 一类小的双链RNA分子,用于RNA干扰 (RNAi) 沉默基因表达。
⑤ miRNA - 微小RNA (MicroRNA)
▮▮▮▮描述: 一类小的非编码RNA分子,参与基因表达调控。
⑥ lncRNA - 长非编码RNA (Long non-coding RNA)
▮▮▮▮描述: 长度超过200个核苷酸的非编码RNA分子,功能多样。
⑦ GO - 基因本体论 (Gene Ontology)
▮▮▮▮描述: 基因和蛋白质功能分类的层级系统。
⑧ KEGG - 京都基因与基因组百科全书 (Kyoto Encyclopedia of Genes and Genomes)
▮▮▮▮描述: 整合基因组、化学和系统信息的数据库,用于通路分析等。
⑨ NCBI - 美国国家生物技术信息中心 (National Center for Biotechnology Information)
▮▮▮▮描述: 提供生物信息学数据库和工具的机构。
⑩ UCSC - 加州大学圣克鲁兹分校 (University of California, Santa Cruz)
▮▮▮▮描述: 提供基因组浏览器等生物信息学资源的机构。
⑪ Ensembl - 欧洲生物信息学研究所和惠康桑格研究所 (European Bioinformatics Institute and Wellcome Sanger Institute)
▮▮▮▮描述: 提供基因组注释和比较基因组学资源的机构。
⑫ kDa - 千道尔顿 (Kilodalton)
▮▮▮▮描述: 蛋白质分子量单位,1 kDa = 1000 Da。
⑬ Da - 道尔顿 (Dalton)
▮▮▮▮描述: 原子质量单位,也用于表示分子量。
⑭ rpm - 转/分钟 (Revolutions Per Minute)
▮▮▮▮描述: 离心机转速单位。
⑮ g - 重力加速度 (Gravity)
▮▮▮▮描述: 离心力单位,表示地球表面的重力加速度倍数。
Appendix B: 分子生物学重要网站与资源 (Important Websites and Resources for Molecular Biology)
分子生物学重要网站与资源 (Important Websites and Resources for Molecular Biology)
本附录整理了分子生物学学习和研究的重要网站和在线资源,包括数据库、工具、教程等。这些资源覆盖了分子生物学的各个方面,旨在为读者提供一个全面、便捷的分子生物学信息平台,无论您是初学者、中级学者还是专家,都能从中找到有价值的资源。
1. 综合数据库 (Comprehensive Databases)
综合数据库整合了多种类型的生物信息数据,是分子生物学研究的基础资源。
1.1. 美国国家生物技术信息中心 (National Center for Biotechnology Information, NCBI) 🌐
NCBI 是由美国国立卫生研究院 (National Institutes of Health, NIH) 下属的国家医学图书馆 (National Library of Medicine, NLM) 建立和维护的生物信息学资源中心。NCBI 提供了广泛的数据库和服务,涵盖基因组学、蛋白质组学、系统生物学等多个领域,是分子生物学研究者最常用的综合性资源平台。
① 主要数据库:
▮▮▮▮ⓑ PubMed: 生物医学文献数据库,收录了大量的生物医学文献摘要和全文链接,是进行文献检索的必备工具。🔍
▮▮▮▮ⓒ GenBank: 核酸序列数据库,收录了公开的 DNA 和 RNA 序列信息,是进行序列比对和基因分析的基础数据来源。🧬
▮▮▮▮ⓓ Protein: 蛋白质序列数据库,收录了蛋白质的氨基酸序列信息,与 GenBank 相互关联,是研究蛋白质结构和功能的关键资源。 蛋白
▮▮▮▮ⓔ GEO (Gene Expression Omnibus): 基因表达数据库,存储了高通量基因表达数据,如 microarray 和 RNA-Seq 数据,用于研究基因表达调控和差异分析。📊
▮▮▮▮ⓕ dbSNP (Single Nucleotide Polymorphism database): 单核苷酸多态性数据库,收录了基因组中的 SNP 位点信息,用于研究遗传变异与疾病的关系。 🧬
▮▮▮▮ⓖ PubMed Central (PMC): 生物医学文献全文数据库,免费提供大量生物医学文献的全文,是获取开放获取文献的重要途径。 📚
▮▮▮▮ⓗ BLAST (Basic Local Alignment Search Tool): 基本局部比对搜索工具,用于核酸或蛋白质序列的相似性搜索,是序列分析中最常用的工具之一。 🔎
▮▮▮▮ⓘ Conserved Domain Database (CDD): 保守结构域数据库,用于识别蛋白质序列中的保守结构域,帮助理解蛋白质的功能和进化关系。 🧬
② 实用工具:
▮▮▮▮ⓑ BLAST (Basic Local Alignment Search Tool): 序列比对工具,支持核酸和蛋白质序列的 BLASTN, BLASTP, BLASTX, tBLASTn, tBLASTx 等多种比对算法。 🧰
▮▮▮▮ⓒ Primer-BLAST: 引物设计和特异性检查工具,用于 PCR 引物设计和评估引物的特异性,避免引物错配。 🧪
▮▮▮▮ⓓ ORF Finder (Open Reading Frame Finder): 开放阅读框查找工具,用于在核酸序列中查找潜在的蛋白质编码区域。 🧬
▮▮▮▮ⓔ Multiple Sequence Alignment (Clustal Omega): 多序列比对工具,用于比对多个核酸或蛋白质序列,分析序列的保守性和变异性。 🧬
▮▮▮▮ⓕ Taxonomy Browser: 生物分类学浏览器,用于查询生物物种的分类信息,了解物种的进化关系。 🌳
③ 学习资源:
▮▮▮▮ⓑ NCBI Bookshelf: 在线生物医学书籍库,提供大量生物医学领域的电子书,包括分子生物学、遗传学、细胞生物学等教材和专著。 📖
▮▮▮▮ⓒ NCBI Education: NCBI 教育资源,提供在线教程、视频、课程材料等,帮助用户学习生物信息学知识和工具的使用。 🧑🏫
▮▮▮▮ⓓ NCBI Insights: NCBI 博客,发布 NCBI 数据库和工具的更新信息、应用案例和技术进展。 📰
1.2. 欧洲生物信息学研究所 (European Bioinformatics Institute, EBI) 🇪🇺
EBI 是欧洲分子生物学实验室 (European Molecular Biology Laboratory, EMBL) 的一部分,是欧洲主要的生物信息学研究和资源中心。EBI 与 NCBI 类似,提供了广泛的生物信息数据库和服务,是全球分子生物学研究的重要支柱。
① 主要数据库:
▮▮▮▮ⓑ EMBL-Bank: 核酸序列数据库,与 NCBI 的 GenBank 和日本 DNA 数据库 (DNA Data Bank of Japan, DDBJ) 共同组成国际核酸序列数据库合作组织 (International Nucleotide Sequence Database Collaboration, INSDC)。 🧬
▮▮▮▮ⓒ UniProt (Universal Protein Resource): 通用蛋白质资源数据库,提供全面的蛋白质序列和功能信息,是蛋白质研究的核心数据库。 蛋白
▮▮▮▮ⓓ Protein Data Bank in Europe (PDBe): 欧洲蛋白质数据库,收录了蛋白质、核酸等生物大分子的三维结构信息,与全球蛋白质数据库 (Worldwide Protein Data Bank, wwPDB) 合作。 3D
▮▮▮▮ⓔ ArrayExpress: 基因表达数据库,存储了 microarray 和 RNA-Seq 等高通量基因表达数据,与 NCBI 的 GEO 数据库类似。 📊
▮▮▮▮ⓕ Ensembl: 真核生物基因组数据库,提供注释详尽的真核生物基因组信息,包括基因结构、基因变异、基因表达等。 🧬
▮▮▮▮ⓖ ChEMBL: 化学基因组数据库,收录了药物分子和生物活性信息,用于药物发现和化学生物学研究。 💊
▮▮▮▮ⓗ Reactome: 生物反应和通路数据库,描述了生物体内的生物通路和反应网络,用于系统生物学研究。 🛤️
② 实用工具:
▮▮▮▮ⓑ FASTA/BLAST: 序列比对工具,提供与 NCBI BLAST 类似的序列比对功能。 🔎
▮▮▮▮ⓒ Clustal Omega: 多序列比对工具,与 NCBI Clustal Omega 类似,用于多序列比对分析。 🧬
▮▮▮▮ⓓ InterPro: 蛋白质结构域和功能预测工具,用于预测蛋白质序列中的结构域、功能位点和家族成员。 🧬
▮▮▮▮ⓔ EMBOSS (European Molecular Biology Open Software Suite): 欧洲分子生物学开放软件套件,包含一系列命令行生物信息学工具,用于序列分析、结构分析等。 💻
③ 学习资源:
▮▮▮▮ⓑ EBI Training: EBI 培训资源,提供在线课程、教程、研讨会等,帮助用户学习生物信息学知识和工具的使用。 🧑🏫
▮▮▮▮ⓒ EBI Courses: EBI 课程,提供生物信息学领域的短期课程和培训项目。 📚
▮▮▮▮ⓓ EBI Industry Programme: EBI 产业项目,促进生物信息学在产业界的应用和发展。 🏭
2. 基因序列数据库 (Gene Sequence Databases)
基因序列数据库专注于存储和管理基因和核酸序列信息。
2.1. GenBank (NCBI) 🧬
如前所述,GenBank 是 NCBI 维护的核酸序列数据库,是分子生物学研究中最核心的序列资源之一。
2.2. EMBL-Bank (EBI) 🧬
如前所述,EMBL-Bank 是 EBI 维护的核酸序列数据库,与 GenBank 互为镜像,共同构成国际核酸序列数据库合作组织。
2.3. DDBJ (DNA Data Bank of Japan) 🇯🇵
DDBJ 是日本国家遗传学研究所 (National Institute of Genetics, NIG) 维护的核酸序列数据库,是国际核酸序列数据库合作组织的第三个成员。DDBJ 与 GenBank 和 EMBL-Bank 共享数据,用户可以通过 DDBJ 网站访问全球核酸序列数据。
3. 蛋白质序列数据库 (Protein Sequence Databases) 蛋白
蛋白质序列数据库专注于存储和管理蛋白质序列信息。
3.1. UniProt (EBI) 蛋白
如前所述,UniProt 是 EBI 维护的通用蛋白质资源数据库,是蛋白质研究领域最权威和全面的数据库之一。UniProt 数据库整合了 Swiss-Prot, TrEMBL 和 PIR-PSD 等多个蛋白质数据库的数据,提供高质量的蛋白质序列、功能注释、结构信息、相互作用信息等。
3.2. Protein (NCBI) 蛋白
如前所述,Protein 是 NCBI 维护的蛋白质序列数据库,与 GenBank 相互关联,用户可以通过 Protein 数据库检索蛋白质序列信息,并链接到相关的核酸序列和文献信息。
3.3. PIR (Protein Information Resource) 蛋白
PIR 是蛋白质信息资源数据库,是最早的蛋白质序列数据库之一。PIR 数据库强调蛋白质的分类和家族关系,提供蛋白质家族、结构域、功能位点等注释信息。PIR 数据库的数据也整合到 UniProt 数据库中。
4. 结构数据库 (Structure Databases) 3D
结构数据库专注于存储和管理生物大分子的三维结构信息。
4.1. Protein Data Bank (PDB) 3D
PDB 是全球蛋白质数据库,由美国、欧洲和日本的蛋白质数据库合作维护。PDB 数据库收录了通过 X-射线晶体学、核磁共振 (NMR) 和冷冻电子显微镜 (Cryo-EM) 等技术解析的蛋白质、核酸等生物大分子的三维结构信息。PDB 数据库是结构生物学研究的核心资源,用户可以通过 PDB 数据库获取生物大分子的结构数据、结构可视化工具和结构分析工具。
① PDB 镜像站点:
▮▮▮▮ⓑ RCSB PDB (Research Collaboratory for Structural Bioinformatics Protein Data Bank): 美国 PDB 镜像站点,由美国罗格斯大学 (Rutgers University)、加州大学圣地亚哥分校 (University of California, San Diego) 和威斯康星大学麦迪逊分校 (University of Wisconsin-Madison) 共同维护。 🇺🇸
▮▮▮▮ⓒ PDBe (Protein Data Bank in Europe): 欧洲 PDB 镜像站点,由 EBI 维护。 🇪🇺
▮▮▮▮ⓓ PDBj (Protein Data Bank Japan): 日本 PDB 镜像站点,由大阪大学 (Osaka University) 维护。 🇯🇵
② 实用工具:
▮▮▮▮ⓑ PDB-101: PDB 教育资源,提供 PDB 数据库的教程、结构生物学基础知识、结构可视化工具等。 🧑🏫
▮▮▮▮ⓒ Jmol/JSmol: 开源的生物大分子结构可视化工具,用于在线查看和分析 PDB 结构数据。 💻
▮▮▮▮ⓓ PyMOL: 商业的生物大分子结构可视化和分析软件,功能强大,广泛应用于结构生物学研究。 💻
▮▮▮▮ⓔ ChimeraX: 由美国加州大学旧金山分校 (University of California, San Francisco, UCSF) 开发的生物大分子结构可视化和分析软件,是 Chimera 的下一代版本。 💻
4.2. Nucleic Acid Database (NDB) 🧬
NDB 是核酸数据库,专注于收录和管理核酸的三维结构信息。NDB 数据库与 PDB 数据库合作,提供核酸结构的检索、可视化和分析工具。
5. 基因表达数据库 (Gene Expression Databases) 📊
基因表达数据库存储和管理高通量基因表达数据,用于研究基因表达调控和差异分析。
5.1. GEO (Gene Expression Omnibus) (NCBI) 📊
如前所述,GEO 是 NCBI 维护的基因表达数据库,收录了 microarray, RNA-Seq, SAGE, ChIP-chip 等多种高通量基因表达数据。GEO 数据库是研究基因表达谱、基因表达差异、基因表达调控的重要资源。
5.2. ArrayExpress (EBI) 📊
如前所述,ArrayExpress 是 EBI 维护的基因表达数据库,与 GEO 数据库类似,收录了 microarray 和 RNA-Seq 等高通量基因表达数据。ArrayExpress 数据库与 GEO 数据库共享数据,用户可以通过 ArrayExpress 网站访问全球基因表达数据。
5.3. TCGA (The Cancer Genome Atlas) 🎗️
TCGA 是癌症基因组图谱计划,由美国国家癌症研究所 (National Cancer Institute, NCI) 和美国国家人类基因组研究所 (National Human Genome Research Institute, NHGRI) 共同发起。TCGA 计划对多种癌症类型进行了全面的基因组分析,包括基因突变、基因表达、DNA 甲基化、拷贝数变异等数据。TCGA 数据是癌症研究的重要资源,用户可以通过 TCGA 数据库获取癌症基因组数据,用于癌症机制研究、生物标志物发现和靶向治疗开发。
5.4. GTEx (Genotype-Tissue Expression) 🧬
GTEx 是基因型-组织表达计划,旨在研究基因在不同组织中的表达情况,以及基因变异对基因表达的影响。GTEx 计划收集了大量正常人体的组织样本,进行了 RNA-Seq 和基因分型分析。GTEx 数据是研究基因表达调控、组织特异性基因表达、疾病相关基因表达的重要资源。
6. 路径数据库 (Pathway Databases) 🛤️
路径数据库描述生物体内的生物通路和反应网络,用于系统生物学研究。
6.1. KEGG (Kyoto Encyclopedia of Genes and Genomes) 🛤️
KEGG 是京都基因与基因组百科全书,是一个整合了基因组、化学和系统功能信息的数据库。KEGG 数据库包括 KEGG PATHWAY, KEGG BRITE, KEGG MODULE, KEGG DISEASE, KEGG DRUG 等多个子数据库,涵盖代谢通路、信号通路、疾病通路、药物信息等。KEGG 数据库是研究生物通路、系统生物学和药物研发的重要资源。
6.2. Reactome (EBI) 🛤️
如前所述,Reactome 是 EBI 维护的生物反应和通路数据库,描述了人类和其他物种的生物通路和反应网络。Reactome 数据库强调通路的层级结构和反应的详细描述,提供通路的可视化、通路分析工具和通路数据下载。
6.3. WikiPathways 🛤️
WikiPathways 是一个开放的、社区维护的生物通路数据库。WikiPathways 数据库允许用户共同编辑和注释生物通路信息,提供多种物种的生物通路图谱,支持通路的可视化、通路分析和通路数据共享。
6.4. GO (Gene Ontology) 🌳
GO 是基因本体论数据库,提供了一套描述基因和蛋白质功能的结构化词汇。GO 数据库包括三个主要的本体:分子功能 (Molecular Function, MF)、生物过程 (Biological Process, BP) 和细胞组分 (Cellular Component, CC)。GO 数据库广泛应用于基因功能注释、基因富集分析和基因功能网络分析。
7. 基因工具网站 (Gene Tool Websites) 🧰
基因工具网站提供各种在线工具,用于基因序列分析、基因编辑、基因克隆等分子生物学实验。
7.1. Benchling 🧰
Benchling 是一个云端的生物信息学平台,提供 DNA 序列编辑、引物设计、BLAST 比对、基因克隆设计、NGS 数据分析等多种工具。Benchling 平台界面友好,功能强大,是分子生物学实验设计和数据分析的常用工具。
7.2. SnapGene 🧰
SnapGene 是一个商业的 DNA 序列编辑和分析软件,提供 DNA 序列可视化、限制性酶切位点分析、PCR 引物设计、基因克隆模拟等功能。SnapGene 软件操作简便,功能实用,是分子克隆实验的常用工具。
7.3. NEB (New England Biolabs) Tools 🧰
NEB 是新英格兰生物实验室,是一家生物试剂公司,提供多种在线分子生物学工具,包括限制性酶切位点分析、PCR 引物设计、DNA 甲基化分析、RNA 结构预测等。NEB Tools 工具免费使用,功能实用,是分子生物学实验的常用辅助工具。
7.4. Addgene 🧰
Addgene 是一个非营利的质粒库,提供大量的质粒载体、病毒载体和基因克隆资源。Addgene 平台允许研究者共享质粒,加速科学研究的进展。用户可以通过 Addgene 平台搜索、订购和共享质粒资源。
8. 在线教程和教育资源 (Online Tutorials and Educational Resources) 🧑🏫
在线教程和教育资源为分子生物学学习者提供丰富的学习材料和互动平台。
8.1. Khan Academy Biology 🧑🏫
可汗学院生物学课程,提供免费的生物学视频课程和练习题,涵盖分子生物学、细胞生物学、遗传学、进化生物学等多个领域。可汗学院生物学课程内容系统、讲解清晰,适合初学者入门学习。
8.2. Coursera Molecular Biology Courses 🧑🏫
Coursera 平台提供多所大学的分子生物学在线课程,包括约翰霍普金斯大学 (Johns Hopkins University)、杜克大学 (Duke University)、加州大学圣地亚哥分校 (University of California, San Diego) 等名校的课程。Coursera 分子生物学课程内容深入、教学质量高,适合进阶学习和专业提升。
8.3. edX Biology Courses 🧑🏫
edX 平台提供麻省理工学院 (Massachusetts Institute of Technology, MIT)、哈佛大学 (Harvard University) 等名校的生物学在线课程,包括分子生物学、遗传学、基因组学等方向的课程。edX 生物学课程内容丰富、形式多样,提供免费学习和付费认证选项。
8.4. YouTube Molecular Biology Channels 🧑🏫
YouTube 上有许多优秀的分子生物学教学频道,例如 Amoeba Sisters, Bozeman Science, Professor Dave Explains 等。这些频道提供生动有趣的分子生物学视频课程,适合碎片化学习和知识点复习。
9. 学术期刊和出版社网站 (Academic Journal and Publisher Websites) 📚
学术期刊和出版社网站是获取最新分子生物学研究成果和学术资源的重要途径。
9.1. Nature 📚
《自然》杂志网站,提供《自然》杂志及其子刊的最新论文、新闻、评论和专题报道。Nature 杂志是国际顶尖的综合性科学期刊,分子生物学领域的重要研究成果常发表在 Nature 及其子刊上。
9.2. Science 📚
《科学》杂志网站,提供《科学》杂志及其子刊的最新论文、新闻、评论和科普文章。Science 杂志是另一本国际顶尖的综合性科学期刊,与 Nature 齐名,分子生物学领域的重大突破常发表在 Science 及其子刊上。
9.3. Cell 📚
《细胞》杂志网站,提供《细胞》杂志及其子刊的最新论文、综述和评论。Cell 杂志是分子生物学和细胞生物学领域的顶尖期刊,发表高水平的原创性研究论文。
9.4. Molecular Cell 📚
《分子细胞》杂志网站,提供《分子细胞》杂志的最新论文、综述和评论。Molecular Cell 杂志是分子生物学领域的权威期刊,专注于发表分子机制研究的高质量论文。
9.5. Elsevier 📚
爱思唯尔出版社网站,提供大量的生物医学期刊和图书资源,包括 Molecular Biology Reports, Gene, Biochimica et Biophysica Acta (BBA) 等分子生物学领域的期刊。
9.6. Springer 📚
施普林格出版社网站,提供大量的科学、技术和医学 (STM) 期刊和图书资源,包括 Molecular Biology and Evolution, Journal of Molecular Biology, Molecular Biotechnology 等分子生物学领域的期刊。
9.7. Wiley 📚
威立出版社网站,提供大量的学术期刊、图书和在线资源,包括 Current Protocols in Molecular Biology, Biotechnology and Applied Biochemistry, Journal of Cellular Biochemistry 等分子生物学领域的期刊。
10. 生物信息学分析平台 (Bioinformatics Analysis Platforms) 💻
生物信息学分析平台提供在线生物信息学分析工具和流程,方便用户进行高通量数据分析。
10.1. Galaxy 💻
Galaxy 是一个开源的、基于 Web 的生物信息学分析平台,提供友好的用户界面和丰富的分析工具,用户可以通过 Galaxy 平台进行基因组学、转录组学、蛋白质组学等数据分析,无需编程经验。
10.2. CyVerse (formerly iPlant Collaborative) 💻
CyVerse (原 iPlant Collaborative) 是一个为生命科学研究提供计算基础设施和生物信息学资源的平台,提供高性能计算资源、数据存储空间、生物信息学工具和在线分析平台。CyVerse 平台适合进行大规模生物信息学数据分析和计算。
10.3. DNAnexus 💻
DNAnexus 是一个商业的云端基因组信息学平台,提供安全、合规的基因组数据管理、分析和协作环境。DNAnexus 平台广泛应用于基因组学研究、药物研发和临床诊断领域。
10.4. Seven Bridges Genomics 💻
Seven Bridges Genomics 是一个商业的云端生物信息学平台,提供基因组数据分析、生物标志物发现和精准医学解决方案。Seven Bridges Genomics 平台与多个基因组学研究机构和制药公司合作,提供专业的基因组数据分析服务。
希望本附录提供的分子生物学重要网站与资源能够帮助读者更好地学习和研究分子生物学。随着分子生物学和生物信息学技术的不断发展,新的资源和工具也将不断涌现,建议读者持续关注相关领域的最新进展,不断更新和扩展自己的知识库和工具箱。
Appendix C: 分子生物学实验常用试剂与耗材 (Common Reagents and Consumables in Molecular Biology Experiments)
Appendix C: 分子生物学实验常用试剂与耗材 (Common Reagents and Consumables in Molecular Biology Experiments)
本附录列举了分子生物学实验中常用的试剂和耗材,为实验操作提供参考。
Appendix C1: 通用试剂 (General Reagents)
通用试剂是指在分子生物学实验中广泛使用的基础化学试剂,它们构成了实验的基础环境,并参与多种实验步骤。
Appendix C1.1: 缓冲液与溶液 (Buffers and Solutions)
缓冲液和溶液是维持实验体系 pH 值和离子强度的关键组分,确保生物分子的稳定性和实验的可靠性。
① Tris 缓冲液 (Tris buffer)
▮▮▮▮ⓑ Tris-HCl (三羟甲基氨基甲烷盐酸盐): 常用于 DNA 和蛋白质实验的 pH 缓冲剂,pH 范围约为 7.0-9.0。
▮▮▮▮ⓒ Tris-硼酸-EDTA (TBE) 缓冲液: 常用于核酸电泳,提供离子并维持 pH 稳定。
▮▮▮▮ⓓ Tris-乙酸-EDTA (TAE) 缓冲液: 常用于较大 DNA 片段的核酸电泳,分辨率略低于 TBE。
② 磷酸盐缓冲液 (Phosphate buffer, PBS)
▮▮▮▮ⓑ 磷酸盐缓冲盐溶液 (Phosphate Buffered Saline, PBS): 模拟生理盐环境,常用于细胞培养和免疫学实验。
③ EDTA 溶液 (EDTA solution)
▮▮▮▮ⓑ 乙二胺四乙酸 (Ethylenediaminetetraacetic acid, EDTA): 金属离子螯合剂,抑制 DNase 和 RNase 活性,保护核酸。
④ 盐溶液 (Salt solutions)
▮▮▮▮ⓑ 氯化钠 (Sodium chloride, NaCl): 调节离子强度,用于沉淀核酸、配制缓冲液等。
▮▮▮▮ⓒ 氯化钾 (Potassium chloride, KCl): 维持离子平衡,用于细胞培养和缓冲液。
⑤ 去离子水 (Deionized water)
▮▮▮▮ⓑ 分子生物学级别去离子水 (Molecular biology grade deionized water): 超纯水,去除离子和有机物,避免干扰实验。
Appendix C1.2: 酶与试剂盒 (Enzymes and Kits)
酶是分子生物学实验的核心工具,试剂盒则提供了预先优化好的实验方案和试剂组合,简化实验流程。
① 限制性内切酶 (Restriction endonucleases)
▮▮▮▮ⓑ 各类限制性内切酶: 如 EcoRI, HindIII, BamHI 等,用于 DNA 的定点切割。
② DNA 连接酶 (DNA ligases)
▮▮▮▮ⓑ T4 DNA 连接酶 (T4 DNA ligase): 催化 DNA 片段之间的磷酸二酯键形成,用于 DNA 克隆。
③ DNA 聚合酶 (DNA polymerases)
▮▮▮▮ⓑ Taq DNA 聚合酶 (Taq DNA polymerase): 耐热 DNA 聚合酶,用于 PCR 扩增。
▮▮▮▮ⓒ 高保真 DNA 聚合酶 (High-fidelity DNA polymerase): 如 Pfu DNA 聚合酶,具有校对功能,提高 PCR 准确性。
④ RNA 聚合酶 (RNA polymerases)
▮▮▮▮ⓑ T7 RNA 聚合酶 (T7 RNA polymerase): 用于体外转录,合成 RNA。
⑤ 逆转录酶 (Reverse transcriptases)
▮▮▮▮ⓑ M-MLV 逆转录酶 (Moloney Murine Leukemia Virus Reverse Transcriptase, M-MLV RT): 将 RNA 反转录为 cDNA,用于 RT-PCR。
⑥ 核酸酶 (Nucleases)
▮▮▮▮ⓑ DNase I (脱氧核糖核酸酶 I): 降解 DNA,用于去除 RNA 样品中的 DNA 污染。
▮▮▮▮ⓒ RNase A (核糖核酸酶 A): 降解 RNA,用于去除 DNA 样品中的 RNA 污染。
▮▮▮▮ⓓ 核酸外切酶 (Exonucleases): 如 λ 核酸外切酶,从 DNA 末端降解核酸。
⑦ 蛋白酶 K (Proteinase K)
▮▮▮▮ⓑ 蛋白酶 K (Proteinase K): 广谱蛋白酶,用于蛋白质降解,核酸提取中去除蛋白质。
⑧ 各类试剂盒 (Various kits)
▮▮▮▮ⓑ DNA 提取试剂盒 (DNA extraction kits): 如基因组 DNA 提取试剂盒、质粒 DNA 提取试剂盒。
▮▮▮▮ⓒ RNA 提取试剂盒 (RNA extraction kits): 如总 RNA 提取试剂盒、mRNA 纯化试剂盒。
▮▮▮▮ⓓ PCR 试剂盒 (PCR kits): 如普通 PCR 试剂盒、实时荧光定量 PCR 试剂盒。
▮▮▮▮ⓔ 反转录试剂盒 (Reverse transcription kits): 用于 cDNA 合成。
▮▮▮▮ⓕ DNA 克隆试剂盒 (DNA cloning kits): 简化克隆流程。
▮▮▮▮ⓖ 蛋白质提取试剂盒 (Protein extraction kits): 用于不同类型样品的蛋白质提取。
Appendix C1.3: 化学试剂 (Chemical Reagents)
化学试剂在分子生物学实验中扮演着多样化的角色,从核酸染色到蛋白质修饰,都离不开它们的应用。
① 核酸染色剂 (Nucleic acid stains)
▮▮▮▮ⓑ 溴化乙锭 (Ethidium bromide, EB): 嵌入 DNA 双螺旋,在紫外光下发出荧光,用于 DNA 和 RNA 凝胶电泳染色,注意其毒性。
▮▮▮▮ⓒ SYBR Green (SYBR Green): 荧光染料,灵敏度高,毒性低于 EB,用于核酸凝胶电泳和实时荧光定量 PCR。
▮▮▮▮ⓓ 考马斯亮蓝 (Coomassie Brilliant Blue): 用于蛋白质凝胶电泳染色。
② 蛋白质修饰剂 (Protein modification reagents)
▮▮▮▮ⓑ 二硫苏糖醇 (Dithiothreitol, DTT): 还原剂,还原蛋白质中的二硫键。
▮▮▮▮ⓒ β-巯基乙醇 (β-Mercaptoethanol, β-ME): 还原剂,作用类似于 DTT,常用于蛋白质样品制备。
▮▮▮▮ⓓ 碘乙酰胺 (Iodoacetamide): 烷基化剂,修饰半胱氨酸残基,防止二硫键重新形成。
③ 变性剂 (Denaturants)
▮▮▮▮ⓑ 尿素 (Urea): 蛋白质和核酸变性剂,破坏氢键。
▮▮▮▮ⓒ 甲酰胺 (Formamide): 核酸变性剂,降低核酸杂交温度。
▮▮▮▮ⓓ 十二烷基硫酸钠 (Sodium dodecyl sulfate, SDS): 阴离子去污剂,蛋白质变性剂,用于 SDS-PAGE 电泳。
④ 固定剂 (Fixatives)
▮▮▮▮ⓑ 甲醛 (Formaldehyde): 组织和细胞固定剂,用于免疫组织化学和细胞形态学研究。
▮▮▮▮ⓒ 多聚甲醛 (Paraformaldehyde, PFA): 组织和细胞固定剂,常用浓度为 4%。
⑤ 抗生素 (Antibiotics)
▮▮▮▮ⓑ 氨苄西林 (Ampicillin, Amp): 抑制细菌生长,用于质粒筛选。
▮▮▮▮ⓒ 卡那霉素 (Kanamycin, Kan): 抑制细菌生长,用于质粒筛选。
▮▮▮▮ⓓ 四环素 (Tetracycline, Tet): 抑制细菌生长,用于质粒筛选。
⑥ 其他常用化学试剂 (Other common chemical reagents)
▮▮▮▮ⓑ 乙醇 (Ethanol): 核酸沉淀、消毒。
▮▮▮▮ⓒ 异丙醇 (Isopropanol): 核酸沉淀。
▮▮▮▮ⓓ 甘油 (Glycerol): 增加溶液密度,保护酶活性,制备冷冻保存液。
▮▮▮▮ⓔ 二甲基亚砜 (Dimethyl sulfoxide, DMSO): 细胞冷冻保护剂,促进 PCR 反应。
▮▮▮▮ⓕ Triton X-100 (Triton X-100): 非离子去污剂,用于细胞裂解和膜蛋白研究。
▮▮▮▮ⓖ Tween 20 (Tween 20): 非离子去污剂,用于 Western blotting 和 ELISA。
Appendix C2: 实验耗材 (Laboratory Consumables)
实验耗材是分子生物学实验中一次性使用的物品,保证实验的无菌性和准确性。
Appendix C2.1: 塑料耗材 (Plastic Consumables)
塑料耗材具有轻便、一次性使用、减少交叉污染的优点,是分子生物学实验中最常用的耗材类型。
① 离心管 (Centrifuge tubes)
▮▮▮▮ⓑ 1.5 mL 离心管 (1.5 mL centrifuge tubes): 常用体积,用于小体积样品离心。
▮▮▮▮ⓒ 15 mL 离心管 (15 mL centrifuge tubes): 中等体积,用于细胞培养和样品处理。
▮▮▮▮ⓓ 50 mL 离心管 (50 mL centrifuge tubes): 较大体积,用于大量样品处理。
▮▮▮▮ⓔ PCR 管 (PCR tubes): 薄壁,导热性好,适用于 PCR 反应。
▮▮▮▮ⓕ 酶标板 (Microplates/Well plates): 96 孔板、384 孔板等,用于高通量实验,如 ELISA, 细胞培养。
② 移液器吸头 (Pipette tips)
▮▮▮▮ⓑ 不同规格吸头 (Different sizes of pipette tips): 10 μL, 20 μL, 100 μL, 200 μL, 1000 μL 等,配合移液器使用,精确转移液体。
▮▮▮▮ⓒ 无菌吸头 (Sterile pipette tips): 保证无菌操作,避免污染。
▮▮▮▮ⓓ 带滤芯吸头 (Filter pipette tips): 防止气溶胶污染,保护移液器和样品。
③ 培养皿与培养瓶 (Culture dishes and flasks)
▮▮▮▮ⓑ 细胞培养皿 (Cell culture dishes): 不同直径,用于细胞培养。
▮▮▮▮ⓒ 细胞培养瓶 (Cell culture flasks): 不同容量,用于大规模细胞培养。
▮▮▮▮ⓓ T25 培养瓶 (T25 flasks): 25 cm² 培养面积。
▮▮▮▮ⓔ T75 培养瓶 (T75 flasks): 75 cm² 培养面积。
▮▮▮▮ⓕ T175 培养瓶 (T175 flasks): 175 cm² 培养面积。
④ 其他塑料耗材 (Other plastic consumables)
▮▮▮▮ⓑ 塑料血清移液管 (Serological pipettes): 不同容量,用于无菌转移液体,细胞培养常用。
▮▮▮▮ⓒ 细胞刮刀 (Cell scrapers): 用于收集贴壁细胞。
▮▮▮▮ⓓ 细胞过滤器 (Cell strainers): 过滤细胞悬液,去除细胞团块。
▮▮▮▮ⓔ 塑料烧杯和量筒 (Plastic beakers and graduated cylinders): 用于配制溶液。
▮▮▮▮ⓕ 塑料试剂瓶 (Plastic reagent bottles): 储存溶液和试剂。
Appendix C2.2: 玻璃耗材 (Glass Consumables)
玻璃耗材具有耐高温、化学性质稳定等特点,部分可重复使用,但易碎。
① 玻璃烧杯和锥形瓶 (Glass beakers and Erlenmeyer flasks)
▮▮▮▮ⓑ 不同规格玻璃烧杯 (Different sizes of glass beakers): 用于配制和加热溶液。
▮▮▮▮ⓒ 不同规格锥形瓶 (Different sizes of Erlenmeyer flasks): 用于溶液混合和培养。
② 玻璃试管 (Glass test tubes)
▮▮▮▮ⓑ 不同规格玻璃试管 (Different sizes of glass test tubes): 用于小体积反应和培养。
③ 玻璃培养皿 (Glass petri dishes)
▮▮▮▮ⓑ 玻璃培养皿 (Glass petri dishes): 可重复使用,用于微生物培养。
④ 玻棒 (Glass rods)
▮▮▮▮ⓑ 玻棒 (Glass rods): 用于搅拌溶液。
⑤ 载玻片和盖玻片 (Microscope slides and coverslips)
▮▮▮▮ⓑ 载玻片 (Microscope slides): 放置样品,用于显微镜观察。
▮▮▮▮ⓒ 盖玻片 (Coverslips): 覆盖样品,保护样品和物镜。
Appendix C2.3: 其他耗材 (Other Consumables)
除了塑料和玻璃耗材,还有一些其他材质的耗材在分子生物学实验中也经常使用。
① 滤膜与滤纸 (Membranes and filter paper)
▮▮▮▮ⓑ 硝酸纤维素膜 (Nitrocellulose membrane, NC membrane): 用于 Western blotting 和 Northern blotting。
▮▮▮▮ⓒ 聚偏氟乙烯膜 (Polyvinylidene difluoride membrane, PVDF membrane): 用于 Western blotting,机械强度和化学稳定性优于 NC 膜。
▮▮▮▮ⓓ 滤纸 (Filter paper): 用于过滤溶液。
② 铝箔与封口膜 (Aluminum foil and Parafilm)
▮▮▮▮ⓑ 铝箔 (Aluminum foil): 包裹容器,避光,高温灭菌。
▮▮▮▮ⓒ 封口膜 (Parafilm): 封口,防止溶液挥发和污染。
③ 手套与口罩 (Gloves and masks)
▮▮▮▮ⓑ 乳胶手套 (Latex gloves): 防护,操作实验。
▮▮▮▮ⓒ 丁腈手套 (Nitrile gloves): 耐化学腐蚀,防护,操作实验,推荐使用。
▮▮▮▮ⓓ 口罩 (Masks): 防止呼吸道污染,保护实验人员。
④ 记号笔与标签 (Markers and labels)
▮▮▮▮ⓑ 记号笔 (Markers): 标记耗材。
▮▮▮▮ⓒ 标签 (Labels): 标记样品。
⑤ 棉签与擦镜纸 (Cotton swabs and lens paper)
▮▮▮▮ⓑ 棉签 (Cotton swabs): 擦拭,涂布。
▮▮▮▮ⓒ 擦镜纸 (Lens paper): 擦拭光学仪器。
⑥ 灭菌袋与自封袋 (Sterilization bags and ziplock bags)
▮▮▮▮ⓑ 灭菌袋 (Sterilization bags): 高温灭菌耗材。
▮▮▮▮ⓒ 自封袋 (Ziplock bags): 样品保存。
本附录仅列举了分子生物学实验中常用的一部分试剂和耗材,实际实验中需根据具体实验目的和方法选择合适的试剂和耗材。同时,请务必注意实验安全,按照规范操作,并妥善处理实验废弃物。
Appendix D: 参考文献 (References)
D.1 第1章:分子生物学导论 (Chapter 1: Introduction to Molecular Biology)
D.1.1 分子生物学的定义与范畴 (Section 1.1: Definition and Scope of Molecular Biology)
⚝ Alberts B, Johnson A, Lewis J, et al. Molecular Biology of the Cell. 4th edition. New York: Garland Science; 2002. 分子生物学的历史背景 (Historical Background of Molecular Biology). Available from: https://www.ncbi.nlm.nih.gov/books/NBK21054/
⚝ Lodish H, Berk A, Zipursky SL, et al. Molecular Cell Biology. 4th edition. New York: W. H. Freeman; 2000. 分子生物学导论 (An Introduction to Molecular Cell Biology). Available from: https://www.ncbi.nlm.nih.gov/books/NBK21475/
⚝ Pray, L. (2008). Discovery of DNA Structure and Function: Watson and Crick. Nature Education 1(1):100.
⚝ Judson, H. F. (1996). The Eighth Day of Creation: Makers of the Revolution in Biology. Cold Spring Harbor Laboratory Press.
D.1.2 生命的基本分子:核酸与蛋白质 (Section 1.2: Fundamental Molecules of Life: Nucleic Acids and Proteins)
⚝ Watson JD, Crick FH. Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid. Nature. 1953 Apr 25;171(4356):737-8.
⚝ Franklin RE, Gosling RG. Molecular configuration in sodium thymonucleate. Nature. 1953 Apr 25;171(4356):740-1.
⚝ Pauling L, Corey RB, Branson HR. The structure of proteins; two hydrogen-bonded helical configurations of the polypeptide chain. Proc Natl Acad Sci U S A. 1951 May;37(5):205-11.
⚝ Branden C, Tooze J. Introduction to Protein Structure. 2nd ed. Garland Science; 1999.
D.1.3 分子生物学的中心法则 (Section 1.3: Central Dogma of Molecular Biology)
⚝ Crick F. Central dogma of molecular biology. Nature. 1970 Aug 8;227(5258):561-3.
⚝ Baltimore D. RNA-dependent DNA polymerase in virions of RNA tumour viruses. Nature. 1970 Jun 27;226(5252):1209-11.
⚝ Temin HM, Mizutani S. RNA-dependent DNA polymerase in virions of Rous sarcoma virus. Nature. 1970 Jun 27;226(5252):1211-3.
⚝ Koonin EV, Dolja VV. Virus world as an evolutionary network. Microbiol Mol Biol Rev. 1993 Sep;57(3):425-78.
D.2 第2章:基因组的结构与功能 (Chapter 2: Genome Structure and Function)
D.2.1 基因组的组织层次 (Section 2.1: Organizational Levels of the Genome)
⚝ Gillings MR, Hurst TP, Tetu SG. Genomics and the bacterial chromosome. Adv Microb Physiol. 2019;74:1-67.
⚝ Elcock AH. Structure and organization of bacterial genomes. Curr Opin Struct Biol. 2017 Apr;43:12-19.
⚝ Grewal SI, Jia S. Heterochromatin revisited. Nat Rev Genet. 2007 Dec;8(12):35-46.
⚝ Koonin EV. Virus as populations of selfish genetic elements rather than organisms. Curr Top Microbiol Immunol. 2016;397:1-25.
D.2.2 染色质结构与功能 (Section 2.2: Chromatin Structure and Function)
⚝ Kornberg RD. Chromatin structure: a repeating unit of histones and DNA. Science. 1974 Oct 11;184(4139):868-71.
⚝ Luger K, Mäder AW, Richmond RK, Sargent DF, Richmond TJ. Crystal structure of the nucleosome core particle at 2.8 A resolution. Nature. 1997 Sep 18;389(6648):251-60.
⚝ Felsenfeld G, Groudine M. Controlling the double helix. Nature. 2003 Apr 24;421(6921):448-53.
⚝ Allis CD, Jenuwein T. The molecular hallmarks of epigenetic control. Nat Rev Genet. 2016 Oct;17(10):487-500.
D.2.3 基因的结构与功能 (Section 2.3: Gene Structure and Function)
⚝ Lander ES, Linton LM, Birren B, et al. Initial sequencing and analysis of the human genome. Nature. 2001 Feb 15;409(6822):860-921.
⚝ Mattick JS, Dinger ME. RNA regulatory networks. Nat Rev Genet. 2005 Dec;6(12):316-26.
⚝ Birney E, Stamatoyannopoulos JA, Dutta A, et al. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature. 2007 Jun 14;447(7146):799-816.
⚝ Graves JA. Sex chromosomes and dosage compensation. Curr Biol. 2016 Oct 24;26(20):R1019-R1026.
D.2.4 基因组的变异与进化 (Section 2.4: Genome Variation and Evolution)
⚝ Lynch M. Evolution of the mutation rate. Trends Genet. 2010 Oct;26(10):345-52.
⚝ Hastings PJ, Lupski JR, Rosenberg SM, Ira G. Mechanisms of change in repeat number at human VNTR loci. Nat Rev Genet. 2009 Dec;10(12):551-64.
⚝ Charlesworth D, Willis JH. The genetics of inbreeding depression. Nat Rev Genet. 2009 Oct;10(10):783-96.
⚝ Koonin EV. The logic of chance: the nature and origin of biological innovation. FT Press; 2011.
D.3 第3章:DNA 的复制、修复与重组 (Chapter 3: DNA Replication, Repair, and Recombination)
D.3.1 DNA 复制的分子机制 (Section 3.1: Molecular Mechanisms of DNA Replication)
⚝ Kornberg A, Baker TA. DNA Replication. 2nd ed. W. H. Freeman; 1992.
⚝ Bell SP, Dutta A. DNA replication in eukaryotic cells. Annu Rev Biochem. 2002;71:333-74.
⚝ Méchali M, O'Donnell M. DNA replication forks as platforms for genome duplication and repair. Nat Rev Mol Cell Biol. 2013 Dec;14(12):601-15.
⚝ Sclafani RA, Holzen TM. Cell cycle regulation of DNA replication. Annu Rev Genet. 2007;41:237-80.
D.3.2 DNA 损伤与修复 (Section 3.2: DNA Damage and Repair)
⚝ Lindahl T. DNA repair enzymes. Annu Rev Biochem. 1982;51:61-87.
⚝ Friedberg EC, Walker GC, Siede W, Wood RD, Schultz RA, Ellenberger T. DNA Repair and Mutagenesis. 2nd ed. ASM Press; 2006.
⚝ Ciccia A, Elledge SJ. DNA damage response: making it safe to play with knives. Mol Cell. 2010 Jul 30;40(2):179-204.
⚝ Jackson SP, Bartek J. DNA damage and DNA damage response pathways. Nature. 2009 Oct 8;461(7267):1071-8.
D.3.3 DNA 重组 (Section 3.3: DNA Recombination)
⚝ Szostak JW, Orr-Weaver TL, Rothstein RJ, Stahl FW. The double-strand-break repair model for recombination. Cell. 1983 Oct;33(1):25-35.
⚝ Kanaar R, Hoeijmakers JH, van Gent DC. DNA double-strand breaks in DNA repair, recombination, and transcription. Mol Cell Biol. 2003 Dec;23(22):7409-20.
⚝ Stark JM, Pierce AJ, Oh J, Pastink A, Jasin M. Genetic steps of mammalian homologous recombination with endogenous and exogenous substrates. Mol Cell Biol. 2004 Apr;24(8):9306-16.
⚝ Smith GR. Homologous recombination near and far from DNA breaks: alternative roles and repair pathways. Annu Rev Genet. 2011;45:67-96.
D.4 第4章:基因的转录与 RNA 加工 (Chapter 4: Gene Transcription and RNA Processing)
D.4.1 转录的分子机制 (Section 4.1: Molecular Mechanisms of Transcription)
⚝ Kornberg RD. The molecular basis of eukaryotic transcription. Proc Natl Acad Sci U S A. 2007 May 29;104(12):4903-8.
⚝ Cramer P. Organization of RNA polymerase II and transcription factors. Cold Spring Harb Perspect Biol. 2019 Dec 2;11(12):a031602.
⚝ Orphanides G, Reinberg D. A unified theory of gene expression. Cell. 2002 Jul 26;108(4):439-51.
⚝ Core LJ, Lis JT. Transcription regulation through promoter-proximal pausing. Science. 2008 Mar 28;319(5871):1791-2.
D.4.2 RNA 的加工与修饰 (Section 4.2: RNA Processing and Modification)
⚝ Moore MJ, Proudfoot NJ. Pre-mRNA processing reaches back to transcription and ahead to translation. Cell. 2009 Jun 12;136(4):688-700.
⚝ Nilsen TW, Graveley BR. Expansion of the eukaryotic proteome by alternative splicing. Cell. 2010 Mar 19;140(5):457-72.
⚝ Smith CW, Valcárcel J. Alternative pre-mRNA splicing: the logic of combinatorial control. Trends Biochem Sci. 2000 Feb;25(2):125-31.
⚝ Wickens M, Bernstein DL, Kimble J, Parker R. 3'-UTR structure and function in mRNA decay and translation control. Nat Struct Biol. 2002 Nov;9(11):800-6.
D.4.3 非编码 RNA (Non-coding RNAs)
⚝ Mattick JS. RNA regulation: a new genetics? Nat Rev Genet. 2004 Jun;5(6):316-23.
⚝ Bartel DP. MicroRNAs: genomics, biogenesis, mechanism, and function. Cell. 2004 Jan 23;116(2):281-97.
⚝ Lee RC, Feinbaum RL, Ambros V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 1993 Dec 3;75(5):843-54.
⚝ Ponting CP, Oliver PL, Reik W. Evolution and functions of long noncoding RNAs. Cell. 2009 Feb 27;136(4):629-41.
D.5 第5章:基因的翻译与蛋白质合成 (Chapter 5: Gene Translation and Protein Synthesis)
D.5.1 翻译的分子机制 (Section 5.1: Molecular Mechanisms of Translation)
⚝ Schmeing TM, Ramakrishnan V. What recent ribosome structures reveal about the mechanism of translation. Nature. 2009 Jul 2;461(7260):1234-42.
⚝ Rodnina MV, Wintermeyer W. Ribosome fidelity: tRNA discrimination, proofreading and GTP hydrolysis. Trends Biochem Sci. 2001 Apr;26(4):249-55.
⚝ Dever TE, Green R. Ribosome recycling: GTP-bound elongation factor eEF3 and Rli1p promote subunit dissociation. Cell. 2012 Jul 20;149(7):1445-7.
⚝ Jackson RJ, Hellen CU, Pestova TV. Mechanism of eukaryotic translation initiation and principles of its regulation. Nat Rev Mol Cell Biol. 2010 Feb;11(2):113-27.
D.5.2 蛋白质的折叠、修饰与转运 (Section 5.2: Protein Folding, Modification, and Transport)
⚝ Anfinsen CB. Principles that govern the folding of protein chains. Science. 1973 Jul 20;181(4096):223-30.
⚝ Hartl FU, Hayer-Hartl M. Molecular chaperones in cellular protein folding. Science. 2002 Jul 19;295(5564):1852-8.
⚝ Walsh C. Posttranslational Modification of Proteins: Expanding Nature's Inventory. Roberts and Company Publishers; 2006.
⚝ Schatz G, Dobberstein B. Common principles of protein translocation across membranes. Science. 1996 Oct 18;271(5255):1519-26.
D.5.3 翻译的调控 (Section 5.3: Regulation of Translation)
⚝ Gebauer F, Hentze MW. Molecular mechanisms of translational control. Nat Rev Mol Cell Biol. 2004 Jul;5(7):827-35.
⚝ Sonenberg N, Hinnebusch AG. Translational regulation of mRNA in eukaryotes. Cell. 2009 Dec 24;136(4):731-45.
⚝ Richter JD, Sonenberg N. Regulation of cap-dependent translation by eIF4E inhibitory proteins. Nature. 2005 Nov 17;433(7025):477-80.
⚝ Ruggero D, Pandolfi PP. The multifaceted roles of mTOR in cancer. Nat Rev Cancer. 2003 Jan;3(1):17-25.
D.6 第6章:基因表达的调控 (Chapter 6: Regulation of Gene Expression)
D.6.1 转录水平的调控 (Section 6.1: Transcriptional Regulation)
⚝ Ptashne M, Gann A. Genes & Signals. Cold Spring Harbor Laboratory Press; 2002.
⚝ Levine M, Tjian R. Transcription regulation by chromatin and transcription factors. Nature. 2003 Dec 18-25;424(6907):147-51.
⚝ Kouzarides T. Chromatin modifications and their function. Cell. 2007 Feb 23;128(4):693-705.
⚝ Bird A. DNA methylation patterns and epigenetic memory. Genes Dev. 2002 Dec 15;16(1):6-21.
D.6.2 转录后水平的调控 (Section 6.2: Post-transcriptional Regulation)
⚝ Keene JD. RNA regulons: coordination of post-transcriptional events. Nat Rev Genet. 2007 Sep;8(9):533-43.
⚝ Barreau C, Paillard L, Osborne HB. AU-rich elements and mRNA degradation. Nucleic Acids Res. 2005 Apr 19;33(10):7138-50.
⚝ Wickens M, Bernstein DL, Kimble J, Parker R. 3'-UTR structure and function in mRNA decay and translation control. Nat Struct Biol. 2002 Nov;9(11):800-6.
⚝ Valencia-Sanchez MA, Liu J, Hannon GJ, Parker R. Control of translation and mRNA degradation by miRNAs and siRNAs. Genes Dev. 2006 Jul 15;20(5):515-24.
D.6.3 翻译水平的调控 (Section 6.3: Translational Regulation)
⚝ Hershey JW, Merrick WC. Pathway and mechanism of initiation of protein synthesis. In: Translational Control of Gene Expression. Cold Spring Harbor Laboratory Press; 2000.
⚝ Gebauer F, Hentze MW. Molecular mechanisms of translational control. Nat Rev Mol Cell Biol. 2004 Jul;5(7):827-35.
⚝ Kozak M. Structural features in the 5'-noncoding region of eukaryotic mRNAs that modulate translational efficiency. J Biol Chem. 1991 Jul 25;266(20):19867-70.
⚝ Holcik M, Sonenberg N. Translational control in stress and apoptosis. Nat Rev Mol Cell Biol. 2005 Jun;6(6):318-27.
D.6.4 蛋白质水平的调控 (Section 6.4: Post-translational Regulation)
⚝ Hunter T. Protein kinases and phosphatases: the yin and yang of protein phosphorylation and signaling. Cell. 1995 Dec 15;80(2):225-36.
⚝ Mann M, Jensen ON. Proteomic analysis of post-translational modifications. Nat Biotechnol. 2003 Jul;21(7):255-62.
⚝ Pawson T, Scott JD. Signaling through scaffold, anchoring, and adaptor proteins. Science. 2005 Mar 18;302(5640):1711-7.
⚝ Ciechanover A. The ubiquitin-proteasome proteolytic pathway: on protein degradation and cell regulation. EMBO J. 1998 Jan 15;17(2):7151-60.
D.7 第7章:分子生物学技术 (Chapter 7: Molecular Biology Techniques)
D.7.1 核酸的分离、纯化与分析 (Section 7.1: Nucleic Acid Isolation, Purification, and Analysis)
⚝ Sambrook J, Fritsch EF, Maniatis T. Molecular Cloning: A Laboratory Manual. 2nd ed. Cold Spring Harbor Laboratory Press; 1989.
⚝ Ausubel FM, Brent R, Kingston RE, et al. Current Protocols in Molecular Biology. John Wiley & Sons, Inc.; 1987-2023.
⚝ Bustin SA, Benes V, Garson JA, et al. The MIQE guidelines: minimum information for publication of quantitative real-time PCR experiments. Clin Chem. 2009 Apr;55(4):611-22.
⚝ Southern EM. Detection of specific sequences among DNA fragments separated by gel electrophoresis. J Mol Biol. 1975 Nov 25;98(3):503-17.
D.7.2 DNA 克隆与基因工程 (Section 7.2: DNA Cloning and Genetic Engineering)
⚝ Cohen SN, Chang AC, Boyer HW, Helling RB. Construction of biologically functional bacterial plasmids in vitro. Proc Natl Acad Sci U S A. 1973 Nov;70(11):3240-4.
⚝ Smith HO, Wilcox KW. A restriction enzyme from Hemophilus influenzae Rd. J Mol Biol. 1970 Sep 14;51(2):379-91.
⚝ Gellert M. DNA ligase. Annu Rev Biochem. 1969;38:927-48.
⚝ Mullis KB, Faloona FA. Specific synthesis of DNA in vitro via a polymerase-catalyzed chain reaction. Methods Enzymol. 1987;155:335-50.
D.7.3 聚合酶链式反应 (Polymerase Chain Reaction, PCR)
⚝ Saiki RK, Scharf S, Faloona F, et al. Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia. Science. 1985 Dec 20;230(4732):1350-4.
⚝ Valasek MA, Repa JJ. Power of real-time PCR in gene expression analysis. Methods Mol Biol. 2005;257:101-18.
⚝ Bustin SA, Nolan T. Pitfalls of quantitative real-time reverse transcription polymerase chain reaction. J Biomol Tech. 2004;15(3):155-66.
⚝ Henegariu O, Heerema NA, Dlouhy SR, Vance GH, Vogt PH. Multiplex PCR: critical parameters and step-by-step protocol. Biotechniques. 1997 Mar;23(3):504-11.
D.7.4 DNA 测序技术 (DNA Sequencing Technologies)
⚝ Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-7.
⚝ Shendure J, Ji H. Next-generation DNA sequencing. Nat Biotechnol. 2008 Oct;26(10):1135-45.
⚝ Metzker ML. Sequencing technologies - the next generation. Nat Rev Genet. 2010 Jan;11(1):31-46.
⚝ Goodwin S, McPherson JD, McCombie WR. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 2016 Jun;17(6):333-51.
D.7.5 蛋白质的分离、纯化与分析 (Section 7.5: Protein Isolation, Purification, and Analysis)
⚝ Deutscher MP. Guide to Protein Purification. Methods in Enzymology, vol 182. Academic Press; 1990.
⚝ Walker JM. The Protein Protocols Handbook. 2nd ed. Humana Press; 2002.
⚝ Towbin H, Staehelin T, Gordon J. Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications. Proc Natl Acad Sci U S A. 1979 Sep;76(9):4350-4.
⚝ Aebersold R, Mann M. Mass spectrometry-based proteomics. Nature. 2003 Oct 23;422(6928):198-207.
D.7.6 细胞生物学常用技术 (Section 7.6: Common Techniques in Cell Biology)
⚝ Freshney RI. Culture of Animal Cells: A Manual of Basic Technique. 6th ed. Wiley-Liss; 2010.
⚝ Murphy DB. Fundamentals of Light Microscopy and Electronic Imaging. Wiley-Liss; 2001.
⚝ Shapiro HM. Practical Flow Cytometry. 4th ed. Wiley-Liss; 2003.
⚝ Darzynkiewicz Z, Juan G, Li X, Gorczyca W, Traganos F. Cytometry in cell necrobiology: analysis of apoptosis and necrosis. Cytometry A. 2008 Sep;73(9):20-26.
D.7.7 基因组学常用技术 (Section 7.7: Common Techniques in Genomics)
⚝ Brown TA. Genomes 4. 4th ed. Garland Science; 2017.
⚝ Schena M, Shalon D, Davis RW, Brown PO. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science. 1995 Oct 20;270(5235):467-70.
⚝ Doudna JA, Charpentier E. The new frontier of genome engineering with CRISPR-Cas9. Science. 2014 Nov 28;346(6213):1258096.
⚝ Park PJ. ChIP-seq: advantages and challenges of a maturing technology. Nat Rev Genet. 2009 Dec;10(12):669-80.
⚝ Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009 Jan;10(1):57-63.
D.8 第8章:分子生物学在医学中的应用 (Chapter 8: Molecular Biology in Medicine)
D.8.1 疾病的分子机制 (Section 8.1: Molecular Mechanisms of Diseases)
⚝ Weinberg RA. The Biology of Cancer. 2nd ed. Garland Science; 2014.
⚝ Strachan T, Read AP. Human Molecular Genetics 4. 4th ed. Garland Science; 2011.
⚝ Janeway CA Jr, Travers P, Walport M, et al. Immunobiology: The Immune System in Health and Disease. 5th edition. New York: Garland Science; 2001. 免疫系统在健康和疾病中的作用 (The Immune System in Health and Disease). Available from: https://www.ncbi.nlm.nih.gov/books/NBK27090/
⚝ Abbas AK, Lichtman AH, Pillai S. Cellular and Molecular Immunology. 9th ed. Elsevier Saunders; 2018.
D.8.2 分子诊断 (Section 8.2: Molecular Diagnostics)
⚝ Henry JB. Clinical Diagnosis and Management by Laboratory Methods. 20th ed. WB Saunders Company; 2001.
⚝ Kwok PY, Chen X. Detection of single nucleotide polymorphisms. Curr Opin Biotechnol. 2003 Dec;14(6):40-5.
⚝ Diamandis EP. Analysis of serum tumor markers in cancer diagnosis and prognosis. Clin Chem Lab Med. 1999 Feb;37(2):89-95.
⚝ Pantel K, Alix-Panabières C. Circulating tumour cells in cancer patients: state-of-the-art and future perspectives. Clin Chem Lab Med. 2010 Jul;48(7):849-55.
D.8.3 基因治疗 (Section 8.3: Gene Therapy)
⚝ Anderson WF. Human gene therapy. Science. 1992 May 8;256(5058):808-13.
⚝ Walther W, Stein U. Viral vectors for gene therapy: a comparative view of their safety and infectivity. Gene Ther. 2000 Jan;7(1):833-50.
⚝ Kay MA, Glorioso JC, Naldini L. Viral vectors for gene therapy: the art of turning infectious agents into vehicles of therapeutics. Nat Med. 2001 May;7(5):33-9.
⚝ Cavazzana-Calvo M, Hacein-Bey-Abina S, Fischer A. Gene therapy for severe combined immunodeficiency. Annu Rev Med. 2005;56:585-602.
D.8.4 药物开发与分子靶向治疗 (Section 8.4: Drug Development and Molecular Targeted Therapy)
⚝ Drews J. Drug discovery: a historical perspective. Science. 2000 Jul 7;287(5460):1960-4.
⚝ Hopkins AL, Groom CR. The druggable genome. Nat Rev Drug Discov. 2002 Sep;1(9):727-30.
⚝ Oprea TI, Davis AM, Teague SJ, Leeson PD. Is there a difference between leads and drugs? A historical perspective. J Chem Inf Comput Sci. 2001 Nov-Dec;41(6):1308-15.
⚝ Krause DS, Van Etten RA. Tyrosine kinases as targets for cancer therapy. N Engl J Med. 2005 Oct 20;353(16):172-87.
D.8.5 个性化医疗与精准医学 (Section 8.5: Personalized Medicine and Precision Medicine)
⚝ Ginsburg GS, Willard HF. Genomic and personalized medicine: foundations and applications. Transl Res. 2009 Jan;154(1):1-17.
⚝ Hamburg MA, Collins FS. The path to personalized medicine. N Engl J Med. 2010 Mar 11;363(10):301-4.
⚝ Ashley EA. Towards precision medicine. Nat Rev Genet. 2016 Jul;17(7):507-22.
⚝ Chan IS, Ginsburg GS. Precision medicine: progress and challenges. Annu Rev Genomics Hum Genet. 2017 Aug 31;18:83-102.
D.9 第9章:分子生物学在生物技术中的应用 (Chapter 9: Molecular Biology in Biotechnology)
D.9.1 基因工程与重组 DNA 技术 (Section 9.1: Genetic Engineering and Recombinant DNA Technology)
⚝ Old RW, Primrose SB. Principles of Gene Manipulation: An Introduction to Genetic Engineering. 6th ed. Blackwell Science; 2001.
⚝ Glick BR, Pasternak JJ, Patten CL. Molecular Biotechnology: Principles and Applications of Recombinant DNA. 4th ed. ASM Press; 2010.
⚝ James C. Global status of commercialized biotech/GM crops: 2019. ISAAA Brief No. 55. ISAAA: Ithaca, NY. 2019.
⚝ Ledford H. CRISPR, tweaked for gene drives, forces lab rethink. Nature. 2015 Aug 27;524(7566):399-400.
D.9.2 蛋白质工程与酶工程 (Section 9.2: Protein Engineering and Enzyme Engineering)
⚝ Voigt CA. Directed evolution of proteins for industrial biotechnology. Curr Opin Biotechnol. 2006 Dec;17(6):547-53.
⚝ Arnold FH. Directed evolution: bringing new chemistry to life. Angew Chem Int Ed Engl. 2018 Feb 19;57(8):4143-4148.
⚝ Bornscheuer UT, Pohl M. Improving enzymes by directed evolution and rational design. Curr Opin Chem Biol. 2001 Dec;5(6):325-31.
⚝ Brady D, Jordaan J, Woodley JM. Biocatalytic cascades: opportunities and challenges for process intensification. Trends Biotechnol. 2018 Feb;36(2):179-94.
D.9.3 细胞工程与组织工程 (Section 9.3: Cell Engineering and Tissue Engineering)
⚝ Langer R, Vacanti JP. Tissue engineering. Science. 1993 May 14;260(5110):920-6.
⚝ Lanza R, Gearhart J, Hogan B, et al. Essential Stem Cell Biology. 4th ed. Elsevier Academic Press; 2018.
⚝ Atala A, Lanza R. Methods of Tissue Engineering. 2nd ed. Academic Press; 2007.
⚝ Butler M, Burg K. Cell and Tissue Culture in Biomedical Engineering. Humana Press; 2003.
D.9.4 代谢工程与合成生物学 (Section 9.4: Metabolic Engineering and Synthetic Biology)
⚝ Stephanopoulos G. Metabolic engineering. Curr Opin Biotechnol. 1994 Feb;5(1):196-200.
⚝ Keasling JD. Manufacturing molecules through metabolic engineering. Science. 2008 Oct 31;322(5900):1526-9.
⚝ Khalil AS, Collins JJ. Synthetic biology: applications come of age. Nat Rev Genet. 2010 Nov;11(11):367-79.
⚝ Cameron DE, Bashor CJ, Collins JJ. A brief history of synthetic biology. Nat Rev Microbiol. 2014 May;12(5):447-53.
D.10 第10章:生物信息学导论 (Chapter 10: Introduction to Bioinformatics)
D.10.1 生物信息学的定义与范畴 (Section 10.1: Definition and Scope of Bioinformatics)
⚝ Luscombe NM, Greenbaum D, Gerstein M. What is bioinformatics? A proposed definition and overview of the field. Methods Inf Med. 2001 Mar;40(2):346-58.
⚝ Mount DW. Bioinformatics: Sequence and Genome Analysis. 2nd ed. Cold Spring Harbor Laboratory Press; 2004.
⚝ Lesk AM. Introduction to Bioinformatics. 5th ed. Oxford University Press; 2019.
⚝ Ouellette BF, Altman RB. Bioinformatics in 1998: infrastructure, evolution and directions. Trends Genet. 1999 Dec;15(12):401-4.
D.10.2 生物信息学的主要研究内容 (Section 10.2: Main Research Areas of Bioinformatics)
⚝ Baxevanis AD, Ouellette BF. Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins. 3rd ed. Wiley-Interscience; 2005.
⚝ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J Mol Biol. 1990 Oct 5;215(3):403-10.
⚝ Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 2004 Mar 15;32(5):1792-7.
⚝ Lander ES, Linton LM, Birren B, et al. Initial sequencing and analysis of the human genome. Nature. 2001 Feb 15;409(6822):860-921.
⚝ Yates JR 3rd. Mass spectrometry. From proteomics to cell biology. Trends Genet. 2004 Dec;20(12):512-23.
⚝ Kitano H. Systems biology: a brief overview. Science. 2002 Mar 1;295(5560):1662-4.
D.10.3 生物信息学常用工具与平台 (Section 10.3: Common Bioinformatics Tools and Platforms)
⚝ Benson DA, Cavanaugh M, Clark K, et al. GenBank. Nucleic Acids Res. 2018 Jan 4;46(D1):D41-D47.
⚝ Zerbino DR, Achuthan P, Akanni W, et al. Ensembl 2018. Nucleic Acids Res. 2018 Jan 4;46(D1):D754-D761.
⚝ Kent WJ, Sugnet CW, Furey TS, et al. The human genome browser at UCSC. Genome Res. 2002 Dec;12(12):996-1006.
⚝ Gentleman RC, Carey VJ, Bates DM, et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biol. 2004;5(10):R80.
⚝ Cock PA, Antao T, Chang JT, et al. Biopython: freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics. 2009 Jun 1;25(11):1422-3.
Appendix E: 术语表 (Glossary)
Appendix E1: 分子生物学重要术语
① 氨基酸 (Amino acid):构成蛋白质的基本单元,含有氨基 (-NH\(_{2}\)) 和羧基 (-COOH)。
② 氨基酰 tRNA 合成酶 (Aminoacyl-tRNA synthetase):一类酶,催化氨基酸与对应的 tRNA 分子连接,形成氨基酰 tRNA,是翻译过程中的关键酶。
③ 癌基因 (Oncogene):一类基因,其突变或异常表达可以促进细胞癌变。通常是调控细胞生长和分化的正常基因 (原癌基因) 发生改变而来。
④ mRNA 加帽 (Capping):真核生物 mRNA 前体 5' 端的一种修饰过程,添加 7-甲基鸟苷帽结构,对 mRNA 的稳定性、翻译和剪接有重要作用。
⑤ 中心法则 (Central dogma):分子生物学的核心概念,描述遗传信息的流动方向,即 DNA → RNA → 蛋白质 (Protein)。也包括一些例外情况,如逆转录和 RNA 复制。
⑥ 染色质 (Chromatin):真核细胞核内 DNA 与蛋白质 (主要是组蛋白) 组成的复合物,是遗传物质存在的形式。染色质的结构状态影响基因的表达。
⑦ 染色质免疫共沉淀测序 (ChIP-Seq, Chromatin Immunoprecipitation Sequencing):一种研究蛋白质与 DNA 相互作用的技术,通过抗体富集特定蛋白结合的 DNA 片段,并进行高通量测序,从而在全基因组范围内鉴定蛋白的 DNA 结合位点。
⑧ 顺式作用元件 (Cis-regulatory element):DNA 序列上的调控元件,通常位于基因的附近,例如启动子、增强子和沉默子,调控基因的转录。
⑨ 克隆 (Clone):指产生与亲代在遗传上完全相同的后代的过程,也指通过 DNA 重组技术获得的 DNA 分子或细胞的复制品。
⑩ 密码子 (Codon):mRNA 序列中每三个核苷酸组成的三联体,编码一个特定的氨基酸或终止信号。
⑪ 共聚焦显微镜 (Confocal microscope):一种光学显微镜,利用激光作为光源,并通过针孔装置消除焦平面以外的光线干扰,获得清晰的三维图像。
⑫ CRISPR-Cas9 系统 (CRISPR-Cas9 system):一种基因组编辑技术,利用向导 RNA (gRNA) 定位基因组上的特定序列,并由 Cas9 核酸酶进行精确切割,实现基因的敲除、敲入或编辑。
⑬ cDNA 文库 (cDNA library):由互补 DNA (cDNA) 片段克隆到载体中构建的文库,代表细胞或组织中 mRNA 的集合,用于研究基因表达和蛋白质编码序列。
⑭ 细胞周期 (Cell cycle):细胞从一次分裂结束到下一次分裂开始的完整过程,包括 G1 期、S 期 (DNA 复制期)、G2 期和 M 期 (分裂期)。
⑮ 细胞凋亡 (Apoptosis):程序性细胞死亡,是一种主动的、受基因调控的细胞死亡方式,在生物体的发育和维持稳态中起重要作用。
⑯ 细胞核 (Nucleus):真核细胞中含有遗传物质 DNA 的细胞器,是细胞的控制中心。
⑰ 细胞器 (Organelle):细胞内的具有特定结构和功能的膜性或非膜性结构,例如线粒体、内质网、高尔基体等。
⑱ 细胞培养 (Cell culture):在体外模拟体内环境,使细胞在人工条件下生长和繁殖的技术。
⑲ 脱氧核糖核酸 (DNA, Deoxyribonucleic acid):携带遗传信息的生物大分子,由脱氧核糖核苷酸组成,通常呈双螺旋结构。
⑳ DNA 连接酶 (DNA ligase):一类酶,催化 DNA 片段之间形成磷酸二酯键,用于 DNA 的连接和修复。
㉑ DNA 甲基化 (DNA methylation):DNA 修饰的一种形式,通常指胞嘧啶碱基 5' 位的甲基化,在基因表达调控和表观遗传中起重要作用。
㉒ DNA 聚合酶 (DNA polymerase):一类酶,催化 DNA 复制过程中 DNA 链的延伸。
㉓ DNA 修复 (DNA repair):细胞应对 DNA 损伤的多种机制,包括直接修复、切除修复、重组修复和跨损伤合成等,维持基因组的稳定性。
㉔ DNA 复制 (DNA replication):细胞分裂前,将 DNA 分子复制成两个完全相同的拷贝的过程,保证遗传信息的传递。
㉕ DNA 测序 (DNA sequencing):确定 DNA 分子核苷酸序列的技术,是分子生物学研究的重要手段。
㉖ 蛋白质的定向进化 (Directed evolution of proteins):在体外模拟自然选择的过程,通过随机突变和筛选,获得具有特定功能或性质的蛋白质的方法。
㉗ 酶 (Enzyme):具有生物催化功能的蛋白质或 RNA 分子,加速生物化学反应的速率。
㉘ 外显子 (Exon):基因编码区中,转录后保留在成熟 mRNA 中的序列。
㉙ 基因 (Gene):携带遗传信息的 DNA 序列,是遗传的基本单位,通常编码蛋白质或 RNA 分子。
㉚ 基因表达 (Gene expression):将基因中蕴含的遗传信息转化为功能性 RNA 或蛋白质分子的过程,包括转录和翻译等步骤。
㉛ 基因家族 (Gene family):由共同祖先基因通过基因重复事件产生的一组结构和功能上相关的基因。
㉜ 基因工程 (Genetic engineering):人为地对基因进行操作和改造的技术,也称重组 DNA 技术。
㉝ 基因组 (Genome):一个生物体或病毒所包含的全部遗传物质的总和,通常指 DNA (或 RNA)。
㉞ 基因组编辑技术 (Genome editing technologies):能够精确修改生物体基因组 DNA 序列的技术,例如 CRISPR-Cas9 系统、TALEN、ZFN 等。
㉟ 基因组文库 (Genomic library):将生物体的基因组 DNA 片段克隆到载体中构建的文库,代表生物体基因组的集合,用于基因组研究和基因分离。
㊱ 基因治疗 (Gene therapy):将外源基因导入靶细胞,以纠正或补偿缺陷基因,达到治疗疾病目的的生物医学技术。
㊲ 基因型 (Genotype):生物体的遗传组成,通常指特定基因或基因组的 DNA 序列。
㊳ 糖基化 (Glycosylation):蛋白质翻译后修饰的一种形式,将糖链添加到蛋白质分子上,影响蛋白质的折叠、稳定性、定位和功能。
㊴ 高尔基体 (Golgi apparatus):真核细胞中的细胞器,参与蛋白质的加工、修饰、分拣和运输。
㊵ 组蛋白 (Histone):染色质的主要蛋白质成分,富含碱性氨基酸,参与 DNA 的包装和染色质结构的形成。
㊶ 同源重组 (Homologous recombination):两条 DNA 分子之间交换同源序列的过程,在 DNA 修复、基因组多样性和基因工程中起重要作用。
㊷ 免疫共沉淀 (Immunoprecipitation):一种分离和纯化特定蛋白质及其相互作用蛋白的技术,利用抗体特异性结合目标蛋白,并通过沉淀方法分离复合物。
㊸ 内含子 (Intron):基因编码区中,转录后被剪接去除的序列。
㊹ 体外核糖体展示技术 (In vitro ribosome display):一种体外蛋白质定向进化技术,将 mRNA、核糖体和新生肽链形成稳定的复合物,用于筛选具有特定功能的蛋白质。
㊺ 反转录 PCR (RT-PCR, Reverse Transcription PCR):一种检测和定量 RNA 的 PCR 技术,首先将 RNA 反转录为 cDNA,再进行 PCR 扩增。
㊻ 激酶 (Kinase):一类酶,催化磷酸基团从 ATP 等供体转移到受体分子 (通常是蛋白质或脂类) 上,即磷酸化反应,在信号转导和代谢调控中起重要作用。
㊼ 液体活检 (Liquid biopsy):通过检测血液或其他体液中的循环肿瘤细胞、循环肿瘤 DNA 等生物标志物,实现对肿瘤进行诊断、预后评估和疗效监测的技术。
㊽ 长链非编码 RNA (lncRNA, Long non-coding RNA):长度超过 200 个核苷酸,不编码蛋白质的 RNA 分子,参与基因表达调控、染色质结构调控等多种生物学过程。
㊾ 分子伴侣 (Molecular chaperone):一类蛋白质,辅助其他蛋白质正确折叠、组装和转运,防止蛋白质错误折叠和聚集。
㊿ 分子靶向治疗 (Molecular targeted therapy):针对肿瘤细胞特有的分子靶点 (例如癌基因、信号通路分子) 设计和开发的治疗方法,具有靶向性强、副作用相对较小的优点。
<0xF0><0x9F><0xA7><0xB1> 单克隆抗体 (Monoclonal antibody):由单一 B 细胞克隆产生的抗体,具有高度的特异性和均一性,广泛应用于生物医学研究、诊断和治疗。
<0xF0><0x9F><0xA7><0xB2> mRNA (信使核糖核酸, Messenger RNA):将 DNA 上的遗传信息传递到核糖体,作为蛋白质合成模板的 RNA 分子。
<0xF0><0x9F><0xA7><0xB3> 突变 (Mutation):遗传物质 DNA 序列发生的改变,包括点突变、插入、缺失、染色体畸变等。
<0xF0><0x9F><0xA7><0xB4> 核糖核酸 (RNA, Ribonucleic acid):参与遗传信息传递和基因表达调控的生物大分子,由核糖核苷酸组成,单链结构为主。
<0xF0><0x9F><0xA7><0xB5> 核糖体 (Ribosome):细胞内合成蛋白质的分子机器,由 rRNA 和蛋白质组成,催化肽键的形成。
<0xF0><0x9F><0xA7><0xB6> 核糖体 RNA (rRNA, Ribosomal RNA):核糖体的组成成分,具有催化活性,参与蛋白质合成。
<0xF0><0x9F><0xA7><0xB7> 非编码 RNA (Non-coding RNA):不编码蛋白质的 RNA 分子,包括 rRNA、tRNA、miRNA、lncRNA 等,参与基因表达调控等多种生物学过程。
<0xF0><0x9F><0xA7><0xB8> 核小体 (Nucleosome):染色质的基本结构单元,由 DNA 缠绕组蛋白八聚体形成。
<0xF0><0x9F><0xA7><0xB9> 核苷酸 (Nucleotide):核酸的基本组成单元,由碱基、戊糖和磷酸组成。
<0xF0><0x9F><0xA7><0xBA> 操纵子 (Operon):原核生物基因表达调控的一种结构,由一组功能相关的基因、启动子、操纵位点等组成,实现基因的协同表达调控。
<0xF0><0x9F><0xA7><0xBB> 表观遗传 (Epigenetics):不涉及 DNA 序列改变,但可遗传的基因表达调控机制,例如 DNA 甲基化、组蛋白修饰、非编码 RNA 等。
<0xF0><0x9F><0xA7><0xBC> 表型 (Phenotype):生物体可观察到的性状特征,是基因型与环境相互作用的结果。
<0xF0><0x9F><0xA7><0xBD> 磷酸化 (Phosphorylation):蛋白质翻译后修饰的一种形式,将磷酸基团添加到蛋白质分子上,调控蛋白质的活性、相互作用和定位。
<0xF0><0x9F><0xA7><0xBE> 质粒 (Plasmid):细菌等细胞中独立于染色体 DNA 的小型环状 DNA 分子,常用于基因工程作为载体。
<0xF0><0x9F><0xA7><0xBF> 多聚酶链式反应 (PCR, Polymerase Chain Reaction):一种在体外扩增 DNA 片段的技术,具有高效、快速、灵敏的特点,广泛应用于分子生物学研究和诊断。
<0xF0><0x9F><0xA8><0x80> 蛋白质 (Protein):生命活动的主要承担者,由氨基酸通过肽键连接形成的多肽链折叠而成,具有多种结构和功能。
<0xF0><0x9F><0xA8><0x81> 蛋白质组学 (Proteomics):在整体水平上研究细胞、组织或生物体蛋白质的组成、结构、功能、相互作用和修饰等的技术和学科。
<0xF0><0x9F><0xA8><0x82> 蛋白质翻译后修饰 (PTM, Post-translational modification):蛋白质合成后发生的化学修饰,例如磷酸化、糖基化、泛素化等,调控蛋白质的功能和命运。
<0xF0><0x9F><0xA8><0x83> 启动子 (Promoter):基因上游的 DNA 序列,是 RNA 聚合酶结合和起始转录的位点,调控基因的转录起始。
<0xF0><0x9F><0xA8><0x84> 原核生物 (Prokaryote):细胞结构简单,没有细胞核和膜性细胞器的生物,例如细菌和古菌。
<0xF0><0x9F><0xA8><0x85> 定量 PCR (qPCR, Quantitative PCR):实时荧光 PCR,在 PCR 反应过程中实时监测荧光信号,实现对 DNA 或 RNA 模板进行定量分析的技术。
<0xF0><0x9F><0xA8><0x86> RNA 编辑 (RNA editing):RNA 分子序列在转录后发生的改变,例如碱基插入、缺失或替换,导致 RNA 序列与基因组 DNA 序列不一致。
<0xF0><0x9F><0xA8><0x87> RNA 聚合酶 (RNA polymerase):一类酶,催化转录过程中 RNA 链的合成。
<0xF0><0x9F><0xA8><0x88> RNA 干扰 (RNA interference, RNAi):由小 RNA 分子 (例如 siRNA、miRNA) 介导的基因沉默现象,在基因表达调控和基因治疗中具有重要应用。
<0xF0><0x9F><0xA8><0x89> RNA 剪接 (RNA splicing):真核生物 mRNA 前体加工过程,去除内含子,连接外显子,形成成熟 mRNA。
<0xF0><0x9F><0xA8><0x8A> RNA 测序 (RNA-Seq):一种高通量测序技术,对细胞或组织中的 RNA 进行测序,用于研究基因表达谱、可变剪接、新转录本发现等。
<0xF0><0x9F><0xA8><0x8B> 核糖体移码 (Ribosomal frameshifting):在翻译过程中,核糖体在 mRNA 上移动时发生移位,导致翻译的阅读框发生改变,产生与基因编码序列不同的蛋白质。
<0xF0><0x9F><0xA8><0x8C> Sanger 测序 (Sanger sequencing):一代测序技术,基于双脱氧核苷酸链终止法,用于 DNA 序列测定。
<0xF0><0x9F><0xA8><0x8D> 信号通路 (Signaling pathway):细胞接收和传递细胞外信号,并引起细胞应答的分子途径,通常由一系列蛋白质相互作用和修饰组成。
<0xF0><0x9F><0xA8><0x8E> siRNA (小干扰 RNA, Small interfering RNA):一类小 RNA 分子,能够特异性地靶向降解 mRNA,引起基因沉默,常用于 RNA 干扰实验。
<0xF0><0x9F><0xA8><0x8F> Southern blotting:一种分子杂交技术,用于检测 DNA 分子中特定序列的存在和大小。
<0xF0><0x9F><0xA8><0x90> 干细胞 (Stem cell):具有自我更新和多向分化潜能的细胞,在组织修复、再生医学和疾病治疗中具有重要应用价值。
<0xF0><0x9F><0xA8><0x91> 合成生物学 (Synthetic biology):一门新兴的交叉学科,旨在从工程学角度设计和构建新的生物元件、生物器件和生物系统,用于解决生物技术和医学领域的挑战。
<0xF0><0x9F><0xA8><0x92> 系统生物学 (Systems biology):从系统整体的角度研究生物学问题的学科,利用数学建模、计算机模拟等方法,整合多层次生物信息,理解生物系统的复杂性和动态性。
<0xF0><0x9F><0xA8><0x93> TALEN (转录激活因子样效应物核酸酶, Transcription activator-like effector nuclease):一种基因组编辑工具,由 TAL 效应物 DNA 结合域和核酸酶 FokI 组成,用于基因组的精确编辑。
<0xF0><0x9F><0xA8><0x94> 靶点 (Target):药物或治疗方法作用的特定分子或结构,例如蛋白质、基因、信号通路等。
<0xF0><0x9F><0xA8><0x95> 末端脱氧核苷酸转移酶 (Terminal deoxynucleotidyl transferase, TdT):一种 DNA 聚合酶,能够催化脱氧核苷酸在 DNA 链 3'-OH 末端进行非模板依赖性的聚合。
<0xF0><0x9F><0xA8><0x96> 终止密码子 (Stop codon):mRNA 序列中指示翻译终止的密码子,包括 UAA, UAG, UGA。
<0xF0><0x9F><0xA8><0x97> 转基因生物 (Transgenic organism):通过基因工程技术导入外源基因的生物,例如转基因植物、转基因动物、转基因微生物。
<0xF0><0x9F><0xA8><0x98> 翻译 (Translation):将 mRNA 上的遗传信息翻译成蛋白质氨基酸序列的过程,在核糖体上进行。
<0xF0><0x9F><0xA8><0x99> 翻译后修饰 (Post-translational modification):见 蛋白质翻译后修饰 (PTM, Post-translational modification)。
<0xF0><0x9F><0xA8><0x9A> tRNA (转移核糖核酸, Transfer RNA):在翻译过程中,携带特定氨基酸并识别 mRNA 密码子的 RNA 分子。
<0xF0><0x9F><0xA8><0x9B> 转录 (Transcription):以 DNA 为模板合成 RNA 的过程,由 RNA 聚合酶催化。
<0xF0><0x9F><0xA8><0x9C> 转录因子 (Transcription factor):一类蛋白质,能够结合到 DNA 上的特定序列 (顺式作用元件),调控基因的转录起始和转录速率。
<0xF0><0x9F><0xA8><0x9D> 泛素化 (Ubiquitination):蛋白质翻译后修饰的一种形式,将泛素分子连接到蛋白质分子上,标记蛋白质进行降解或调控其功能。
<0xF0><0x9F><0xA8><0x9E> 泛素-蛋白酶体系统 (Ubiquitin-proteasome system):细胞内主要的蛋白质降解途径,通过泛素标记靶蛋白,并由蛋白酶体降解。
<0xF0><0x9F><0xA8><0x9F> 病毒载体 (Viral vector):利用病毒作为基因传递工具,将外源基因导入靶细胞,常用于基因治疗和基因工程。
<0xF0><0x9F><0xA9><0x80> Western blotting:蛋白质印迹法,一种分子生物学技术,用于检测蛋白质的表达水平和分子量。
<0xF0><0x9F><0xA9><0x81> 酵母双杂交 (Yeast two-hybrid):一种研究蛋白质-蛋白质相互作用的遗传学方法,利用转录因子的结构特点,在酵母细胞中检测两个蛋白质是否相互作用。
<0xF0><0x9F><0xA9><0x82> 真核生物 (Eukaryote):细胞结构复杂,具有细胞核和膜性细胞器的生物,例如动物、植物、真菌和原生生物。
<0xF0><0x9F><0xA9><0x83> ZFN (锌指核酸酶, Zinc finger nuclease):一种基因组编辑工具,由锌指蛋白 DNA 结合域和核酸酶 FokI 组成,用于基因组的精确编辑。