返回首页

Lecture 07

第7讲学习讲义:Control of Gene Expression

第7讲学习讲义:Control of Gene Expression图解
同一个基因组之所以能产生不同细胞类型,关键在组合调控、染色质状态和反馈回路。
Lac operon
辅助理解图:乳糖操纵子:经典遗传开关,适合理解 promoter、operator、repressor 和诱导表达。 来源:Lac operon,Wikimedia Commons contributors,CC BY-SA 3.0。

对应课件:Lecture_7_Control_of_Gene_Expression.pdf

这一讲是整门课里最像“总控室”的一讲。前面你学过 DNA、RNA、蛋白质,现在要回答更难的问题:为什么同一个基因组,在不同细胞里会表现成完全不同的状态?

这讲的核心问题

  • 为什么同一个个体的不同细胞长得和功能差别这么大?
  • 基因转录是怎么被精确控制的?
  • DNA 结合蛋白如何识别特定序列?
  • 基因开关怎样整合多个输入?
  • 转录后层面还有哪些调控?

一、同一个基因组,为什么能产生不同细胞类型

课件开头强调:不同细胞在结构和功能上差别极大,但分化细胞通常仍保留完整基因组。

这件事的意义是:

  • 细胞分化通常不是靠“丢掉不用的基因”。
  • 而是靠“选择性表达不同基因”。

这也是克隆动物和核移植实验能成立的逻辑基础:

  • 即使是已分化细胞的细胞核,仍保留生成完整个体的遗传信息。

二、不同组织为什么有不同表达谱

课件展示了不同组织和肿瘤的表达模式差异。

你可以把 expression pattern 理解成:

  • 某个细胞此刻“打开了哪些基因,关闭了哪些基因”。

这决定了:

  • 细胞做什么工作。
  • 它分泌什么蛋白。
  • 它对什么信号敏感。
  • 它的代谢方式如何。

典型规律是:

  • 每个细胞并不会表达全部基因。
  • 而是只表达与其身份和状态相关的一部分。

三、基因表达可以在哪些层面被控制

这点非常重要,因为很多同学一看到“gene expression control”就只想到转录。

实际上可控制的层面很多:

  • 染色质开放程度。
  • 转录起始频率。
  • RNA 剪接方式。
  • RNA 输出。
  • RNA 稳定性。
  • 翻译效率。
  • 蛋白质稳定性和活性。

课件虽然重点放在转录和转录后调控,但你脑子里一定要有全景图。

四、DNA 结合蛋白如何识别特定序列

课件讲到 direct contact between DNA and protein involves hydrogen bonds 等内容。

核心思想是:

  • 蛋白不是把 DNA 全拆开来看碱基。
  • 它通常通过 DNA 大沟暴露出的化学特征来识别序列。

识别依赖:

  • 氢键。
  • 静电相互作用。
  • 形状互补。
  • DNA 局部弯曲性和结构特征。

五、常见 DNA 结合结构基序 motifs

这部分是考试爱考的分类题,你要做到“能认、能说用途”。

1. Helix-turn-helix,HTH

特点:

  • 两个螺旋通过一个转角连接。
  • 其中一个识别螺旋插入 DNA 大沟。

常见于:

  • 细菌调控蛋白。
  • 一些发育调控蛋白。

2. Homeodomain

它本质上属于 helix-turn-helix 相关家族,但在发育生物学中特别重要。

意义:

  • 参与胚胎模式建立和细胞命运决定。

3. Zinc finger

锌指的核心不是“锌负责直接识别 DNA”,而是:

  • 锌离子帮助稳定特定折叠结构。
  • 稳定后由蛋白特定表面与 DNA 接触。

锌指蛋白常见于真核调控蛋白。

4. Leucine zipper

亮氨酸拉链主要帮助:

  • 二聚化。

二聚化后,附近的 DNA 结合区才能更稳定地与 DNA 结合。

5. Helix-loop-helix,HLH

特点:

  • 螺旋之间由 loop 连接。
  • 常与二聚化和发育调控相关。

6. 其他基序

课件还提到 β-sheet、loops 等。你不用机械背所有形状,但要理解:

  • 不同蛋白可以用不同结构策略实现 DNA 识别。

六、如何找出调控蛋白和它的结合位点

课件列出了一系列实验方法,这些方法非常常见。

1. EMSA,gel mobility shift assay

原理:

  • DNA 和蛋白结合后,复合物在胶上迁移更慢。

用途:

  • 判断蛋白是否和某段 DNA 结合。

2. DNA affinity chromatography

用途:

  • 用已知 DNA 序列去“钓”能结合它的蛋白。

3. DNA footprinting

用途:

  • 精细定位蛋白结合在 DNA 的哪一段。

思路:

  • 蛋白盖住的区域不容易被切割,因此留下“脚印”。

4. ChIP,chromatin immunoprecipitation

用途:

  • 在细胞真实染色质环境中检测某蛋白是否结合某段 DNA。

这是把“体外结合”推进到“体内结合证据”的关键技术。

5. Phylogenetic footprinting

用途:

  • 通过跨物种保守序列推测调控元件。

理由是:

  • 真正重要的调控位点更可能在进化中被保留下来。

七、遗传开关 genetic switch:基因不是连续开,而是受逻辑控制

1. 细菌简单开关

细菌中常见:

  • 一个环境信号影响抑制子或激活子。
  • 决定某一组基因是否转录。

这类系统像最基础的 if-else 逻辑。

2. 多输入整合

更复杂的基因开关会同时读取多个信号,例如:

  • 营养状态。
  • 应激状态。
  • 发育位置。

最终只有在特定组合条件下才开启目标基因。

八、抑制子和激活子怎么工作

1. Repressor 抑制子

作用:

  • 降低转录概率。

方法可能包括:

  • 阻止聚合酶结合。
  • 阻止转录起始复合体组装。
  • 招募染色质沉默因子。

2. Activator 激活子

作用:

  • 提高转录概率。

方法可能包括:

  • 招募转录机器。
  • 招募染色质重塑和组蛋白修饰酶。
  • 稳定启动复合体。

3. 同一个蛋白可能既能激活也能抑制

这取决于:

  • 它结合的位置。
  • 搭配的辅因子。
  • 当前细胞环境。

九、DNA looping:为什么远处元件也能控制基因

DNA 不是一根永远拉直的棍子,而是可弯曲、可折环。

因此:

  • 远处的调控元件可以通过成环接近启动子。
  • 不同蛋白之间可以通过 DNA 空间折叠相互作用。

这在真核基因调控里尤其常见。

十、真核基因调控比细菌复杂在哪里

课件强调 eukaryotic gene regulation versus prokaryotic regulation。

真核更复杂的原因包括:

  • DNA 被染色质包装。
  • 调控元件可远距离作用。
  • 细胞类型多,发育阶段多。
  • 同一基因常整合多个输入。

典型真核调控区可能包括:

  • 核心启动子。
  • 近端调控元件。
  • 增强子 enhancer。
  • 沉默子 silencer。
  • 染色质边界元件。

十一、真核激活蛋白如何改变局部染色质

课件列出四种 ways activator proteins can direct local alterations in chromatin。

你可以归纳为几类:

  • 招募组蛋白乙酰转移酶等修饰酶,让染色质更开放。
  • 招募 ATP 依赖染色质重塑复合物。
  • 促进通用转录因子和 RNA Pol II 组装。
  • 招募 Mediator 等桥接因子。

Histone acetylation 为什么常和转录活跃相关

因为乙酰化常减少组蛋白尾部正电特征,削弱其与 DNA 的紧密结合,并有利于招募特定 reader 蛋白。

十二、协同作用 synergy:多个弱调控合起来变强

转录调控常不是某一个因子单独决定,而是多个因子协同。

这使系统具有:

  • 更高特异性。
  • 更强组合编码能力。
  • 对多种输入的整合能力。

十三、组合调控 combinatorial control:复杂性的真正来源

课件中 eve 基因条纹表达是经典例子。

核心思想是:

  • 不同区域有不同调控蛋白浓度组合。
  • 同一个基因只在特定组合条件下被激活。

这非常像电路逻辑:

  • 不是单一开关,而是多输入逻辑门。

这也是为什么有限数量的调控蛋白可以产生极其复杂的表达模式。

十四、细胞类型如何被稳定维持:反馈和调控回路

1. 正反馈 positive feedback

如果某个调控因子能促进自身表达,就可能形成稳定开态。

意义:

  • 帮助细胞“记住”某种身份。

2. 转录回路 circuits

多个因子彼此激活或抑制,可以形成:

  • 双稳态。
  • 顺序表达。
  • 发育程序。

因此细胞命运不是简单一条直线,而是调控网络的稳定状态。

十五、DNA 甲基化与 CpG islands

1. DNA methylation

DNA 甲基化常与基因沉默相关,尤其在真核调控和表观遗传中很重要。

2. CpG islands

CpG islands 是富含 CpG 位点的区域,常位于基因启动子附近。

它们的甲基化状态常影响:

  • 启动子是否容易被激活。
  • 基因是否处于沉默状态。

十六、基因组印记 genomic imprinting

这是一类很容易考概念理解的问题。

它的关键不是“基因被删除”,而是:

  • 来自父方和母方的等位基因可能因为甲基化等表观遗传标记不同,而表现出不同表达状态。

因此某些基因只表达父源版本,或只表达母源版本。

十七、X 染色体失活

在雌性哺乳动物中,两条 X 染色体如果都完全活跃,表达剂量会失衡。

因此会发生:

  • 一条 X 染色体被整体沉默。

这说明表观遗传调控可以在非常大尺度上发生。

十八、转录后调控:表达控制并没有在转录结束后停下

课件最后一大部分讲的就是 post-transcriptional control。

1. Transcription attenuation

常见于原核,指的是:

  • 转录过程本身在早期就被调节是否继续延长。

2. Riboswitch

某些 RNA 自身可结合小分子并改变构象,从而影响转录或翻译。

这说明 RNA 不只是被动中间体,也可以直接感知环境。

3. Alternative splicing

不同剪接方式可产生不同 mRNA,从而让一个基因产生多种蛋白。

4. 终止位点或 poly(A) 位点选择

不同 3' 端形成方式会改变:

  • mRNA 稳定性。
  • 翻译效率。
  • 调控元件长度。

5. RNA editing

RNA 序列在转录后还可被修改,导致与 DNA 模板不完全一致。

6. RNA nuclear export

哪些 RNA 能出核、何时出核,也是调控。

7. mRNA localization

mRNA 可以被运送到细胞特定位置后再翻译,这对细胞极性和发育很重要。

8. mRNA stability

同样的转录速率下,mRNA 半衰期不同,会造成表达量明显差异。

9. Translational control

即使 mRNA 已存在,也不一定马上被高效翻译。

调控方式包括:

  • 起始因子活性改变。
  • 5'UTR / 3'UTR 上调控位点作用。
  • IRES 等特殊起始方式。

十九、UTR 为什么重要

未翻译区 untranslated regions 并不是没用。

它们常包含:

  • RNA 结合蛋白识别位点。
  • miRNA 结合位点。
  • 影响翻译效率和稳定性的顺式元件。

二十、miRNA 和 RNAi:RNA 也能“沉默别人”

1. miRNA

miRNA 是短小调控 RNA,通常通过与目标 mRNA 配对来:

  • 抑制翻译。
  • 促进降解。

2. P-body

Processing body 是 mRNA 被储存、降解或沉默处理的重要场所之一。

3. RNA interference,RNAi

RNAi 可作为防御机制,也被细胞利用来调控基因表达。

它说明:

  • RNA 可以参与序列特异性的沉默过程。

二十一、把这一讲串成一句话

同一个基因组之所以能产生不同细胞类型,是因为基因表达在转录前、转录中、转录后乃至翻译阶段都受到精细控制;其中 DNA 结合蛋白、染色质状态、组合式遗传开关以及 miRNA 等转录后机制共同构成了细胞命运和功能的调控网络。

二十二、常见误区

  • “不同细胞不同,是因为它们 DNA 不一样”通常不对,关键差异主要在表达程序。
  • “基因调控就是转录因子绑定启动子”太简单,真实系统包含染色质、远端元件和多层后续调控。
  • “UTR 不编码蛋白,所以不重要”是错的。
  • “miRNA 只是降解 RNA”不完整,它也可抑制翻译并影响稳定性。
  • “表观遗传只和 DNA 甲基化有关”太窄。

二十三、你必须会的关键词

  • Gene expression pattern:基因表达谱。
  • Transcription factor:转录因子。
  • HTH / Homeodomain / Zinc finger / Leucine zipper / HLH:常见 DNA 结合基序。
  • EMSA:凝胶迁移率变动实验。
  • Footprinting:DNA 足迹分析。
  • ChIP:染色质免疫沉淀。
  • Enhancer:增强子。
  • Combinatorial control:组合调控。
  • Positive feedback:正反馈。
  • DNA methylation:DNA 甲基化。
  • CpG island:CpG 岛。
  • Genomic imprinting:基因组印记。
  • Alternative splicing:可变剪接。
  • miRNA:微小 RNA。
  • RNAi:RNA 干扰。

二十四、自测题

1. 为什么同一个体不同细胞会有完全不同表型?

答题关键:

  • 基因组基本相同,但表达谱不同。

2. DNA 结合蛋白如何识别特定序列?

答题关键:

  • 通过大沟中的化学特征、氢键、静电和形状互补。

3. 组合调控为什么能大幅增加系统复杂度?

答题关键:

  • 不同因子组合可产生大量逻辑状态和空间模式。

4. CpG 岛和基因组印记分别反映了什么调控思想?

答题关键:

  • DNA 甲基化影响表达。
  • 父母来源不同可导致表达差异。

5. 转录后调控至少举出四种方式。

答题关键:

  • 剪接、RNA 编辑、核输出、定位、稳定性、翻译控制、miRNA 等。

二十五、考前速记版

  • 不同细胞的差异主要来自不同基因表达程序。
  • DNA 结合蛋白通过特定结构基序识别特定 DNA 序列。
  • 真核基因调控高度依赖增强子、染色质和组合调控。
  • 正反馈和调控回路帮助稳定细胞命运。
  • DNA 甲基化、印记和 X 失活体现表观遗传控制。
  • 表达控制在转录后仍继续,包括剪接、稳定性、翻译和 miRNA 调控。

二十六、深入扩展:增强子、启动子和转录因子到底怎么配合

很多同学会背 enhancer 和 promoter,但真正答题时说不清它们的分工。

启动子 promoter 更像“基础起跑线”

它的核心作用是:

  • 定义转录起始位置附近的基础装配区域。
  • 让通用转录机器有地方组装。

增强子 enhancer 更像“远程调度台”

它的核心作用是:

  • 结合特定调控蛋白。
  • 提高某个基因在特定条件下被转录的概率。
  • 能在相对较远距离发挥作用。

为什么增强子可以离基因很远还起作用

因为 DNA 可以形成 loop,把远处增强子和启动子空间上拉近。

所以基因调控不是按“线性距离”理解,而要按“三维空间接触”理解。

二十七、DNA 结合基序为什么常和二聚化有关

像 leucine zipper 和 HLH,不仅是 DNA 识别结构,也是蛋白-蛋白相互作用平台。

为什么二聚化很有用

  • 增加结合稳定性。
  • 提高识别特异性。
  • 允许不同亚基组合,形成更多调控逻辑。

例如:

  • A 和 A 形成同源二聚体。
  • A 和 B 形成异源二聚体。

这两种组合即使都绑定相似 DNA 区域,也可能招募不同辅因子,产生不同输出。

这就是“有限数量调控蛋白也能组合出巨大复杂度”的一个分子基础。

二十八、为什么不存在一个简单的 DNA 识别氨基酸密码表

课件问过这个问题。答案是:通常不存在那种像遗传密码那样简单的一一对应关系。

原因包括:

  • 蛋白与 DNA 识别依赖整体三维结构,不只依赖单个氨基酸。
  • 一个氨基酸残基是否与 DNA 碱基接触,要看空间位置。
  • 同一序列可能通过不同骨架构型来识别。
  • 识别还涉及 DNA 弯曲性和局部形状。

所以 DNA 识别是“结构和化学的上下文问题”,不是纯线性配码问题。

二十九、为什么真核调控特别强调 chromatin context

对细菌来说,DNA 大多更直接暴露;对真核来说,DNA 常被核小体包裹。

因此一个转录因子想发挥作用,先得回答一个前提问题:

  • 目标位点此刻是否可被访问。

这就使真核调控天然多了一层:

  • 染色质状态决定“能不能接近”。
  • 转录因子和辅因子再决定“接近之后做什么”。

三十、什么叫 pioneer factor 先锋因子

虽然课件没有专门展开这个词,但理解真核调控时很有帮助。

先锋因子可以粗略理解为:

  • 一类更擅长在相对封闭染色质中先占位的调控蛋白。
  • 它们的结合可能为后续更多因子的进入创造条件。

你可以把它看作“先把门撬开的人”。

三十一、转录协同 synergy 为什么不是简单相加

如果两个激活子各自都能提高一点转录水平,它们一起时有时会提升远超相加值。

这是因为它们可能同时完成不同工作:

  • 一个负责开染色质。
  • 一个负责招募转录机器。
  • 一个负责稳定 enhancer-promoter loop。

所以协同的本质是:

  • 多个步骤共同受益,而不是同一步骤重复加码。

三十二、Eve 条纹为什么是组合调控经典案例

因为它非常直观地说明:

  • 同一个基因在胚胎不同位置接收到不同调控蛋白浓度组合。
  • 只有某些组合满足条件时,基因才在那个位置表达。

这说明发育图案不是“一个基因一种位置”,而是:

  • 同一个基因通过不同调控模块读取不同空间信息。

三十三、为什么正反馈能让细胞“记住”身份

正反馈的本质是:

  • 某因子越高,越促进自身或同一程序维持。

这样一来,哪怕最初只是一个短暂信号,一旦跨过阈值,就可能把系统推入稳定状态。

这对细胞分化非常关键,因为发育不能总依赖最初信号持续存在,细胞必须能“自我维持”某种身份。

三十四、X 染色体失活为什么是表观遗传的经典模型

因为它同时满足表观遗传的几个关键特征:

  • 不改变 DNA 序列。
  • 却大范围改变染色体活性。
  • 能在细胞分裂后稳定维持。

它说明:

  • 基因调控不一定只发生在单个基因水平。
  • 也可以发生在整条染色体尺度。

三十五、为什么 DNA methylation 常与长期沉默相关

相较于某些瞬时转录因子结合事件,DNA 甲基化更适合承担“较稳定状态标记”。

原因包括:

  • 可在复制后通过相关机制被维护。
  • 可影响特定蛋白是否能结合启动子区域。
  • 可招募抑制性染色质复合物。

所以 DNA methylation 常和长期沉默、细胞记忆、印记等现象联系在一起。

三十六、miRNA 是怎么生成的

课件提到 miRNA,但如果你想真正理解它怎么调控,最好再补一下生成过程。

粗略流程可记为:

1. 先转录成较长初级转录本 pri-miRNA。 2. 在细胞核中加工成前体 pre-miRNA。 3. 输出到细胞质。 4. 再被加工成短双链 RNA。 5. 其中一条链装载进 RISC 复合体。 6. 引导复合体去识别靶 mRNA。

miRNA 为什么常结合 3'UTR

因为 3'UTR 是调控信息富集区域,而且不直接改变蛋白编码序列,更适合作为调控平台。

三十七、miRNA 配对不一定要求完全匹配

这是它和某些 RNAi 场景的重要差异。

很多动物 miRNA 只需要“种子区”较好匹配,就能:

  • 抑制翻译。
  • 加速 mRNA 去腺苷酸化和降解。

这让一个 miRNA 常常能够调控一批相关 mRNA,而不是只盯住一个靶标。

三十八、mRNA 稳定性为什么是表达量的重要变量

你可以把一个基因的最终 RNA 水平粗略看成两个因素共同决定:

  • 生产速度有多快。
  • 降解速度有多快。

因此两个基因即使转录速率差不多,只要稳定性不同,最终丰度也可能差很多。

这就是为什么 AU-rich elements、miRNA 位点、RNA 结合蛋白等都能深刻影响表达结果。

三十九、为什么很多调控最后都集中到 translation initiation

因为一旦起始成功,后续延长通常比较顺。

所以控制起始往往是成本最低、收益最高的调控点。细胞可通过改变:

  • 起始因子磷酸化状态。
  • cap 依赖招募效率。
  • UTR 上阻遏结构。
  • IRES 使用情况。

来快速响应环境变化。

四十、如果考试问“细胞分化为什么稳定”,可以怎么答

推荐思路:

1. 不同细胞表达不同转录因子组合。 2. 转录因子通过正反馈和互相抑制形成稳定网络。 3. 染色质状态和 DNA 甲基化帮助维持长期沉默或激活。 4. miRNA 和转录后机制进一步清除不符合该细胞身份的转录本。

这样就把转录、表观遗传和转录后调控都串起来了。