返回首页

Lecture 07

第7讲学习讲义：Control of Gene Expression

**辅助理解图：**乳糖操纵子：经典遗传开关，适合理解 promoter、operator、repressor 和诱导表达。来源：Lac operon，Wikimedia Commons contributors，CC BY-SA 3.0。

课件截图辅助理解

以下图片来自本地课程课件，仅随私有仓库复习使用。重点看图中机制关系，不需要逐字背图。

**Levels of gene expression control** Lecture_7_Control_of_Gene_Expression.pdf · page 5

**DNA-binding motifs in regulatory proteins** Lecture_7_Control_of_Gene_Expression.pdf · page 9

**Combinatorial control of gene expression** Lecture_7_Control_of_Gene_Expression.pdf · page 40

对应课件：Lecture_7_Control_of_Gene_Expression.pdf

这一讲是整门课里最像“总控室”的一讲。前面你学过 DNA、RNA、蛋白质，现在要回答更难的问题：为什么同一个基因组，在不同细胞里会表现成完全不同的状态？

这讲的核心问题

为什么同一个个体的不同细胞长得和功能差别这么大？
基因转录是怎么被精确控制的？
DNA 结合蛋白如何识别特定序列？
基因开关怎样整合多个输入？
转录后层面还有哪些调控？

一、同一个基因组，为什么能产生不同细胞类型

课件开头强调：不同细胞在结构和功能上差别极大，但分化细胞通常仍保留完整基因组。

这件事的意义是：

细胞分化通常不是靠“丢掉不用的基因”。
而是靠“选择性表达不同基因”。

这也是克隆动物和核移植实验能成立的逻辑基础：

即使是已分化细胞的细胞核，仍保留生成完整个体的遗传信息。

二、不同组织为什么有不同表达谱

课件展示了不同组织和肿瘤的表达模式差异。

你可以把 expression pattern 理解成：

某个细胞此刻“打开了哪些基因，关闭了哪些基因”。

这决定了：

细胞做什么工作。
它分泌什么蛋白。
它对什么信号敏感。
它的代谢方式如何。

典型规律是：

每个细胞并不会表达全部基因。
而是只表达与其身份和状态相关的一部分。

三、基因表达可以在哪些层面被控制

这点非常重要，因为很多同学一看到“gene expression control”就只想到转录。

实际上可控制的层面很多：

染色质开放程度。
转录起始频率。
RNA 剪接方式。
RNA 输出。
RNA 稳定性。
翻译效率。
蛋白质稳定性和活性。

课件虽然重点放在转录和转录后调控，但你脑子里一定要有全景图。

四、DNA 结合蛋白如何识别特定序列

课件讲到 direct contact between DNA and protein involves hydrogen bonds 等内容。

核心思想是：

蛋白不是把 DNA 全拆开来看碱基。
它通常通过 DNA 大沟暴露出的化学特征来识别序列。

识别依赖：

氢键。
静电相互作用。
形状互补。
DNA 局部弯曲性和结构特征。

五、常见 DNA 结合结构基序 motifs

这部分是考试爱考的分类题，你要做到“能认、能说用途”。

1. Helix-turn-helix，HTH

特点：

两个螺旋通过一个转角连接。
其中一个识别螺旋插入 DNA 大沟。

常见于：

细菌调控蛋白。
一些发育调控蛋白。

2. Homeodomain

它本质上属于 helix-turn-helix 相关家族，但在发育生物学中特别重要。

意义：

参与胚胎模式建立和细胞命运决定。

3. Zinc finger

锌指的核心不是“锌负责直接识别 DNA”，而是：

锌离子帮助稳定特定折叠结构。
稳定后由蛋白特定表面与 DNA 接触。

锌指蛋白常见于真核调控蛋白。

4. Leucine zipper

亮氨酸拉链主要帮助：

二聚化。

二聚化后，附近的 DNA 结合区才能更稳定地与 DNA 结合。

5. Helix-loop-helix，HLH

特点：

螺旋之间由 loop 连接。
常与二聚化和发育调控相关。

6. 其他基序

课件还提到 β-sheet、loops 等。你不用机械背所有形状，但要理解：

不同蛋白可以用不同结构策略实现 DNA 识别。

六、如何找出调控蛋白和它的结合位点

课件列出了一系列实验方法，这些方法非常常见。

1. EMSA，gel mobility shift assay

原理：

DNA 和蛋白结合后，复合物在胶上迁移更慢。

用途：

判断蛋白是否和某段 DNA 结合。

2. DNA affinity chromatography

用途：

用已知 DNA 序列去“钓”能结合它的蛋白。

3. DNA footprinting

用途：

精细定位蛋白结合在 DNA 的哪一段。

思路：

蛋白盖住的区域不容易被切割，因此留下“脚印”。

4. ChIP，chromatin immunoprecipitation

用途：

在细胞真实染色质环境中检测某蛋白是否结合某段 DNA。

这是把“体外结合”推进到“体内结合证据”的关键技术。

5. Phylogenetic footprinting

用途：

通过跨物种保守序列推测调控元件。

理由是：

真正重要的调控位点更可能在进化中被保留下来。

七、遗传开关 genetic switch：基因不是连续开，而是受逻辑控制

1. 细菌简单开关

细菌中常见：

一个环境信号影响抑制子或激活子。
决定某一组基因是否转录。

这类系统像最基础的 if-else 逻辑。

2. 多输入整合

更复杂的基因开关会同时读取多个信号，例如：

营养状态。
应激状态。
发育位置。

最终只有在特定组合条件下才开启目标基因。

八、抑制子和激活子怎么工作

1. Repressor 抑制子

作用：

降低转录概率。

方法可能包括：

阻止聚合酶结合。
阻止转录起始复合体组装。
招募染色质沉默因子。

2. Activator 激活子

作用：

提高转录概率。

方法可能包括：

招募转录机器。
招募染色质重塑和组蛋白修饰酶。
稳定启动复合体。

3. 同一个蛋白可能既能激活也能抑制

这取决于：

它结合的位置。
搭配的辅因子。
当前细胞环境。

九、DNA looping：为什么远处元件也能控制基因

DNA 不是一根永远拉直的棍子，而是可弯曲、可折环。

因此：

远处的调控元件可以通过成环接近启动子。
不同蛋白之间可以通过 DNA 空间折叠相互作用。

这在真核基因调控里尤其常见。

十、真核基因调控比细菌复杂在哪里

课件强调 eukaryotic gene regulation versus prokaryotic regulation。

真核更复杂的原因包括：

DNA 被染色质包装。
调控元件可远距离作用。
细胞类型多，发育阶段多。
同一基因常整合多个输入。

典型真核调控区可能包括：

核心启动子。
近端调控元件。
增强子 enhancer。
沉默子 silencer。
染色质边界元件。

十一、真核激活蛋白如何改变局部染色质

课件列出四种 ways activator proteins can direct local alterations in chromatin。

你可以归纳为几类：

招募组蛋白乙酰转移酶等修饰酶，让染色质更开放。
招募 ATP 依赖染色质重塑复合物。
促进通用转录因子和 RNA Pol II 组装。
招募 Mediator 等桥接因子。

Histone acetylation 为什么常和转录活跃相关

因为乙酰化常减少组蛋白尾部正电特征，削弱其与 DNA 的紧密结合，并有利于招募特定 reader 蛋白。

十二、协同作用 synergy：多个弱调控合起来变强

转录调控常不是某一个因子单独决定，而是多个因子协同。

这使系统具有：

更高特异性。
更强组合编码能力。
对多种输入的整合能力。

十三、组合调控 combinatorial control：复杂性的真正来源

课件中 eve 基因条纹表达是经典例子。

核心思想是：

不同区域有不同调控蛋白浓度组合。
同一个基因只在特定组合条件下被激活。

这非常像电路逻辑：

不是单一开关，而是多输入逻辑门。

这也是为什么有限数量的调控蛋白可以产生极其复杂的表达模式。

十四、细胞类型如何被稳定维持：反馈和调控回路

1. 正反馈 positive feedback

如果某个调控因子能促进自身表达，就可能形成稳定开态。

意义：

帮助细胞“记住”某种身份。

2. 转录回路 circuits

多个因子彼此激活或抑制，可以形成：

双稳态。
顺序表达。
发育程序。

因此细胞命运不是简单一条直线，而是调控网络的稳定状态。

十五、DNA 甲基化与 CpG islands

1. DNA methylation

DNA 甲基化常与基因沉默相关，尤其在真核调控和表观遗传中很重要。

2. CpG islands

CpG islands 是富含 CpG 位点的区域，常位于基因启动子附近。

它们的甲基化状态常影响：

启动子是否容易被激活。
基因是否处于沉默状态。

十六、基因组印记 genomic imprinting

这是一类很容易考概念理解的问题。

它的关键不是“基因被删除”，而是：

来自父方和母方的等位基因可能因为甲基化等表观遗传标记不同，而表现出不同表达状态。

因此某些基因只表达父源版本，或只表达母源版本。

十七、X 染色体失活

在雌性哺乳动物中，两条 X 染色体如果都完全活跃，表达剂量会失衡。

因此会发生：

一条 X 染色体被整体沉默。

这说明表观遗传调控可以在非常大尺度上发生。

十八、转录后调控：表达控制并没有在转录结束后停下

课件最后一大部分讲的就是 post-transcriptional control。

1. Transcription attenuation

常见于原核，指的是：

转录过程本身在早期就被调节是否继续延长。

2. Riboswitch

某些 RNA 自身可结合小分子并改变构象，从而影响转录或翻译。

这说明 RNA 不只是被动中间体，也可以直接感知环境。

3. Alternative splicing

不同剪接方式可产生不同 mRNA，从而让一个基因产生多种蛋白。

4. 终止位点或 poly(A) 位点选择

不同 3' 端形成方式会改变：

mRNA 稳定性。
翻译效率。
调控元件长度。

5. RNA editing

RNA 序列在转录后还可被修改，导致与 DNA 模板不完全一致。

6. RNA nuclear export

哪些 RNA 能出核、何时出核，也是调控。

7. mRNA localization

mRNA 可以被运送到细胞特定位置后再翻译，这对细胞极性和发育很重要。

8. mRNA stability

同样的转录速率下，mRNA 半衰期不同，会造成表达量明显差异。

9. Translational control

即使 mRNA 已存在，也不一定马上被高效翻译。

调控方式包括：

起始因子活性改变。
5'UTR / 3'UTR 上调控位点作用。
IRES 等特殊起始方式。

十九、UTR 为什么重要

未翻译区 untranslated regions 并不是没用。

它们常包含：

RNA 结合蛋白识别位点。
miRNA 结合位点。
影响翻译效率和稳定性的顺式元件。

二十、miRNA 和 RNAi：RNA 也能“沉默别人”

1. miRNA

miRNA 是短小调控 RNA，通常通过与目标 mRNA 配对来：

抑制翻译。
促进降解。

2. P-body

Processing body 是 mRNA 被储存、降解或沉默处理的重要场所之一。

3. RNA interference，RNAi

RNAi 可作为防御机制，也被细胞利用来调控基因表达。

它说明：

RNA 可以参与序列特异性的沉默过程。

二十一、把这一讲串成一句话

同一个基因组之所以能产生不同细胞类型，是因为基因表达在转录前、转录中、转录后乃至翻译阶段都受到精细控制；其中 DNA 结合蛋白、染色质状态、组合式遗传开关以及 miRNA 等转录后机制共同构成了细胞命运和功能的调控网络。

二十二、常见误区

“不同细胞不同，是因为它们 DNA 不一样”通常不对，关键差异主要在表达程序。
“基因调控就是转录因子绑定启动子”太简单，真实系统包含染色质、远端元件和多层后续调控。
“UTR 不编码蛋白，所以不重要”是错的。
“miRNA 只是降解 RNA”不完整，它也可抑制翻译并影响稳定性。
“表观遗传只和 DNA 甲基化有关”太窄。

二十三、你必须会的关键词

Gene expression pattern：基因表达谱。
Transcription factor：转录因子。
HTH / Homeodomain / Zinc finger / Leucine zipper / HLH：常见 DNA 结合基序。
EMSA：凝胶迁移率变动实验。
Footprinting：DNA 足迹分析。
ChIP：染色质免疫沉淀。
Enhancer：增强子。
Combinatorial control：组合调控。
Positive feedback：正反馈。
DNA methylation：DNA 甲基化。
CpG island：CpG 岛。
Genomic imprinting：基因组印记。
Alternative splicing：可变剪接。
miRNA：微小 RNA。
RNAi：RNA 干扰。

二十四、自测题

1. 为什么同一个体不同细胞会有完全不同表型？

答题关键：

基因组基本相同，但表达谱不同。

2. DNA 结合蛋白如何识别特定序列？

答题关键：

通过大沟中的化学特征、氢键、静电和形状互补。

3. 组合调控为什么能大幅增加系统复杂度？

答题关键：

不同因子组合可产生大量逻辑状态和空间模式。

4. CpG 岛和基因组印记分别反映了什么调控思想？

答题关键：

DNA 甲基化影响表达。
父母来源不同可导致表达差异。

5. 转录后调控至少举出四种方式。

答题关键：

剪接、RNA 编辑、核输出、定位、稳定性、翻译控制、miRNA 等。

二十五、考前速记版

不同细胞的差异主要来自不同基因表达程序。
DNA 结合蛋白通过特定结构基序识别特定 DNA 序列。
真核基因调控高度依赖增强子、染色质和组合调控。
正反馈和调控回路帮助稳定细胞命运。
DNA 甲基化、印记和 X 失活体现表观遗传控制。
表达控制在转录后仍继续，包括剪接、稳定性、翻译和 miRNA 调控。

二十六、深入扩展：增强子、启动子和转录因子到底怎么配合

很多同学会背 enhancer 和 promoter，但真正答题时说不清它们的分工。

启动子 promoter 更像“基础起跑线”

它的核心作用是：

定义转录起始位置附近的基础装配区域。
让通用转录机器有地方组装。

增强子 enhancer 更像“远程调度台”

它的核心作用是：

结合特定调控蛋白。
提高某个基因在特定条件下被转录的概率。
能在相对较远距离发挥作用。

为什么增强子可以离基因很远还起作用

因为 DNA 可以形成 loop，把远处增强子和启动子空间上拉近。

所以基因调控不是按“线性距离”理解，而要按“三维空间接触”理解。

二十七、DNA 结合基序为什么常和二聚化有关

像 leucine zipper 和 HLH，不仅是 DNA 识别结构，也是蛋白-蛋白相互作用平台。

为什么二聚化很有用

增加结合稳定性。
提高识别特异性。
允许不同亚基组合，形成更多调控逻辑。

例如：

A 和 A 形成同源二聚体。
A 和 B 形成异源二聚体。

这两种组合即使都绑定相似 DNA 区域，也可能招募不同辅因子，产生不同输出。

这就是“有限数量调控蛋白也能组合出巨大复杂度”的一个分子基础。

二十八、为什么不存在一个简单的 DNA 识别氨基酸密码表

课件问过这个问题。答案是：通常不存在那种像遗传密码那样简单的一一对应关系。

原因包括：

蛋白与 DNA 识别依赖整体三维结构，不只依赖单个氨基酸。
一个氨基酸残基是否与 DNA 碱基接触，要看空间位置。
同一序列可能通过不同骨架构型来识别。
识别还涉及 DNA 弯曲性和局部形状。

所以 DNA 识别是“结构和化学的上下文问题”，不是纯线性配码问题。

二十九、为什么真核调控特别强调 chromatin context

对细菌来说，DNA 大多更直接暴露；对真核来说，DNA 常被核小体包裹。

因此一个转录因子想发挥作用，先得回答一个前提问题：

目标位点此刻是否可被访问。

这就使真核调控天然多了一层：

染色质状态决定“能不能接近”。
转录因子和辅因子再决定“接近之后做什么”。

三十、什么叫 pioneer factor 先锋因子

虽然课件没有专门展开这个词，但理解真核调控时很有帮助。

先锋因子可以粗略理解为：

一类更擅长在相对封闭染色质中先占位的调控蛋白。
它们的结合可能为后续更多因子的进入创造条件。

你可以把它看作“先把门撬开的人”。

三十一、转录协同 synergy 为什么不是简单相加

如果两个激活子各自都能提高一点转录水平，它们一起时有时会提升远超相加值。

这是因为它们可能同时完成不同工作：

一个负责开染色质。
一个负责招募转录机器。
一个负责稳定 enhancer-promoter loop。

所以协同的本质是：

多个步骤共同受益，而不是同一步骤重复加码。

三十二、Eve 条纹为什么是组合调控经典案例

因为它非常直观地说明：

同一个基因在胚胎不同位置接收到不同调控蛋白浓度组合。
只有某些组合满足条件时，基因才在那个位置表达。

这说明发育图案不是“一个基因一种位置”，而是：

同一个基因通过不同调控模块读取不同空间信息。

三十三、为什么正反馈能让细胞“记住”身份

正反馈的本质是：

某因子越高，越促进自身或同一程序维持。

这样一来，哪怕最初只是一个短暂信号，一旦跨过阈值，就可能把系统推入稳定状态。

这对细胞分化非常关键，因为发育不能总依赖最初信号持续存在，细胞必须能“自我维持”某种身份。

三十四、X 染色体失活为什么是表观遗传的经典模型

因为它同时满足表观遗传的几个关键特征：

不改变 DNA 序列。
却大范围改变染色体活性。
能在细胞分裂后稳定维持。

它说明：

基因调控不一定只发生在单个基因水平。
也可以发生在整条染色体尺度。

三十五、为什么 DNA methylation 常与长期沉默相关

相较于某些瞬时转录因子结合事件，DNA 甲基化更适合承担“较稳定状态标记”。

原因包括：

可在复制后通过相关机制被维护。
可影响特定蛋白是否能结合启动子区域。
可招募抑制性染色质复合物。

所以 DNA methylation 常和长期沉默、细胞记忆、印记等现象联系在一起。

三十六、miRNA 是怎么生成的

课件提到 miRNA，但如果你想真正理解它怎么调控，最好再补一下生成过程。

粗略流程可记为：

1. 先转录成较长初级转录本 pri-miRNA。 2. 在细胞核中加工成前体 pre-miRNA。 3. 输出到细胞质。 4. 再被加工成短双链 RNA。 5. 其中一条链装载进 RISC 复合体。 6. 引导复合体去识别靶 mRNA。

miRNA 为什么常结合 3'UTR

因为 3'UTR 是调控信息富集区域，而且不直接改变蛋白编码序列，更适合作为调控平台。

三十七、miRNA 配对不一定要求完全匹配

这是它和某些 RNAi 场景的重要差异。

很多动物 miRNA 只需要“种子区”较好匹配，就能：

抑制翻译。
加速 mRNA 去腺苷酸化和降解。

这让一个 miRNA 常常能够调控一批相关 mRNA，而不是只盯住一个靶标。

三十八、mRNA 稳定性为什么是表达量的重要变量

你可以把一个基因的最终 RNA 水平粗略看成两个因素共同决定：

生产速度有多快。
降解速度有多快。

因此两个基因即使转录速率差不多，只要稳定性不同，最终丰度也可能差很多。

这就是为什么 AU-rich elements、miRNA 位点、RNA 结合蛋白等都能深刻影响表达结果。

三十九、为什么很多调控最后都集中到 translation initiation

因为一旦起始成功，后续延长通常比较顺。

所以控制起始往往是成本最低、收益最高的调控点。细胞可通过改变：

起始因子磷酸化状态。
cap 依赖招募效率。
UTR 上阻遏结构。
IRES 使用情况。

来快速响应环境变化。

四十、如果考试问“细胞分化为什么稳定”，可以怎么答

推荐思路：

1. 不同细胞表达不同转录因子组合。 2. 转录因子通过正反馈和互相抑制形成稳定网络。 3. 染色质状态和 DNA 甲基化帮助维持长期沉默或激活。 4. miRNA 和转录后机制进一步清除不符合该细胞身份的转录本。

这样就把转录、表观遗传和转录后调控都串起来了。