跳转至
06
Part 2 · 分子表型组学

空间转录组

空转的核心,是把表达信号放回组织坐标。

本章学习导向:空间转录组一般为了解决什么问题?

常见问题。 空间转录组回答“表达变化发生在组织的哪里”。它适合研究组织分区、肿瘤边界、发育梯度、感染扩散、细胞生态位和潜在细胞互作,尤其适合单细胞解离后丢失空间信息的问题。

一般分析思路。 同时处理表达矩阵、空间坐标和组织图像;先做切片/spot QC 和区域注释,再识别空间高变基因、空间 domain、细胞类型解卷积、邻域结构和配体-受体共定位。

为什么这样分析。 空间数据的观测单位可能是 spot、像素或单分子,不一定等于单个细胞。表达信号会受组织厚度、透化、RNA diffusion、图像配准和多细胞混合影响,所以必须先确认坐标和组织结构,再谈通讯或机制。

生物学主线。 空间坐标常常同时记录发育时间、物质扩散、细胞迁移和微环境限制。读空间结果时要问:这是解剖结构、梯度、生态位,还是邻近细胞互作留下的信号?

零基础生物学底座:组织为什么不能只看“有哪些细胞”?

组织有结构。脑区有层次,肿瘤有边缘和中心,植物根尖有分生区、伸长区和成熟区,叶片有表皮、叶肉和维管束。细胞的位置决定它接触到的营养、氧气、激素、病原、邻居细胞和机械压力。

把组织打散做单细胞后,细胞身份还在,但“它原来在哪里”丢了。空间转录组把 RNA 信号放回组织坐标,让我们看到某个表达程序是在边界、管道、分生区、感染灶还是特定细胞邻域出现。对初学者来说,空间组学的第一原则是:位置本身就是生物学信息。

6.1为什么需要空间信息

单细胞转录组能告诉我们组织里有哪些细胞,但组织不是一袋细胞。免疫细胞是否靠近肿瘤边缘,干细胞是否位于特定微环境,病原感染是否沿血管扩散,发育信号是否形成梯度,这些问题都依赖空间位置。空间转录组保留组织坐标,使表达矩阵与组织结构、病理图像和邻域关系连接起来。

“空转”最适合回答三类问题:第一,某个基因或通路在组织中哪里表达;第二,某些细胞类型或状态是否形成空间邻域;第三,空间邻近是否支持潜在的细胞互作。它不能自动证明细胞之间真的发生了信号传递,只能提供空间共定位和表达配体-受体的证据。

生物学补充:空间是发育时间、物质扩散和细胞生态位的压缩记录

组织切片上的坐标不是普通的二维位置,它常常把多个生物学轴压在一起。胚胎和植物根尖里的空间轴近似发育时间轴:越靠近分生区,细胞越年轻;越远离分生区,细胞越成熟。肿瘤边缘到中心的空间轴常常混合了氧气、营养、免疫浸润和坏死程度。感染灶周围的空间轴则可能代表病原负荷、炎症因子扩散和免疫细胞募集的时间顺序。

因此空间转录组最有力量的地方,不只是“某基因在哪里表达”,而是把表达放进 niche。干细胞 niche 由邻近支持细胞、基质、激素、营养和机械环境共同定义;免疫 niche 由抗原呈递细胞、效应细胞、抑制性细胞和组织屏障共同定义;植物根际和维管束周围的 niche 则受到细胞壁、激素梯度、水分和矿质运输影响。一个表达程序若总是出现在特定邻域,才可能是组织结构塑造的状态,而不是随机细胞差异。

读空间结果时可以按三层问:第一,信号是否沿已知解剖结构分布,例如皮层、维管束、肿瘤边界或脑核团;第二,信号是否形成梯度,提示扩散、发育成熟或代谢限制;第三,信号是否依赖邻近细胞组合,提示生态位或细胞互作。只有第三层再结合扰动和蛋白证据,才逐渐接近机制。

Spatial transcriptomics overview with tissue section, spatial barcodes, and gene expression map

图 6.1 · spatial transcriptomics 的基本思想。 空间转录组不是多一张组织照片,而是把表达矩阵锚定到切片坐标。读这类图时要同时看组织结构、位置 barcode 和每个位置的表达谱。来源:M. Asp et al., Wikimedia Commons, CC BY 4.0。

6.2捕获式与成像式路线

捕获式空间转录组使用带空间 barcode 的阵列捕获组织切片中的 mRNA。每个 spot 或像素有固定坐标,测序后得到“位置 × 基因”的矩阵。优点是覆盖基因多,接近全转录组;弱点是分辨率受 spot 大小限制,一个 spot 可能包含多个细胞。

成像式路线通过多轮荧光原位杂交或原位测序直接在组织中读取转录本。优点是空间分辨率高,甚至可以达到单分子级;弱点是通常需要预先设计探针,检测基因数有限,实验和图像分析要求更高。

路线 代表思路 优势 局限
捕获式 空间 barcode 捕获 mRNA 基因覆盖广,流程接近测序组学 spot 可能混合多个细胞
成像式 原位杂交/测序 分辨率高,定位精确 基因面板受限,图像处理复杂
空间蛋白/多模态 抗体或质谱成像 接近功能层 通量和抗体质量限制

6.3数据结构和分析任务

空间转录组至少包含三类数据:表达矩阵、空间坐标和组织图像。分析不仅要做表达归一化和差异分析,还要处理图像配准、组织区域分割、空间邻接图、spot 解卷积和空间自相关。

常见任务包括识别空间高变基因、划分空间 domain、寻找区域特异通路、把单细胞参考映射到空间位置、估计细胞类型比例、分析细胞邻域和比较不同切片之间的空间模式。

flowchart LR
  Image[组织图像] --> Region[区域/病理注释]
  Counts[位置×基因矩阵] --> Spatial[空间域识别]
  Coord[坐标] --> Spatial
  scRNA[单细胞参考] --> Deconv[spot解卷积]
  Deconv --> Niche[细胞邻域]
  Region --> Niche

6.4空间域、解卷积和细胞通讯

空间 domain 是表达相似且空间上连续的区域,可能对应解剖结构、病理区域或功能微环境。解卷积则试图估计每个 spot 中不同细胞类型的比例。解卷积质量高度依赖单细胞参考是否匹配:组织、物种、疾病状态和技术平台不匹配时,结果可能偏移。

细胞通讯分析通常结合配体-受体数据库和空间邻近关系。例如一个区域内成纤维细胞表达配体,邻近 T 细胞表达受体,可以提出互作假设。但这仍然是推断,不代表信号通路已经被激活。更强证据需要蛋白、磷酸化、扰动或功能实验支持。

6.5常见误区

第一,把 spot 当成单细胞。捕获式空转中,一个 spot 的表达常常是多细胞混合。第二,忽视组织切片质量。RNA 降解、切片厚度、组织折叠和透化条件都会影响信号。第三,把空间邻近当成互作因果。第四,在不同切片之间比较空间域时没有做配准和区域标准化。

认知升级

空间转录组的关键不是“多了一张漂亮组织图”,而是把分子变化、细胞组成和组织结构放到同一个坐标系统里解释。

6.6CNS / 高影响案例深读:表达为什么必须放回空间坐标

我选的案例。 Ståhl et al. 2016, Science 定义捕获式 spatial transcriptomics;Moffitt et al. 2018, Science 用 MERFISH 联合 scRNA-seq 构建下丘脑 preoptic region 的分子、空间和功能图谱。前者是技术入口,后者更能说明空间信息如何改变生物学解释。

科研逻辑图。

flowchart LR
  Q[真实问题: 表达变化发生在哪里] --> S[设计: 保留组织切片和坐标]
  S --> P1[捕获式: spot/barcode + RNA-seq]
  S --> P2[成像式: 原位探针 + 单分子定位]
  P1 --> X[位置×基因矩阵]
  P2 --> X
  X --> D[空间域/梯度/邻域]
  D --> C[生物学声明: 结构区域、细胞生态位、潜在互作]
  C --> V[验证: histology / protein / perturbation / 3D registration]

为什么必须做空间转录组。 单细胞解离把组织打散,只保留细胞表达,不保留位置。可是脑核团、肿瘤边缘、胚胎轴、植物根尖分生区和维管束的机制都依赖位置。没有空间坐标,就无法判断一个表达程序是均匀存在、沿结构梯度变化,还是只出现在特定邻域。

原理如何支撑结论。 Ståhl 的路线用带空间 barcode 的阵列捕获 mRNA,测序后每个表达谱都能映射回切片坐标。Moffitt 的 MERFISH 路线则用多轮成像直接在组织里读取预设转录本,保留近单分子级定位。两类技术的共同点是把表达矩阵从“样本 × 基因”改成“位置 × 基因”,再与组织形态和细胞邻域联合解释。

从实际科研逻辑怎么读。 空间论文先看坐标和分辨率,再看生物学结论。捕获式 spot 如果包含多个细胞,结论应当是“这个位置的混合表达程序”,不是“这个细胞表达”。成像式如果只测面板基因,结论强度受 gene panel 选择影响。Moffitt 的逻辑强在它不是单独做 MERFISH,而是用 scRNA-seq 定义细胞类型,再把这些类型投回组织位置,最后用解剖位置和功能标记解释下丘脑 cell types。

关键结果如何支撑生物学声明。 如果一个 cell type 在 scRNA 里存在,但空间上没有结构性分布,它只是“组织里有这种细胞”;如果它稳定占据某个 nucleus、边界或梯度位置,才支持“它属于特定组织微环境”。如果配体和受体只是在邻近细胞表达,只能说“支持潜在通讯”;若再有蛋白、磷酸化、扰动或功能 readout,才能往 signaling mechanism 推。对植物根尖或叶片,空间逻辑尤其关键:分生区、伸长区、成熟区和维管束不是随机采样单位,而是发育时间轴和组织结构本身。

结论边界。 空间共定位不是细胞通讯因果;spot 不等于 cell;成像式面板会受基因选择限制;捕获式会受分辨率和解卷积假设限制。今天重做应结合单细胞多组学、空间蛋白、连续切片 3D 配准和扰动实验,尤其在植物组织中要处理细胞壁、自发荧光和组织切片形变。

参考。 Ståhl et al. 2016. Science. https://www.science.org/doi/10.1126/science.aaf2403;Moffitt et al. 2018. Science. https://doi.org/10.1126/science.aau5324

延伸深读。 [[06-spatial/_papers/stahl-2016-science-spatial-transcriptomics]];[[06-spatial/_papers/moffitt-2018-science-merfish-hypothalamus]]