跳转至

Omics Study Book

Map of Content

petemeng/Omics-Study-Book

Omics Study Book

petemeng/Omics-Study-Book

跨组学通用概念 MOC¶

这些笔记是后续所有组学章节的共同地基：分布、模型、降维、批次、多重检验、组分约束、零值和 Bayesian。

计数与分布¶

[[_concepts/poisson-vs-negative-binomial]] — 为什么计数数据普遍用负二项而不是泊松？
[[_concepts/zero-inflation-vs-true-zero]] — Zero inflation 真的存在吗？真零 vs 假零如何区分？

模型框架¶

[[_concepts/glm-unified-view]] — GLM 把线性回归 / 逻辑回归 / 泊松 / 负二项统一成什么框架？
[[_concepts/mixed-models-everywhere]] — Random effect 在 GWAS / scRNA / 重复测量里到底是不是同一件事？
[[_concepts/bayesian-vs-frequentist-omics]] — 组学里什么时候 Bayesian 真的有用而不是炫技？

降维与可视化¶

[[_concepts/pca-svd-the-same-thing]] — PCA 与 SVD 的关系是什么？为什么组学里我们其实在用 SVD？
[[_concepts/umap-tsne-what-they-preserve]] — UMAP 与 t-SNE 各自保留什么、扭曲什么？

统计推断与数据结构¶

[[_concepts/batch-effects-causes-and-cures]] — 批次效应有几种来源？校正手段如何对应？
[[_concepts/multiple-testing-frameworks]] — 多重检验：Bonferroni / BH / Storey q / IHW 各自假设和取舍？
[[_concepts/compositional-data-trap]] — 为什么组分数据会让标准统计失效？

推荐阅读路径¶

先读 [[_concepts/glm-unified-view]] 和 [[_concepts/poisson-vs-negative-binomial]]，建立计数模型框架。
再读 [[_concepts/mixed-models-everywhere]]、[[_concepts/batch-effects-causes-and-cures]] 和 [[_concepts/multiple-testing-frameworks]]，理解为什么组学推断容易假阳性。
然后读 [[_concepts/pca-svd-the-same-thing]] 和 [[_concepts/umap-tsne-what-they-preserve]]，避免过度解释降维图。
最后读 [[_concepts/compositional-data-trap]]、[[_concepts/zero-inflation-vs-true-zero]] 和 [[_concepts/bayesian-vs-frequentist-omics]]，为微生物组、单细胞和多组学整合做准备。