gsea分析结果详细解读(gsea分析扫盲)

g988.cng988.cn 周公解梦 2024-03-01 41 0

本文目录一览:

基因集富集分析

1、图最上面部分展示的是富集分数(ES, enrichment score)值计算过程,从左至右每到一个基因,计算出一个ES值,连成线。在最左侧或最右侧有一个特别明显的峰值就是基因集表型上的ES值。

2、考虑到这些缺点,2005年提出了基于基因集定义的基因富集分析方法,很多人管单基因分析叫bottom-up,富集分析叫top-down。

3、分析比较一种生物学状态的研究群体的【过表达差异基因集】在一通路的富集概率相比在总基因集中【随机抽取的同数目基因集】在该通路的富集概率是否有显著差异,如果有显著差异,则认为该通路对于在当前研究群体是具有意义的。

转录组下游分析之GSEA

gsea的原始数据分为三列,一列是geneid,一列是FoldChange,一列是根据FoldChange排序的结果。其实gsea就是看foldchange的值的分布,如果是随机分布,那结果就不理想。我们想要的是在两端富集分布。

GSEA分析结果最常见的是下图:图最上面部分展示的是富集分数(ES, enrichment score)值计算过程,从左至右每到一个基因,计算出一个ES值,连成线。在最左侧或最右侧有一个特别明显的峰值就是基因集表型上的ES值。

得到表达矩阵后最经典的分析就是GSEA: 看看基因全局表达量的变化是否有某些特定的基因集合的倾向性。

转录组分析总体流程如图所示,主要分为上游分析(原始数据质量控制、比对、组装、定量),下游分析(差异分析、富集分析)和高级分析(共表达分析、GSEA、时序性分析等)。

怎么分析关注的功能基因集在转录组结果中表现如何?

Leading-edge subset 对富集得分贡献最大的基因成员。若富集得分为正值,则是峰左侧的基因;若富集得分为负值,则是峰右侧的基因。

数据质量控制:检查原始测序数据的质量,去除低质量的读段(reads)。序列比对:将质量控制后的读段与参考基因组或转录本数据库比对,以确定它们的位置。

精准建立关联表型。转录组数据通过识别特定的DNA序列来控制染色质和转录,以形成挖掘功能基因中表达的复杂系统。基因集模块化,更加精准的关联表型。

分析转录组学中的gene:转录组测序可以得到大量差异表达基因和调控代谢通路,但由于基因与表型难以直接关联,导致关键信号通路难以确定,因此往往达不到预期研究目的。

并且有更方便我们解释差异分析的结果,说明在A组基因的表达量相对于B组的是上调还是下调。另外,本文的差异分析还是处于单因子水平(只有一个变量),至于多因子的差异分析以后研究透了再和大家进行分享。完。

喜欢0评论已闭