本网站使用cookie。继续浏览本网站,即表示您同意我们使用cookies。有关cookies的更多细节以及如何管理它们,请参阅我们的 隐私政策

146

差异基因列表中,readcount一个为0,另一个不为0,能否说明一个表达,一个不表达?

在有参项目中,一般默认fpkm>1时,基因表达。一般不推荐看readcount的值看判断表达与否

147

某基因在两个样本中表达量差别很大,却不存在与显著差异的基因列表中,这是为何?

差异基因的筛选是基于统计学意义的,不能直观的通过两个数值的大小判断差异基因的,首先:受测序深度的影响,有些样品的测序深度较深,可能导致该样品的readcount数值较高,做差异分析的第一步就是要消除测序深度的影响,对原始数据进行标准化处理(我们在有重复项目中,使用DESeq自带的标准化方法;无重复项目中,使用TMM标准化方法)。

其次:在差异分析过程中,需要对readcount的分布进行估计,经验表明,readcount服从负二项分布。在有重复的项目中,重复的好坏也会对差异基因与否产生影响。如果重复较差,组内差异情况会屏蔽掉部分组间的差异。在估计完参数后,需要用特定检验方法来判断差异基因与否。

再次:在计算完pvalue以后,需要对pvalue进行多重假设检验校正,来减少假阳性。这个过程会使得padj会大于原来的pvalue,使得部分通过pvalue阀值的基因,无法通过padj的阀值。


148

能否用FPKM/RPKM进行差异分析?

在做差异分析时,是采用readcount数据,通过DESeq或者TMM标准化后,进行差异分析。FPKM/RPKM实际上也是对readcount进行标准化处理的一种方法,在进行差异分析时,DESeq和TMM的标准化效果最好,FPKM/RPKM的标准化效果较差,不推荐使用FPKM/RPKM进行差异分析。


149

基因表达水平如何计算?

在RNA-seq技术中,FPKM(expected number of Fragments Per Kilobase of transcript sequence per Millions base pairs sequenced)是每百万fragments中来自某一基因每千碱基长度的fragments数目,其同时考虑了测序深度和基因长度对fragments计数的影响,是目前最为常用的基因表达水平估算方法


150

什么是可变剪切?

大多数真核基因转录产生的mRNA前体是按一种方式剪切产生出一种mRNA,因而只产生一种蛋白质。但有些基因产生的mRNA前体可按不同的方式剪切,产生出两种或更多种mRNA,即可变剪切。


联系我们

*
*
*
*
提 交