Illumina_HiSeq_2000高通量测序结果分析
你好,最近在看TCGA数据库,其中raw_count,scaled_estimate,normalized_count,没能看明白什么意思,分别代表什么,我想做转录水平基因表达差异分析,需要用到哪些数据.
人气:201 ℃ 时间:2020-06-21 11:17:36
解答
raw_count应该是某个转录本/基因的测到的原始reads条数,normalized_count是经过标准化的数据量;
差异分析需要统计 raw_count,FPKM值,pvalue我是用normalized_count的值做差异分析的,不知道可不可以,而且差异很显著,但我不知道他们经过rsem处理后的数据,拿来用会不会有问题做差异分析就是用normalized_count的值来做的。先根据count,利用rsem软件来计算表达量,然后根据表达量进行表达差异分析。
使用RSEM计算表达量是因为:由于质量剪切后会有以下现象发生,如果一个pair-end的片段map到序列上确实只记一个count,另外还有两种情况是read只有一部分map到了参考序列上,或者read map到了参考序列的多个位置上。因此RSEM会用最大似然法(Expectation-Maximization) 来估计一个count值。
推荐
- 什么是普通的基因测序,它和高通量测序有什么区别吗?
- 高通量测序分的原理
- 请问普通测序与二代高通量测序区别?要测一个全长3200bp的序列,选普通测序还是二代高通量测序?
- 第二代基因测序技术的流程分别是什么,四种,Roche 454测序技术,Illumina Solexa测序技术,ABI SOLiD测序
- 高通量测序,RNA测序为什么要除去核糖体RNA
- 1、在( )里填上适当的计量单位名称
- [化学]将0.195g锌粉加入到20.0mL的0.100 mol·L-1MO2+溶液中,恰好完全反应,则还原产物可能是
- “鱼与熊掌不可得兼”大家对这句话都很熟悉,可是为什么是“鱼”与“熊掌”呢有没有原因.
猜你喜欢