Illumina_HiSeq_2000高通量测序结果分析
你好,最近在看TCGA数据库,其中raw_count,scaled_estimate,normalized_count,没能看明白什么意思,分别代表什么,我想做转录水平基因表达差异分析,需要用到哪些数据.
人气:143 ℃ 时间:2020-06-21 11:17:36
解答
raw_count应该是某个转录本/基因的测到的原始reads条数,normalized_count是经过标准化的数据量;
差异分析需要统计 raw_count,FPKM值,pvalue我是用normalized_count的值做差异分析的,不知道可不可以,而且差异很显著,但我不知道他们经过rsem处理后的数据,拿来用会不会有问题做差异分析就是用normalized_count的值来做的。先根据count,利用rsem软件来计算表达量,然后根据表达量进行表达差异分析。
使用RSEM计算表达量是因为:由于质量剪切后会有以下现象发生,如果一个pair-end的片段map到序列上确实只记一个count,另外还有两种情况是read只有一部分map到了参考序列上,或者read map到了参考序列的多个位置上。因此RSEM会用最大似然法(Expectation-Maximization) 来估计一个count值。
推荐
猜你喜欢
- 波尔多液是CuSO4溶液与Ca(OH)2溶液混合而成的悬浊液,在配制波尔多液时为什么不能用铁制容器.
- 英语翻译
- 甲,乙两人分别从甲,乙两地同时相向出发,在甲超过中点50米的处甲,乙两人第一次相遇,甲,乙到达乙,甲两地后立即反身往回走,结果甲,乙两人在距甲地100米处第2次相遇,求甲,乙两地的路程.
- show sb sth =show sth to sb ,send sb sth =send sth to sb 有人知道与这种用法一样的短语吗?9个左右
- 考试后的试卷阅读,求个答案来对
- 缅怀革命先烈的句子
- 英语翻译 1.我不能解决这个问题 2.我把篮子里装满了花 3.他的内心充满了幸福 4.他的一个朋友愿意帮他度过难关 5.有聋又瞎是大部分人所无法想象的事情
- Who is Liu Xiang He is a player.句型对吗