Illumina_HiSeq_2000高通量测序结果分析

Illumina_HiSeq_2000高通量测序结果分析
你好,最近在看TCGA数据库,其中raw_count,scaled_estimate,normalized_count,没能看明白什么意思,分别代表什么,我想做转录水平基因表达差异分析,需要用到哪些数据.
laaa123 1年前 已收到2个回答 举报

magical 幼苗

共回答了22个问题采纳率:86.4% 举报

aw_count应该是某个转录本/基因的测到的原始reads条数,normalized_count是经过标准化的数据量;
差异分析需要统计 raw_count,FPKM值,pvalue

1年前 追问

3

laaa123 举报

我是用normalized_count的值做差异分析的,不知道可不可以,而且差异很显著,但我不知道他们经过rsem处理后的数据,拿来用会不会有问题

举报 magical

做差异分析就是用normalized_count的值来做的。先根据count,利用rsem软件来计算表达量,然后根据表达量进行表达差异分析。
使用RSEM计算表达量是因为:由于质量剪切后会有以下现象发生,如果一个pair-end的片段map到序列上确实只记一个count,另外还有两种情况是read只有一部分map到了参考序列上,或者read map到了参考序列的多个位置上。因此RSEM会用最大似然法(Expectation-Maximization) 来估计一个count值。

惜熙 幼苗

共回答了2个问题 举报

虽然我回答不了你的问题,但是我们公司肯定有人懂~

1年前

0
可能相似的问题
Copyright © 2024 YULUCN.COM - 雨露学习互助 - 18 q. 0.021 s. - webmaster@yulucn.com