FPKM值的理解困惑:双端测序时,一个fragements的两端都测序,结果是有两个reads,那在计算FPKM定义时,说Fragment的最终数目是Reads的1到2倍之间,不应该是reads是fragements的1-2两倍吗,

FPKM:Fragments per Kilobase Million,FPKM意义与RPKM极为相近。二者区别仅在于,Fragment 与 Read。RPKM的诞生是针对早期的SE测序,FPKM则是在PE测序上对RPKM的校正。只要明确​Reads 和 Fragments的区别,RPKM和FPKM的概念便易于区分。Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间

感觉我对这句话的理解应该 reads 的数目应该是Fragement的1-2倍吧,因为一个fragements会得到2个reads,在后期过滤中有这个fragements有1条或2条reads最后进入表达量分析,那么进入分析的reads是多于fragements的吧,因为一个fragements会有2个reads啊,所有的fragements都只有一个reads进入分析时,那么是相等的,当有两个reads进入时,reads是多于fragements的吧,求解惑

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

你的理解是对的,具体得看看软件得统计说明文档才好,不同得软件可能会有细微差别

请先 登录 后评论
  • 1 关注
  • 0 收藏,4661 浏览
  • 杨辉 提出于 2020-09-17 23:47

相似问题