5 想请教一下,如果在stringtie定量后,得到的某基因有多个转录本,那么它的定量结果,即FPKM值应该如何取舍?

FAN_iscf00000040.1     StringTie     transcript     1835     3860     1000     -    .     gene_id "STRG.20"; transcript_id "STRG.20.1"; cov "13.755408"; FPKM "2.461453"; TPM "1.513562";
FAN_iscf00000040.1     StringTie     exon     1835     2465     1000     - .     gene_id "STRG.20"; transcript_id "STRG.20.1"; exon_number "1"; cov "14.038827";
FAN_iscf00000040.1     StringTie     exon     3559     3634     1000     - .     gene_id "STRG.20"; transcript_id "STRG.20.1"; exon_number "2"; cov "18.973684";
FAN_iscf00000040.1     StringTie     exon     3736     3860     1000     - .     gene_id "STRG.20"; transcript_id "STRG.20.1"; exon_number "3"; cov "9.152000";
FAN_iscf00000040.1     StringTie     transcript     3634     4037     1000     + .     gene_id "STRG.21"; transcript_id "STRG.21.1"; cov "3.374046"; FPKM "0.603767"; TPM "0.371260";
FAN_iscf00000040.1     StringTie     exon     3634     3845     1000     + .     gene_id "STRG.21"; transcript_id "STRG.21.1"; exon_number "1"; cov "3.287736";
FAN_iscf00000040.1     StringTie     exon     3988     4037     1000     + .     gene_id "STRG.21"; transcript_id "STRG.21.1"; exon_number "2"; cov "3.740000";
FAN_iscf00000040.1     StringTie     transcript     3955     4286     1000 - .     gene_id "STRG.22"; transcript_id "STRG.22.1"; cov "11.914286"; FPKM "2.131994"; TPM "1.310976";
FAN_iscf00000040.1     StringTie     exon     3955     4075     1000 - .     gene_id "STRG.22"; transcript_id "STRG.22.1"; exon_number "1"; cov "9.132232";
FAN_iscf00000040.1     StringTie     exon     4163     4286     1000     - .     gene_id "STRG.22"; transcript_id "STRG.22.1"; exon_number "2"; cov "14.629032";

比如上面FAN_iscf00000040.1基因有3个转录本,最后的FPKM值也有三个,像这种情况该如何取舍?谢谢!

请先 登录 后评论

最佳答案 2018-08-29 10:00

GFF文件格式来看,
1.  FAN_iscf00000040.1 这个是染色体(参考序列),而不是基因。 

2. 基因的名称应该是 “ gene_id” 后面跟着的那个属性

3. 你这个不是一个基因的三个转录本,而就是3个基因

请先 登录 后评论

其它 0 个回答

  • 1 关注
  • 0 收藏,6778 浏览
  • 请叫我啊红 提出于 2018-07-29 19:47