提取基因在染色体位置时发现gff3文件中的染色体编号不好理解。疑惑。

老师,我的基因组注释文件gff3中,染色体编号不一样,1-9就是阿拉伯数字,10-33的反而是bd_数字1×数字2。我不懂数字1和数字2各自代表什么意思?猜测数字1代表染色体编号。是这样的吗?但是数字2又不知何意了。

attachments-2020-05-UkEOTz0I5ec5d9266878f.png


另外,提取基因结构以及在染色体位置时,发现有两个基因死活提取不到基因结构信息和染色体位置信息。ctrl+F输入关键词(基因名称)去查找,又能找到。结果发现在这段序列注释里,ID前后名称不太一样,一个叫“Phatr3_Jdraft52”,另一个叫“Phatr3_draftJ52”。一个叫“Phatr3_Jdraft1806”,另一个叫“Phatr3_draftJ1806”。疑惑,怎么前后不一致?我该用哪一个基因名称才对?attachments-2020-05-P1Uz3Rra5ec5dee800173.png

attachments-2020-05-DMFWJthW5ec5def92fe86.png

基因组注释文件gff3中一开始显示的数据如下图:

各种染色体编号之后,还有bd_数字1×数字2。。这是某编号染色体的补充数据吗??实在有点懵。

attachments-2020-05-5kl4Hg0L5ec618f667ee8.png




请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

哪些不是数字的染色体编号应该的scffold,你再了解一下你的物种基因组情况,看看发布这篇基因组的文章就知道了;

请先 登录 后评论