如果提取基因一条代表CDS序列不成功,mRNA与CDS,GENE的ID都不一致(马铃薯数据库)


attachments-2021-03-mMJpMi3W6051fe17239ae.png因为马铃薯数据库里,CDSmRNA,Gene ID命名差异非常大,如上图红线标出

我想要提取CDSID,但提取的是mRNAID

所以我想修改perl脚本(geneid_to_mRNAid.pl)

当我把if($tmp[2] =~/mRNA中的mRNA改为cds时,

attachments-2021-03-2WHoI8a06051fe5d7a7bf.png显示attachments-2021-03-LGyJaypI6051fe85ca380.png

当我把里面的全部mRNA全都改为cds

attachments-2021-03-OA56PKx06051fe9f087b7.png显示

attachments-2021-03-MXW0wd9h6051febf8a269.png

 

请问该如何修改脚本,可以得到基因对应cds的 ID呢

 attachments-2021-03-Jjg70l296051fed5d5699.png

ST_PGSC_DM_v3.4_cds.fasta中的序列开头>cds mRNA(格式), 如果可以让它们前后交换也可以,这样就可以用mRNA提取了

相关脚本.rar(geneid_to_mRNAid.pl为原脚本,另外两个为修改后运行不成功的脚本)

请先 登录 后评论

2 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

看课程这一节解决办法:attachments-2021-03-3MdPGrFZ6054020addf25.png

请先 登录 后评论
1056202103@qq.com

你好能不能留一下联系方式我想有偿要那个你的脚本

请先 登录 后评论
  • 2 关注
  • 0 收藏,2653 浏览
  • 空谷临风 提出于 2021-03-17 21:02

相似问题