5 老师,使用非ensemble数据库的蛋白质序列和基因组染色体fasta文件脚本要怎么进行修改呢?

最近在做油菜相关基因家族的相关工作,ensemble数据库里的pep和toplevel文件下载之后解压总是提示unexpected end of file,

attachments-2022-02-1fN5iQfl61fa8f317c700.png

就从其他数据库下载了pep和toplevel的文件,

attachments-2022-02-gLhmJJxh61fa8f438176d.png在除重复的hmmer搜索的转录本ID,多个转录本ID保留一个作为基因的代表的时候,得到了异常的结果,请问我是应该如何修改脚本,或者整理来自其他数据库的序列信息呢?

attachments-2022-02-YKlDdRuG61fa8f593cf86.png


请先 登录 后评论

最佳答案 2022-02-05 22:30

你再看看视频课程,GFF里面的mRNA ID要和蛋白里面的ID一致;

你需要提前吧gene: 等删除一下;


解压文件报错,是文件不完整,你再重新下载一下

请先 登录 后评论

其它 0 个回答