get_fa_by_id.pl 这个脚本是根据第一个文件信息的第一列ID信息,提取第二个文件fasta文件的中对应的序列信息,存储到第三个文件当中;所有两个文件当中的ID对应才能得到想要的序列; 分析代码: 代码中这个地方 给ID都加了个".1" 你看看你的gff 文件里面的第一列ID都加 .1 后的基因ID,与你提供的所有蛋白质序列里面的序...
回答于 2018-10-15 13:02
是用我们的biolinux做的吗?应该cd到MCScanX的安装目录,再运行代码: 检查一下gff文件是不是存在,以及格式是否正确;
回答于 2018-10-15 10:29
这个根据自己的基因数量以及长度,bootstrap值的大小和选用的构树方法,基因数量越多,长度越长,bootstrap值越大,用时越久。 构树方法:最大似然法用时最长,NJ法用时最短。 计算机配置不高,用时一天以上也是有可能的;
回答于 2018-10-14 19:21
一般序列较多,bootstrap设置1000次构建进化树需要的时间较长;这个和自己的电脑配置有关,以前做过500个基因,bootstrap 设置1000,用时1天时间,不过我们是在大型计算机上完成的; 普通计算机用时会更长。 还有就是选用的方法,ML方法用时最长,NJ法用时会少一些;
回答于 2018-10-14 19:17
没有看到图片; 以前的基因,你最好找到以前版本的基因组对应的版本下载下来;然后再找到相应的基因序列; 自己去对应比较麻烦;
回答于 2018-10-14 19:10