python脚本运行的时候,应该在终端输入:python get_promoter.py 从报错看,你这个脚本有三个必须输入的参数,你没输入,提示你输入; 你需要重新运行脚本,输入这三个参数;
回答于 2018-10-18 15:09
基因家族成员,不同的基因家族数量不等,小的家族2个基因都有可能,大的基因家族几百个都有可能; 只要是你鉴定分析过程能确定自己做的没错就不会有问题;另外可以看看你研究的基因家族数量,在别的物种中的数量(参考文献),一般相差不会太大就没有问题;
回答于 2018-10-18 15:06
基因家族定义: 基因家族(英语:Gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物 A gene family is a set of several similar genes, formed by duplication of a single original gene, and generally...
回答于 2018-10-17 11:31
请点开,明细截图,不然我这也不好知道原因: 如果一直黑屏,可参考这个:https://www.omicsclass.com/article/78
回答于 2018-10-17 11:04
不知道你的目的是什么? clustalW和Muscle为多序列比对软件,非常消耗计算资源,2000多条肯定会花费很长时间; 建议用blast比对,会很快完成;
回答于 2018-10-16 17:19
如果只是需要:“出现两个菌种的部分一行拆成两行” 那直接用perl的正则表达式捕获功能就好了; 读取文件建议用while循环,逐行处理文件: open IN,"inflile";while(<IN>){ chomp $_; #do something }close(IN);
回答于 2018-10-16 10:24
get_fa_by_id.pl 这个脚本是根据第一个文件信息的第一列ID信息,提取第二个文件fasta文件的中对应的序列信息,存储到第三个文件当中;所有两个文件当中的ID对应才能得到想要的序列; 分析代码: 代码中这个地方 给ID都加了个".1" 你看看你的gff 文件里面的第一列ID都加 .1 后的基因ID,与你提供的所有蛋白质序列里面的序...
回答于 2018-10-15 13:02
是用我们的biolinux做的吗?应该cd到MCScanX的安装目录,再运行代码: 检查一下gff文件是不是存在,以及格式是否正确;
回答于 2018-10-15 10:29