是小麦的基因组吗?小麦基因组巨大,看你的内存总共4G,一下子读入内存肯定不行; 我们的脚本是把参考基因组一下子都读进内存的,如果参考基因组文件太大,就会内存不足; 建议用get_fa_by_id.pl脚本把参考基因组分隔成不同的染色体,然后分染色体提取序列;最后 合并结果;
回答于 2018-10-23 13:00
有参转录组:应该有基因组,如果基因组是JGI或者ensembl上的,可以直接搜索基因功能的关键字,参考:https://www.omicsclass.com/article/50 或者 https://www.omicsclass.com/article/58 再有就是基因组完成,一般会对基因的功能进行注释,会有一部分注释信息在gff文件里面你可以下载下来看看。
回答于 2018-10-22 10:49
你写的脚本不对: 这里有个根据ID,提取序列的脚本,你可以参考一下: #script www.omicsclass.comdie "perl $0 <id><fa><OUT>" unless(@ARGV==3);use Bio::SeqIO;use Bio::Seq;my$in = Bio::SeqIO->new(-file => "$ARGV[1]" , -format => 'Fasta');my$out =...
回答于 2018-10-22 10:42
python脚本运行的时候,应该在终端输入:python get_promoter.py 从报错看,你这个脚本有三个必须输入的参数,你没输入,提示你输入; 你需要重新运行脚本,输入这三个参数;
回答于 2018-10-18 15:09
基因家族成员,不同的基因家族数量不等,小的家族2个基因都有可能,大的基因家族几百个都有可能; 只要是你鉴定分析过程能确定自己做的没错就不会有问题;另外可以看看你研究的基因家族数量,在别的物种中的数量(参考文献),一般相差不会太大就没有问题;
回答于 2018-10-18 15:06
基因家族定义: 基因家族(英语:Gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物 A gene family is a set of several similar genes, formed by duplication of a single original gene, and generally...
回答于 2018-10-17 11:31
请点开,明细截图,不然我这也不好知道原因: 如果一直黑屏,可参考这个:https://www.omicsclass.com/article/78
回答于 2018-10-17 11:04
不知道你的目的是什么? clustalW和Muscle为多序列比对软件,非常消耗计算资源,2000多条肯定会花费很长时间; 建议用blast比对,会很快完成;
回答于 2018-10-16 17:19
如果只是需要:“出现两个菌种的部分一行拆成两行” 那直接用perl的正则表达式捕获功能就好了; 读取文件建议用while循环,逐行处理文件: open IN,"inflile";while(<IN>){ chomp $_; #do something }close(IN);
回答于 2018-10-16 10:24