描述信息好像是来着蛋白序列文件里面的,也就是hmmsearch部分输入的Arabidopsis_thaliana.TAIR10.pep.all.fa, 如果输入的这个文件序列ID 行没有这些描述信息,在结果文件里面也会没有,而这些信息在gff文件里面不一定有的哦~ 你找一个基因分别到两个文件查找验证看看,我记得好像是这样。
利用hmmbuild WRKY_domain_new.hmm WRKY_domain.aln命令建立新的hmm。
利用hmmsearch --domtblout WRKY_domain_new_out.txt --cut_tc WRKY_domain_new.hmm Arabidopsis_thaliana.TAIR10.pep.all.fa命令获得的WRKY_domain_new_out.txt文件,如下图:
图1
图2
老师分析完,此WRKY_domain_new_out.tx文件中有图2 的描述部分。
在棉花的gff文件中,我也利用老师的脚本只获得图1的内容(如图3),但图2描述部分是空的(如图4),不知是什么原因,请老师给予解答!
图3
图4