HMMER是基于隐马尔可夫模型,用于生物序列分析工作的一个非常强大的软件包,它的一般用途是识别同源蛋白或核苷酸序列和进行序列比对。与BLAST、FASTA等序列比对和数据库搜索工具相比,HMMER更准确。
再有HMM模型的情况下寻找相似序列可用hmmsearch,用法如下:
hmmsearch --domtblout Ensembl.txt PF01535.hmm Zea_mays.AGPv3.24.pep.all.fa
输入文件PF01535.hmm为HMM模型。 比较序列文件可以是FASTA格式。
--domtblout:domtblout格式输出
结果如下图:
结果按照E-values值从小到大排序,形式与blast类似。
其中target name是每个目标序列的名称;
query name是查询序列的名称;
score是比对得分,分值越高说明越相似;
E-value目标序列的期望值(统计意义);
最重要的是E-value值,值越小,越可信,相当于一个统计量。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!