两种方法应该是有交集的,你说的完全没有交集可能那里做的有问题。
一个不同的基因名字有相同的序列,可能是同源基因吧,或者你再确认一下提取的序列是否有问题。
如果有家族的隐马尔科夫模型pfam号,建议不用blast方法了;
更多方法,可以观看《基因家族文献讲解》
老师,我在按照课程方法学习基因家族分析课程,用到老师教授的木薯的NBS文章中的利用hmm文件也就是对应基因家族的隐马尔科夫模型筛选得到一个蛋白序列,另外我又采取blast的方式将我要研究的这个物种和其他几个物种的该基因家族序列信息进行比对,获得另一个蛋白序列文件,现在想将二者进行合并去重复,后面再去用CDD-research筛选出有对应保守域的基因确定最终的基因家族成员。但是我通过两个方法获得的蛋白序列文件信息差别有点大,几乎没有重复项,另外也出现两个不同的基因名但是基因序列完全相同的情况,不清楚该如何取舍比较科学,具体又该如何操作?