一个有两个结构域的基因家族在分析的时候必须把这两个结构域的对应的蛋白序列分别截取出来吗?还是只要把这两个结构域分别分析之后得到的基因ID取个交集,直接用这个基因ID对应的蛋白质全长序列继续往下分析就可以?
具体的基因家族可以去搜索相关文献,看其它文章是怎么鉴定这个基因家族成员的,看两个结构域分别hmmsearch之后应该取交集还是并集。最终确定基因家族成员之后,再去提取结构域序列、蛋白全长序列进行后续分析。