5 基因家族分析中基因家族成员的筛选与取舍如何判断?

老师,我在按照课程方法学习基因家族分析课程,用到老师教授的木薯的NBS文章中的利用hmm文件也就是对应基因家族的隐马尔科夫模型筛选得到一个蛋白序列,另外我又采取blast的方式将我要研究的这个物种和其他几个物种的该基因家族序列信息进行比对,获得另一个蛋白序列文件,现在想将二者进行合并去重复,后面再去用CDD-research筛选出有对应保守域的基因确定最终的基因家族成员。但是我通过两个方法获得的蛋白序列文件信息差别有点大,几乎没有重复项,另外也出现两个不同的基因名但是基因序列完全相同的情况,不清楚该如何取舍比较科学,具体又该如何操作?

请先 登录 后评论

2 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

两种方法应该是有交集的,你说的完全没有交集可能那里做的有问题。

一个不同的基因名字有相同的序列,可能是同源基因吧,或者你再确认一下提取的序列是否有问题。

如果有家族的隐马尔科夫模型pfam号,建议不用blast方法了;

更多方法,可以观看《基因家族文献讲解


请先 登录 后评论
Sunny

谢谢老师,我查到了这个基因家族的一个Pfam号 ,并下载到了这个hmm文件,按照视频操作进行hmmresearch获得了对应的fasta文件,刚开始没有怀疑按照操作流程做,后来检查这个hmm文件处理的数据发现Pfam号对应的数据信息有问题,不属于这个基因家族,但是整个查询和操作方法我仔细检查并重复了,没有问题,把这个数据抽取基因序列放到NCBI里面比对发现保守域有问题,也就是说网站的基因家族对应的PFam号有问题,所以我最后还是选择用的blast的数据结果,找到候选基因。

请先 登录 后评论