BLAST 比对建库

老师,请教一个问题:

(1)我通过基因家族分析课程19课时的方法,从NCBI下载已知Human 目标基因蛋白序列,获得了XXX.fa 文件。提交到了NCBI-CD-search,获得了如下结果(图一);提交到Pfam数据库,获得了图二暂未出结果(图二);提交到SMART数据库,得到了图三所示结果(图三)。

图一


attachments-2022-10-fEHJs1oi633f98e8b91c4.jpg
attachments-2022-10-B0sFeYcD633f98fee613f.png

图二

attachments-2022-10-Ntnx0P4Y633f95dc2e4f4.png图三

attachments-2022-10-LgCPeMF1633f9c22c880f.png


在CD-search 里面,Incomplete出现N/C/NC端不完整的片段,是直接从XXXX.fa里面删除整条ID序列吗? 完成三大数据库的比对后,在hmmsearch第一次搜素结构域时,我的如何对接上?

请先 登录 后评论

2 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

人类的基因 基因家族基因都是明确的你直接查询就行了;不用鉴定

请先 登录 后评论
血色蔷薇

        老师,您误会了。因为我的目标物种没有pfam号,所以我用已知人类的蛋白序列建立种子序列,分析结果如上所示。通过前期的文献积累,比对结果符合该基因家族的特征。

       目前的主要困惑是:(1)在CD-search 里面,Incomplete出现N/C/NC端不完整的片段,是直接从XXXX.fa里面删除整条ID对应的序列还是保留分析?(2)完成三大数据库的比对后,在hmmsearch第一次搜素结构域时,我如何利用比对结果建立物种特异hmm模型?

请先 登录 后评论
  • 2 关注
  • 0 收藏,1122 浏览
  • 血色蔷薇 提出于 2022-10-07 13:39

相似问题