通常我们用的都是通过blast比对来确定我们需要的家族成员,首先是比对序列,再次是需要目标物种的蛋白序列,来进行比对,通常比对的时候我们都需要设定e-value值。今天我们来学习一下利用HMMER来鉴定基因家族成员。
1 、利用软件HMMER进行模型搜索,
软件官网:http://hmmer.org/download.html ,主要用到hmmsearch,已经来自pfam数据库的隐马尔可夫模型。记住模型下载是在pfam数据库中,选择你自己需要的模型即可,如若没有你需要的模型怎么办呢,这时我们可以自己建立模型,请看图3后一行码。
2、在pfam数据没有模型的时候,我们可以利用clustalX2要比对的序列进行比对,然后会陈胜*.aln文件(注:该软件的目标文件必须在桌面才可以添加)。
下载桌面版本:hmmer3.0_windows,将下载下来的版本解压到桌面 文件准备,拟南芥蛋白组数据,来自pfam数据库的模型,模型是怎样确定的,请参考:
将蛋白文件,模型文件放到解压的hmmer文件中
图 1修改模型文件f—>b:
图 2win+R-->cmd>cd desktop-->cd hmmer3.0_windows
如果你有Git的话,可以直接在该文件夹右键打开,也是一样的:
图 3建立模型:
hmmbuild new.hmm *.aln
模型搜索并保存为wrky.txt文件:
图 4打开wrky.txt文件结果如下:
图 5如上图就见wrky基因鉴定出来了,如果还要进行下一步分析鉴定。包括多个转录本的情况,任然需要进行手动鉴定。以防出现假。以后得分享我基本上都会把入手的数据全部上传。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!