相近功能基因的检索方法
在做数据分析的时候很多老师经常需要搜索某一类功能的基因,有两种思路可以实现这一目标。第一种是直接序列比对,认为序列相似即具有相似的功能;第二种是利用这一类基因共有的蛋白保守结构域搜索,如果含有相同的蛋白保守结构域,就认为他们具有相似的功能。
在使用第二种方法的时候往往要用到蛋白保守结构域的隐马尔科夫模型文件,这个文件可以在pfam数据库得到。今天分享如何在pfam数据库下载该文件
获取蛋白保守结构域在pfam的索取号
下图即为pfam数据库的主页,首先需要获取蛋白保守结构域在pfam数据库中的索取号(格式一般为"PF"+阿拉伯数字)。常用的获取方式有两种:第一种是从文献中查找;第二种是从NCBI获取。本文主要展示从NCBI获取蛋白保守结构域在pfam数据库的索取号。
如下图所示,从NCBI查找一个含有所需要的蛋白保守结构域的蛋白:在红框所示选择蛋白、输入名称+物种然后搜索。
如下图所示会出现很多相关的蛋白信息,选择一条点击进去。
跳转至蛋白信息的主页(下图),点击右上方的Identify Conserve Domain 就会跳转之这个蛋白的保守结构域的主页 。
蛋白保守结构域的主页(下图),红色框标注的地方是domain list(就是这个蛋白含有那些蛋白保守结构域) 。点击想要获取pfam数据库的索取号的蛋白保守结构域的条目,例如NB-ARC会跳转到它的主页。
下图就显示了NB-ARC在pfam数据库的登记号,不过是以pfam开头,后面跟数字,想要在pfam数据库使用这个登记号,将pfam改为大写的PF后面数字不变。
下载蛋白保守结构域的hmm文件
进入pfam数据库主页,输入上一步获取的索取号。
点击 Go 进入到蛋白保守结构域的主页,点击右侧的 Curation&model ;
Curation&model 页面的最下方有 download 按钮, 点击 download 会弹出下载窗口,然后就可以下载了。
你有没有get到?快去数据库试试吧!
如何查找基因家族pfam号:https://www.omicsclass.com/question/268
更多生物信息课程:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课,学习链接:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析、GEO芯片数据挖掘、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他课程链接:二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!