Standard protein BLAST is designed for protein searches.
Blastp用于确定查询的氨基酸序列在蛋白数据库中找到相似的序列。跟其它的Blast程序一样,目的是要找到相似的区域。
PSI-BLAST is designed for more sensitive protein-protein similarity searches.
Position-Specific Iterated (PSI)-BLAST,是一种更加高灵敏的Blastp程序,对于发现远亲物种的相似蛋白或某个蛋白家族的新成员非常有效。当你使用标准的Blastp比对失败时,或比对的结果仅仅是一些假基因或推测的基因序列时("hypothetical protein" or "similar to..."),你可以选择PSI-BLAST重新试试。
PHI-BLAST can do a restricted protein pattern search.
PHI-BLAST, 模式发现迭代BLAST, 用蛋白查询来搜索蛋白数据库的一个程序。仅仅找出那些查询序列中含有的特殊模式的对齐。
PHI的语法详细介绍看这里:http://www.ncbi.nlm.nih.gov/blast/html/PHIsyntax.html
PSI-BLAST(Positive-specific Interative Basic Local Alignment Search Tools)是基于profile搜索的方法,来寻找目标序列。PSI-BLAST先从query序列开始,获得一系列相似性序列,看作是同一蛋白家族,然后构建一个profile。这个profile的矩阵化形式,称之为position-specific score matrix (PSSM)。PSI-BLAST用PSSM,而不是初始的query序列,从数据库中搜索目标序列。
PSSM的特点是:highly conserved positions receive high score and weakly conserved positions receive scores near zero. PSI-BLAST重在发现有relationship的序列,例如有些蛋白质序列间相似性较低,但3D结构非常类似。它比BLAST用一条query序列更有效地找出同源蛋白质。特别是寻找跨物种的distant homologues,这显然是BLAST实现不了的。
PSSM中同一个氨基酸在不同位点的得分不同,因此比PAM和BLOSUM更强调保守性和结构性,而不是序列本身。
PSI-BLAST分为几个重要步骤:
具体步骤可阅读文章Gapped BLAST and PSI-BLAST: a new generation of protein database search program
NCBI的一篇PSI-BLAST tutorial 中列举了几个实际应用的例子:
例1: 大肠杆菌DNA聚合酶III的β亚基和真核细胞里的PCNA
β亚基是一个二聚体,每个单体上有三个同源的domain;PCNA是三聚体,每个单体上有两个同源的domain。这些domain都是同源的,包括两个α-螺旋和八个β折叠(PCNA里有九个)。两种蛋白质3D结构极其相似。但以因为进化距离远,BLAST发现不了二者间的相似性。c
参考:http://yangli.name/2015/11/11/20151111psiblast/
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!