blast+在Linux的用法
下面简要介绍一下BLAST+的使用:
建库
makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname -title dbtitle -logfile filename
参数说明:
蛋白序列比对蛋白数据库(blastp)
blastp -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
参数说明:
-query: 输入文件路径及文件名
-out:输出文件路径及文件名
-db:格式化了的数据库路径及数据库名
-outfmt:输出文件格式,总共有12种格式,6是tabular格式对应BLAST的m8格式
-evalue:设置输出结果的e-value值
-num_descriptions:tabular格式输出结果的条数
-num_threads:线程数
附:Blast结果m8格式意义
进行Blast比对,用参数-m 8可以以列表的方式输出结果,结果中从左到右每一列的意义分别是:
[1] Query id [1]查询ID (所研究物种的ID)
[2] Subject id [2] 参考基因组的ID
[3] % identity [3] 表示相同匹配的 百分比
[4] alignment length [4] 序列对齐长度
[5] mismatches [5] 错配数量
[6] gap openings [6] 缺口
[7] q. start [7] 和查询序列开始对齐位置
[8] q. end [8] 和查询序列结束对齐位置
[9] s. start [9] 和参考基因序列开始对齐位置
[10] s. end [10] 和参考基因序列结束对齐位置
[11] e-value [11] 期望值
[12] bit score [12] bit分数
核酸序列比对核酸数据库(blastn)以及核酸序列比对蛋白数据库(blastx)
与上面的blastp用法类似:
blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!