InterPro是一个数据库,它集成了许多数据库关于蛋白质功能的预测信息,概述了蛋白质所属的家族及其包含的结构域和位点。InterProScan是InterPro数据库提供给用户的一个软件包,以集成的方式从InterPro数据库中进行结果检索。InterProScan可以检索的数据库如下:
InterProScan的一般使用方法:
sh interproscan.sh -i pep.fa -f TSV -o out
-i:待检索的蛋白质序列文件,fasta格式
-f:输出文件的格式,可选TSV, XML, JSON,GFF3
-o:输出文件名
除此之外还有其他参数帮助我们更好的进行个性化的检索,比如通过-appl参数选择要搜索的库(默认全选):
具体使用参数详见官方网站:https://interproscan-docs.readthedocs.io/en/latest/HowToRun.html
tsv格式文件解读:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!