我们下载KEGG数据库的目的是为了研究目标蛋白参与了那些pathway 。 前面我们介绍了KEGG 数据库中蛋白序列的下载方式,现在来介绍一下patyway 相关数据的下载方式。这个主要采用KEGG 的API 进行获取,思路如下:
1. KEGG 有那些pathway ?
访问的API地址是:
http://rest.kegg.jp/list/pathway
通过该API ,可以获得所有pathway的列表。
2. pathway 上有那些KO (KEGG 中的ID编号)
访问的API地址是:
http://rest.kegg.jp/link/ko/map00010
其中map00010 就是对于的pathway 图的编号,通过遍历所有的pathway ,就可以kegg 数据库中跟pathway 相关KO。
3. KO 对应的蛋白编号是哪个?
访问API地址:
http://rest.kegg.jp/link/genes/K00500
其中K00500 就是我们在第二步中获得的KO, 通过遍历所有的KO,就可以获得在KO在不同物种中的基因(蛋白)编号。
通过这3个步骤,我们就可以获得了从蛋白到pathway, 相关的对应信息,通过该注释,我们就可以多不同物种的基因进行pathway 分析。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!