KEGG数据库收费以后,很多单位的KEGG数据库还是用曾经免费的那版本,一直没有更新。由于现代测序技术和信息技术的发展,KEGG数据库有很多的更新,所以更新KEGG数据库是非常有必要的,一般来说需要更新的信息包括,蛋白序列,蛋白对应的pathway, pathway相关注释文件等。
1. 蛋白序列的下载
既然KEGG收费,那就只能采用一些第三方的数据了。KOBAS 是北大维护的一个基因功能注释和富集的数据库,其数据会随着的KEGG升级而进行更新,而且该数据库支持数据下载,不过是经过他们处理,加工过的数据。
蛋白序列,比较多,文件也比较大,可以下载整个的库,也可以按照物种分类进行下载。有了序列文件,我们可以对一些无参考基因组的物种,也可以进行功能分析。
虽然KOBAS 也提供pathway 相关的信息,但是该数据库中没有提供KEGG 的KO编号,不好操作,这个可以采用KEGG 的API解决,我们下篇文章再讲
虽然KOBAS 网站是在国内,但是该网站的服务不太稳定,经常无法访问。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!