KEGG数据库应该是我们最常见的、使用频率最高的数据库之一了,它是一个整合了基因组、化学和系统功能信息的数据库。由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一。
在KEGG分析结果中,总还是有人分不清例如K01000和ko01000这样的编号的生物学意义,下面我给大家再介绍一遍:K01000:由大写K+五位数字组成,对应的是KEGG数据库中某类蛋白的编号,即某些基因注释到了该蛋白,该编号代表着这一类功能的蛋白,一个基因对应一个这种大K编号;ko01000:由小写的ko+五位数字组成,是pathway的编号,对应的是某一条代谢通路;一条通路里可以有多个基因共同参与调控,所以会存在多个大K编号,同样,一个基因也可以参与多个代谢通路所以一个基因也可以有多个ko注释,这下应该明白了吧!KEGG注释很是常见,几乎涉及到功能注释的项目都会有KEGG注释及富集分析,那么当我们找到某些感兴趣的基因或通路后,我们能不能仅用我们感兴趣的基因绘制漂亮的KEGG代谢通路图呢?就像下面这样的!当然,是我们自己做,而不是求助公司!答案是肯定的,今天小编就手把手教你自主绘制KEGG代谢通路图!
Pathview网页版简介:Pathview是一个通路可视化友好的R包,支持多组学数据映射(基因/蛋白-代谢),更重要的是Pathview还有一个网页版,这对于非生信人员真是重大好消息!
Pathview网页版具有如下优点:1. 图形界面很是友好,访问速度快。2. 有完整的通路分析流程,支持多组学数据整合分析,且数据库是最新的通路数据。3. 结果是交互式的,可以更深入了解数据。4. 可以游客身份登录也可免费注册,注册用户可以共享数据和保存分析历史。今天我们仅介绍Pathview绘制单一数据kegg通路图,下面进入正题:数据准备:我们以6个人的转录组数据为例,我感兴趣的是某一分组中与MAPK signaling pathway有关的基因,于是我从该组差异基因列表中筛选出目标基因及FPKM值整理如下表。
Pathview数据文件格式都是以tab或者逗号分隔的txt或者csv文件,EXCEL数据可以通过另存为(制表符分隔)TXT文件格式,如下:
数据提交与选项设置:如下图:点击New Analysis进入分析页面,首先在input&output下提交数据,Gene Data项选择文件上传数据。
数据上传完页面会自动跳出样本分组对话框,如下图:箭头处填写样本顺序号,并用逗号隔开即可分组,完成后点击Close关闭对话框。
接下来就是选择参考基因及数据类型等,参考基因选择人类参考基因组,转录组分析时参考基因组来源于ensembl,所以基因ID类型选择ENSEMBL,其他数据按实际情况自行选择即可。
需要注意的是步骤③,Manual选项下,可以手动选择感兴趣的通路,此处也可以选择Auto,数据库会自动给出能注释到的所有通路结果。步骤④在左侧选择感兴趣的通路,选中,点击⑤即可添加到右侧。选项Graphics,即图形参数,无特殊需求可默认;选项Coloration是颜色设置,可按需调整。
以上操作完成点击Submit提交任务。结果展示:Pathview绘图速度很快,如下图,绘制完成后,进度条位置便会出现结果查看链接。
下图是生成的MAPK signaling pathway注释结果,点击链接即可查看绘图:
绘制的KEGG注释图是可交互式的,每个带颜色的term都带有超链接,可点击它们转到更详细的解释,如下图:
下载绘图结果点击下方位置所示,下载结果中有PNG格式图片及keggID与基因ID对应文件。
这样,重新绘制的部分基因kegg注释图就做完了,是不是很简单?Pathview支持上百种有参物种,适用性很广,感兴趣的话赶紧试一下吧!Pathview网站地址:https://pathview.uncc.edu/时值618购物节,一定要让自己更美丽、更健康还有更有知识!逛完淘宝、京东,一定要逛逛组学大讲堂!知识无价!课程却有大额优惠在等你!
截止到今天,组学大讲堂共计发布30+门生物信息视频教程,涵盖数据结果解读、转录调控、基因家族、癌症数据库挖掘、微生物研究、编程语言(Python、R、Perl)等方向,学员数量22000+!多门课程被推送到网易首页推荐位,并被网易官方评为平台潜力奖,我们也是唯一入选的生物信息类团队!
课程链接如下,趁着618大促抓紧下手吧:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?多学点数据处理技能:学习链接:转录组标准分析后的数据挖掘
6. 学生物的必学生信技能:linux系统入门
7. 学生物的必学生信技能:Perl语言入门到精通
8. 学生物的必学生信技能:perl语言高级编程
9. 更多学习内容:linux、perl、R语言画图,更多免费课程请扫描下方二维码:
组学大讲堂云课堂网校
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!