如何快速从转录组数据中筛选目标基因!

如何快速从海量的转录组测序结果文件中查找感兴趣的基因?懂技巧,事半功倍!

如何从海量高通量测序数据中筛选出目标数据?这是困扰大多数老师的一个难题!

以转录组为例,想要挖掘数据,首先要看得懂数据,这是基础。

接下来小编以一个excel的简单函数为例,演示一下如何从表格中快速筛选感兴趣的基因等信息。

函数的名称是VLOOKUP函数,该函数是Excel表中的一个纵向查找函数,学会该函数之后,可以方便我们从所有基因的结果中筛选我们关心的基因相关信息,比如:基因的长度、基因在样品中的表达量、基因的注释等等信息

VLOOKUP函数需要输入4个值:

1、要查找的值,比如:基因的ID;

2、需要查找的区域;

3、区域中包含返回值的列号,也就是找到相关值之后返回第几列的信息;

4、精确匹配或者近似匹配,一般我们选择精确匹配。精确匹配采用0/FALSE、近似匹配采用1/TRUE。

一般来说,我们做完转录组测序,都会有一个总表,表里有所有基因的ID、长度、表达量、差异倍数、注释信息等等,表格很大,内容很多。

attachments-2019-04-A9PGlQlq5ca5b4cbe6dbd.jpg

如果我们想提取某些差异基因的基因长度信息,那么我们该如何操作呢?

我们需要在需要提取长度信息的差异基因表中加上一列gene_length列。

attachments-2019-04-MadJqved5ca5b51146a0d.jpg然后插入VLOOKUP函数,按要求输入4个参数,点击确定即可。

attachments-2019-04-qouhGt8y5ca5b52d84dc8.jpgattachments-2019-04-MDgoqMIn5ca5b54a34dc9.jpgattachments-2019-04-IseRPpLN5ca5b555bcdd1.jpgattachments-2019-04-MLrK3wER5ca5b5602079d.jpg

以上是利用基因ID在总表中查找一列信息,比较简单。如果我们想查找多列信息该如何操作呢?

方法相似,我们可以在总表中插入deg_gene列,然后去差异基因表中查找基因ID即可,具体操作如下:

attachments-2019-04-M07RObHj5ca5b57af06ac.jpgattachments-2019-04-SRHzGOlD5ca5b5c62f232.jpgattachments-2019-04-gAtlVNfh5ca5b5d434dd1.jpgattachments-2019-04-ZZe5NHYc5ca5b5e364994.jpg到这里,一个简单的Excel表筛选基因信息的方法就介绍完了,是不是感觉很神奇啊。

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析GEO芯片数据挖掘GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他课程链接:二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

  • 发表于 2019-04-04 15:46
  • 阅读 ( 12464 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
生信老顽童
生信老顽童

61 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章