如何从海量高通量测序数据中筛选出目标数据?这是困扰大多数老师的一个难题!
以转录组为例,想要挖掘数据,首先要看得懂数据,这是基础。
接下来小编以一个excel的简单函数为例,演示一下如何从表格中快速筛选感兴趣的基因等信息。
函数的名称是VLOOKUP函数,该函数是Excel表中的一个纵向查找函数,学会该函数之后,可以方便我们从所有基因的结果中筛选我们关心的基因相关信息,比如:基因的长度、基因在样品中的表达量、基因的注释等等信息。
VLOOKUP函数需要输入4个值:
1、要查找的值,比如:基因的ID;
2、需要查找的区域;
3、区域中包含返回值的列号,也就是找到相关值之后返回第几列的信息;
4、精确匹配或者近似匹配,一般我们选择精确匹配。精确匹配采用0/FALSE、近似匹配采用1/TRUE。
一般来说,我们做完转录组测序,都会有一个总表,表里有所有基因的ID、长度、表达量、差异倍数、注释信息等等,表格很大,内容很多。
如果我们想提取某些差异基因的基因长度信息,那么我们该如何操作呢?
我们需要在需要提取长度信息的差异基因表中加上一列gene_length列。
然后插入VLOOKUP函数,按要求输入4个参数,点击确定即可。
以上是利用基因ID在总表中查找一列信息,比较简单。如果我们想查找多列信息该如何操作呢?
方法相似,我们可以在总表中插入deg_gene列,然后去差异基因表中查找基因ID即可,具体操作如下:
到这里,一个简单的Excel表筛选基因信息的方法就介绍完了,是不是感觉很神奇啊。
更多生物信息课程:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课,学习链接:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析、GEO芯片数据挖掘、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他课程链接:二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!