数据分析实用技能—Excel函数使用—VLOOKUP:数据批量提取及数据合并

VLOOKUP函数的语法为: VLOOKUP(要找谁,在哪儿找,返回第几列的内容,精确找还是近似找) 第一参数是要在表格或区域的第一列中查询的值。 第二参数是需要查询的单元格区域,这个区域中的首列必...

VLOOKUP函数的语法为:

VLOOKUP(要找谁,在哪儿找,返回第几列的内容,精确找还是近似找)

第一参数是要在表格或区域的第一列中查询的值。

第二参数是需要查询的单元格区域,这个区域中的首列必须要包含查询值,否则公式将返回错误值。如果查询区域中包含多个符合条件的查询值,VLOOKUP函数只能返回第一个查找到的结果。

第三参数用于指定返回查询区域中第几列的值,该参数如果超出待查询区域的总列数,VLOOKUP函数将返回错误值#REF!,如果小于1返回错误值#VALUE!。
第四参数决定函数的查找方式,如果为0或FASLE,用精确匹配方式,而且支持无序查找;如果为TRUE或被省略,则使用近似匹配方式,同时要求查询区域的首列按升序排序。

1. 批量筛选特定基因的表达

做了转录组数据分析,通常公司会给我们一个所有基因在所有样本中的一个基因表达矩阵文件。有时候我们通过一些方法或者手段筛选到了一些基因,例如,特定功能的基因,差异表达的基因等等,想绘制这些基因的表达热图,但是从几万个基因中如何快速的筛选出我想要的基因的表达量呢?下面介绍一个不用编程利用excel的vlookup完成快速筛选。

1.1 准备数据文件sheet1、sheet2

sheet1是所有基因表达矩阵数据文件,列为样本ID,行为基因ID,中间为每个基因在不同样品中的基因表达量。

attachments-2021-11-OCUT6RKq61931aea71e39.pngsheet2是筛选到的一些基因的ID,需要把他们的表达量从总表中筛选出来。

attachments-2021-11-eLF5oTts61931b07676e7.png

1.2 在sheet1中筛选出基因的表达量

(1)如图所示,在sheet1中H2处输入VLOOKUP函数。函数中需要填写四个信息,A2为查找值,Sheet2!A:A为X基因家族数据表,1为X基因家族基因ID所在列,FALSE为精确匹配。

attachments-2021-11-7QT61wSq61931b2bca65e.png(2)函数向下填充之后得到结果如图所示,#N/A表示所在行的基因并不属于基因列表,直接筛选过滤。

attachments-2021-11-8GvMqK4x61931b4ddc17a.png(3)得到最终结果

attachments-2021-11-Y0NnSob661931b67b7f0f.png

2 数据合并

有时候我们有两个表有共同的ID,想把两个表的数据按照相同的ID进行合并;例如,上面我筛选了基因的表达量,还想把基因属于哪个通路的信息添加上,可以按照下面的方法完成:

2.1 准备数据文件sheet3

所有基因的功能注释文件,第一列为基因ID,第二列为基因所属的Kegg通路信息。

attachments-2021-11-eKcA57Cc61931b8cb8bad.png

2.2 将sheet3中通路信息合并到sheet1中

(1)如图所示,在sheet1中H2处输入VLOOKUP函数。函数中需要填写四个信息,A2为查找值,Sheet3!A:B为基因通路数据表,2为基因通路信息所在列,FALSE为精确匹配。

attachments-2021-11-ZxbnhgJg61931bb103105.png(2)函数向下填充之后得到结果如图所示,#N/A表示所在行的基因在sheet3中没有通路信息,直接筛选过滤。

attachments-2021-11-3Dgl1wEz61931bd84c3ac.png

(3)得到最终结果

attachments-2021-11-G0ecQLVF61931bf231817.png
  • 发表于 2021-11-16 10:48
  • 阅读 ( 3143 )
  • 分类:软件工具

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
rzx
rzx

74 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 80 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章