linux 从文件中随机抽取部分数据

如何从某一个文本文件中随机抽取一部分数据。譬如右下方这样的基因表达量数据的统计文件ref_trans_full_table.xls目标是由此文件中随机抽取一部分数据。 可以利用shuf获取随机数据,譬如随机...

如何从某一个文本文件中随机抽取一部分数据。譬如右下方这样的基因表达量数据的统计文件ref_trans_full_table.xls目标是由此文件中随机抽取一部分数据。


attachments-2018-07-8dPsulyz5b6020e768789.jpg

1、可以利用shuf获取随机数据,譬如随机选出其中的10个基因:(先获取表头再抽取数据)

head -1 ref_trans_full_table.xls|less>test.xls
shuf -n 10 ref_trans_full_table.xls >>test.xls


提取的结果保存在了test.xls文件中,部分结果如下:

attachments-2018-07-VbzBiHnf5b6025dcb4213.jpg


2、利用sort -R 随机排序之后,借用head 或者tail 提取数据,也相当于随机抽取数据:

head -1 ref_trans_full_table.xls|less>test.xls
sort -R ref_trans_full_table.xls |head -10|less>>test.xls


  • 发表于 2018-07-31 17:04
  • 阅读 ( 4878 )
  • 分类:linux

0 条评论

请先 登录 后评论
Daitoue
Daitoue

167 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 351 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章