老师:小王,你把A、B、C三个样品差异基因的维恩图给我发一下。
小王:好的,马上!
十分钟后,小王:转录组的结果太多了,得花点时间,您等下!
大海捞针是个技术活
在各家测序公司的努力下,现如今转录组的分析结果是越来越丰富了,提供的结果里是文件夹套文件夹,总共几百个文件,还都是英文名。这对于不熟悉转录组分析结果的同学来说,想找到自己想要的文件实在不容易。
小编第一次遇到这个问题的时候,曾寄希望于Windows自带的文件搜索功能,就是下面这个东西:
但凡用过的小伙伴都知道,用这个东西速度太慢,简直等于慢性自杀,有时候半个小时也搜不完,一度让我怀疑笔记本里的i7 CPU是不是假货!
下面给大家介绍一个可以在几秒内完成全局搜索文件的软件“everything”!
“everything”的界面很简洁,安装完毕打开之后就是这样:
基本搜索:
只要在搜索框内键入需要的关键词即可,如果我们想找维恩图的话就键入“venn”,在按下回车的同时,搜索结果几乎就立刻出现了,会提供文件的名称、路径、大小、修改时间等4个基本信息:
同理,如果想找表达量文件可搜索“expression”或者“fpkm”,找箱线图搜索“box”,找注释信息搜索“annotation”,找两组样品间比较搜索“VS”,找CDS序列搜索“CDS”,总之只要输入一个对应的英文关键词即可。
在指定文件夹内搜索:
虽然在整个电脑里搜索的速度也很快,但是有时候名字相似的文件太多了,比如小编的电脑里的维恩图就太多了,这时就需要在指定文件夹内搜索,比如转录组分析结果的总文件夹,everything提供了强大的高级搜索功能:
这样就将搜索目标限定在需要的范围内了。
转录组原始数据的搜索:
虽然原始数据通常我们用不到,但是写好文章投稿的时候,一般都是要求把原始数据上传到公共数据库里的。很多同学到了投稿阶段才发现找不到原始数据存到电脑的哪个角落里了,甚至连原始数据的名字也不记得!
不过没关系,我们一样可以通过“everything”来帮你找到。原始数据一般都比较大,在1G以上,同时为压缩文件,比如格式为zip、gz、rar(具体是什么格式可以问给你测序的公司)等,我们按如下设置即可找到:
这样电脑里所有1G以上的压缩包就找到了,里面一定有你失散多年的原始数据!
扩展功能:
"everything"还有很多功能,大家可以自己去探索,比如模糊搜索文件名、找昨天刚刚编辑的word文档、限定文件名长度等等。
如您需要该软件,请关注“组学大讲堂”微信公众号,并在对话框留言 “everything” 即可获得(注意关键词需完全正确)。
百尺竿头,更进一步!
当然转录组结果到手之后,仅仅是能找到自己想要的文件还是不够的,最终想要充分利用转录组的数据,还是得理解文件代表的生物学意义。初学者可以选择观看如下的课程:
part I:
《有参转录组分析结果的解读》电脑端可打开链接:
http://study.163.com/course/courseMain.htm?courseId=1004723037&share=1&shareId=103147271
手机端可扫码:
《无参转录组分析结果的解读》电脑端可打开链接:
http://study.163.com/course/introduction/1005207017.htm?share=1&shareId=103147271
手机端可扫码:
part II:
《转录组标准分析后的数据挖掘技巧》电脑端可打开链接:
http://study.163.com/course/introduction/1005084024.htm?share=1&shareId=103147271
手机端可以扫码:
延伸阅读:
获取MOTIF 位置信息矢量图 | 做韦恩图?自己搞定! | Mapman植物代谢通路注释 | MeV画漂亮的热图 | 7篇文章细数基因家族分析类SCI蜕变历程 | TCGA数据挖掘文章-分析ceRNA的“套路” | WGCNA新玩法-多组学联合分析!
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!