perl中的正则表达式
GFF3格式说明
MUSCLE(Multiple Protein Sequence Alignment)是一款蛋白质水平多序列比对的软件,在速度和精度上都优于 ClustalW。在进行多序列比对的时候,大多数情况下可以优先使用 MUSCLE。
我们作比对时经常用到blast,其比对结果一般都用m8格式(即参数是 -m 8,blast+是 -outfmt 6),但是结果文件中是没有表头的,这里来写一下。
TCGA 数据的多组学WGCNA联合分析
clusterProfiler做非模式物种的功能注释
你可以对基因进行功能注释,分析其功能分类以及相关的通路信息,你也能分析基因的表达谱数据,但是你知道如何将二者进行结合吗?在功能分类或者通路图上显示出基因的表达数据?有一个工具可以做...
如何鉴定测序文库是不是链特异性
科研作图也需要会使用Adobe illustrator和Photoshop,用好了这两个软件也会使你的文章配图增色不少,甚至事半功倍。
配置JAVA环境,运行java程序
TCGA数据库中含有的癌症名称,简写和中文名称
StatET是一个eclipse R语言高亮显示插件,可以高亮显示R语言代码。安装之前请在电脑中提前安装好R编译环境。 支持在Eclipse平台上(通过将代码发送到R)运行R代码 支持语法高亮显示 支持使用R代码模板 支持创建R的文档文件(*.Rd) 可以从Eclipse运行R命令
做转录组实验,发转录组文章,你不得不知道的20个基本知识点。
为了防止代码文件出现中文乱码,一般在Rstudio中,都要求将文件保存为UTF-8格式,同时打开显示也要求以UTF-8格式进行显示,相应的设置方法如下: 保存文件: 进入Tools——Global Options,选...
在进行数据处理的过程中,可能会要求删除向量中某个指定的元素,这一操作可以利用R 语言向量中每个元素都对应一个索引完成,而获取索引下标可以利用which(),而match()只会返向量中第一次出现的...
有学员反映在学习GEO芯片数据挖掘,进行利用差异基因进行蛋白质互作网络分析的过程中,获得的info文件中之涉及了String_id,利用Cytoscape进行绘图的过程中无法知道对应的具体基因ID是什么...
利用factor() 或者ordered() 两个函数将普通变量转换成有序因子。
利用ggplot2绘图 scale_fill_brewer() 或者scale_color_brewer() 会使用到ColorBrewer 配色。可以利用相关的命令查看改配色方案。 library(ggplot2)RColorBrewer::display.brewer.all() 通...
将Windows中该文件的内容粘贴复制到linux文件中,用perl读取并保存到哈希中,然后读取另一文件的第一行,判断他第一列的内容是否在上一个文件中存在,结果总是不存在,然而明明就在啊,怎么会不存在呢,一遍遍检查代码也找不到问题。到底为什么呢?
meme软件中的fimo程序可以查找指定序列中的motif结合位点,这里介绍一下他的在线版用法。