以前处理文件路径的时候都是自己写正则表达式,而用perl的模块来解决则更加迅速、准确。
在作芯片数据或者是转录组数据的GSEA分析时候,需要四个文件: 1、基因表达数据文件; 2、表型数据文件; 3、功能基因集文件; 4、芯片注释文件; 这四个文件只需要分析者提供前两个文件即...
在使用GSSE绘制基因结构或者是顺势作用元件时,如果图例太多,在网页展示不出来,这个时候你需要对图片进行修改.增大背景画布就可以显示了,点击下图红色箭头所指按钮,进入到图片编辑界面: 拉...
生存分析的一些基本概念
三元相图查看说明
生存曲线图的绘制
今天跟大家分享一个分析蛋白保守结构域的的网站: 网址:http://www.ebi.ac.uk/interpro/ 在上图的方框导入蛋白序列,点击submit,就开始运行,结果如下图所示: 这个网站不仅分析了蛋白的保...
从GTF文件中提取lncRNA对应的ID和名称
截取,反向互补,读入,写出,筛选等
在分析基因家族时需要鉴定基因家族成员时,有两种鉴定方法: 第一种、利用蛋白保守结构域的隐马尔科夫模型搜索。 第二种、利用BLAST序列比对搜索基因家族成员。 这两种情况的适用条件:如果要...
使用R语言绘制类似于箱线图的散点图
在处理fastq文件时,可能会遇到序列与质量值长度不一致或格式不正确等问题,这时候软件会报告哪条序列有问题,并给出序列ID,然后我们就要去查看这条序列是什么问题。但是,fastq文件通常是很大的,使用less命令可能很难搜索到
网易云基因家族课程中,在提取基因在染色体上的位置信息使用到的是一个脚本,大家经常的遇到一个问题就是没有提取出来信息。 下面是可能存在的问题之一: 脚本在处理信息时与gff文件的匹...
TCGA数据进行多因素的生成分析
TCGA 表达数据进行单因素生存分析
AnnotationDbi 和 结合物种对应的注释文件,将ENSEMBL ID转换成Gene ID(ENTREZID)
利用subset针对数据框按照条件进行判断和筛选数据
在R中利用split,借助数据的分类类型,对数据进行分组
Bio-Linux中有很多安装的生物信息学软件,这里给大家列举一下:
PCA(principal component analysis )主成分分析,可以分析样品之间相关性,确定样品总体上的差异,或者查看是否有批次效应等