从GTF文件中提取lncRNA对应的ID和名称
截取,反向互补,读入,写出,筛选等
在分析基因家族时需要鉴定基因家族成员时,有两种鉴定方法: 第一种、利用蛋白保守结构域的隐马尔科夫模型搜索。 第二种、利用BLAST序列比对搜索基因家族成员。 这两种情况的适用条件:如果要...
使用R语言绘制类似于箱线图的散点图
在处理fastq文件时,可能会遇到序列与质量值长度不一致或格式不正确等问题,这时候软件会报告哪条序列有问题,并给出序列ID,然后我们就要去查看这条序列是什么问题。但是,fastq文件通常是很大的,使用less命令可能很难搜索到
网易云基因家族课程中,在提取基因在染色体上的位置信息使用到的是一个脚本,大家经常的遇到一个问题就是没有提取出来信息。 下面是可能存在的问题之一: 脚本在处理信息时与gff文件的匹...
TCGA数据进行多因素的生成分析
TCGA 表达数据进行单因素生存分析
AnnotationDbi 和 结合物种对应的注释文件,将ENSEMBL ID转换成Gene ID(ENTREZID)
利用subset针对数据框按照条件进行判断和筛选数据
在R中利用split,借助数据的分类类型,对数据进行分组
Bio-Linux中有很多安装的生物信息学软件,这里给大家列举一下:
PCA(principal component analysis )主成分分析,可以分析样品之间相关性,确定样品总体上的差异,或者查看是否有批次效应等
1.安装zlib1.2.5版本及以上 cd zlib-1.2.11 ./configure --prefix =/share/work/biosoft/zlib make make install 2.安装bzip cd bzip2-1.0.6 make -f Makefile-libbz...
采用R包STRINGdb 来进行蛋白互作网络分析
Igraph软件安装错误
生信分析是用的 .xls 文件 大多是文本格式的文件,是可以被Perl读取的,但遇到真的excel文件时,就不行了,这时候就需要使用模块 使用的模块为: Spreadsheet::ParseExcel Spreadsheet::Writ...
对数据中存在的NA情况进行处理,替换或者删除
转录组分析常用数据库
ls命令是linux下最常用的命令。ls命令就是list的缩写,缺省下ls用来打印出当前目录的清单,如果ls指定其他目录,那么就会显示指定目录里的文件及文件夹清单。通过ls 命令不仅可以查看linux文件夹...