从GTF文件中提取lncRNA对应的ID和名称
使用R语言绘制类似于箱线图的散点图
在处理fastq文件时,可能会遇到序列与质量值长度不一致或格式不正确等问题,这时候软件会报告哪条序列有问题,并给出序列ID,然后我们就要去查看这条序列是什么问题。但是,fastq文件通常是很大的,使用less命令可能很难搜索到
Bio-Linux中有很多安装的生物信息学软件,这里给大家列举一下:
1.安装zlib1.2.5版本及以上 cd zlib-1.2.11 ./configure --prefix =/share/work/biosoft/zlib make make install 2.安装bzip cd bzip2-1.0.6 make -f Makefile-libbz...
生信分析是用的 .xls 文件 大多是文本格式的文件,是可以被Perl读取的,但遇到真的excel文件时,就不行了,这时候就需要使用模块 使用的模块为: Spreadsheet::ParseExcel Spreadsheet::Writ...
对数据中存在的NA情况进行处理,替换或者删除
ls命令是linux下最常用的命令。ls命令就是list的缩写,缺省下ls用来打印出当前目录的清单,如果ls指定其他目录,那么就会显示指定目录里的文件及文件夹清单。通过ls 命令不仅可以查看linux文件夹...
Perl读取文件中的科学计数法数字是是以字符串读取的,需要将其转化为小数,方法如下 use Math::BigFloat;my $i = new Math::BigFloat '1.931533e-01'; 这里用到了Math::BigFloat这个包,就...
在进行数据集处理时,经常会合并两个数据集,这里说一下合并数据集常用的2个函数: 合并列:cbind 合并行:rbind 1.cbind cbind使用非常直观简单。当我们需要直接合并2个矩阵或数据框,不需...
采用TCGAbiolinks 去下载TCGA临床数据,并对数据进行整合
基因大数据挖掘的时代已经到来,您准备好了吗?
在作GSEA的分析时候需要提供一个预先定义好的基因集,用来评估基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响作用,那么基因集都包括哪些呢? GSEA官网的基因集...
命令行特殊字符处理方法
清华大学电子工程学院学生 洪峰
Ka/Ks表示的是非同义替换(Ka)和同义替换(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。 同义/非同义突变概念 同义突变表示氨基酸没有改变,氨基酸没...
pubmed按影响因子归类搜索文献
分子生物学
linux
筛选内参基因