DELL R430服务器用U盘安装Linux步骤
多样本转录组
基因组注释分析方法
GATK4
提到主成分分析,一般我们都是使用Plink,GCTA等软件基于SNP数据来操作,那么如何用DNA序列做主成分分析呢? 思路是先比对,之后使用R语言的adegenet包把比对的数据转换成snp数据,用到的函数是fasta2genlight(),再进行PCA分析及绘图。
qiime2 安装-使用国内镜像避免网络原因报错:
Biopython
GATK4
删掉文件其中一行,非常简单,不过如果一个文件很大以至于无法读到内存里,又该怎么操作呢 其实我们可以使用 open() 方法把需要修改的文件打开为两个文件,然后逐行读入内存,找到需要删除的行...
举个例子:从数据库中下载基因组数据,基因组.gff文件中染色体ID较为复杂(第一列) 从全基因组序列.genome.fa文件中找到染色体ID对应简写 想将gff文档中染色体ID全部替换成第二列LC*命名...
经常会遇到对bed文件或其他相关数据的排序,记录一下如何先按照染色体号排序,然后按照坐标位置排序。 sort -k1,1 -k2n file1 > file2 排序完成后如下:
HMMER 隐马尔可夫模型序列最新下载方法
mbol: g_settings_backend_get_type
合并文件
1. ps列出用户的pid,然后依次kill掉,比较繁琐 kill -9 `ps -uf username |awk '{ print $2 }'|grep -v PID` 或 ps -ef | grep username | awk '{ print $2 }' | xargs kill -9 2. pkill方...
有时我们需要统计文件的某列中某些词出现的次数,可以在Linux下使用sort | uniq -c,那用awk怎么操作呢?
AI保存PNG/PDF/JPG时“出现了未知错误”的解决办法
codeml是PAML软件包下的一个程序,在估算蛋白编码序列同义替换和非同义替换速率以及检测序列是否经受正选择分析中受到广泛应用。 对于一棵系统发育进化树,在考虑其不同序列间(site)和不同支...
cp命令可以简单的将多个路径的文件复制到一个文件夹内,但反过来就会麻烦很多 不过和其他命令搭配也可以实现 echo 路径1 路径2|xargs -n 1 cp -v 需要复制的文件 当然,路径可以一直加,也可...
Linux下判断数值大小