MNP标记设计
这个其实很多办法都可以做到,基本就是靠zcat后接awk,sed,或者wc命令,不过速度差强人意,比如这个 awk应该是这几个里最快的,但一个3个G左右的文件仍然运行了接近2分钟,考虑到还有几个30个...
如果某fq_clean文件的其中一端出现了错误,我们手里还持有他的原始数据,那我们就可以用以下方法处理1,首先提取clean文件另一端的id,我用了python脚本 import gzipimport argparsedef extrac...
基因组重复序列注释统计结果更新-buildRepeatSummary.pl
三代测序在检测基因组结构变异方面有着很大的优势,但是由于数据分析算法、软件还处于不断开发更新中,当前还没有公认推荐的软件。这里为大家推荐一款国人开发的三代数据SV检测软件—cuteSV。该...
使用vcftools对vcf文件做滑窗处理
podman 防止退出之后容器杀死:
stacks RAD 分析方法
关于JCVI的使用,唐老师在github上已经有很详细的介绍,网络上也有很多教程。JCVI依赖的东西非常多,因此在使用时还是难免遇到各种问题,以在使用Python JCVI,遇到FileNotFoundError为例,...
python的pyvcf模块是许多软件的依赖,如cuteSV等,可是直接安装会报错这里可以看出来,pyvcf的安装包竟然还在使用python2编写,因此为了使用它,需要用到use_2to3这个小模块,毫无疑问,这也是...
flowCore
Linux的shuf命令对文件的行进行随机排序
Linux常用命令shuf用于把输入行按随机顺序输出到标准输出。 具体用法如下: shuf命令会将final.bed文件中的所有行随机排序,-n选项设置显示前1000行。 常用参数有: 示例: 生成3个...
目录下有个软链接的文件,想对它进行压缩或者解压,但是却报错Too many levels of symbolic links
教你画多物种基因家族局部共线性分析图
1. 查看Linux是否已安装linuxnd软件 下载及安装linuxnd软件:http://data-deliver.novogene.com/download 2. 登录 $/share/work/biosoft/nuohe/linuxnd/lnd login -u 用户名 -p 密码 3. 查...
统计每个窗口内SNP变异位点数量
gff文件第三列一般有gene,mRNA,CDS,exon等等信息,但是有时候我们下载的gff文件没有gene信息,只有mRNA等等的信息,我们可以实用脚本手动校正。
在使用Rstudio Server出现卡顿,或者每次打开server都会加载之前的工作。 解决方法: 1. 清除工作区内项目信息 2. 在Termianal页面下删除session rm -rf ~/.local/share/rstudio/sessions...
二叉树是一种非常重要的数据结构,它在计算机科学和软件工程中有着广泛的应用。本文将对二叉树进行简要介绍,并给出几个实际应用的例子。 一、二叉树简介 二叉树是一种树形数据结构,其中每个...