三代组装软件Flye安装及使用
Seqtk工具地址:https://github.com/lh3/seqtk Seqtk工具命令: 操作举例: 01. 将FASTQ格式文件转换成FASTA格式; seqtk seq -a in.fq.gz > out.fa 02. 将FASTQ(Illumina 1.3+)格式...
Rush(Rapid Utilities SHell)是一款强大的并行任务执行工具,专门设计用于在Linux或Unix环境中进行批处理任务。该工具的设计初衷是为了使并行处理和任务管理变得更为简洁明了,同时具备灵活性...
Linux环境下从百度网盘上传、下载数据 bypy upload -v
在前一篇文章里写了使用OthroFinder软件构建物种同源基因分析的工作原理的介绍,这次就利用Orthofinder结果中的数据来绘制物种系统发育树(Phylogenetic tree)。 在Orthofinder结果文件中有一...
外源插入流程报错运行不了
Orthofinder是做直系同源基因分析时常用软件,除此之外,还可以使用OrthoMCL,今天主要介绍Orthofinder软件的工作流程。 1. Orthofinder发表的工作流程如上图: 1.1 (a)将所有物种的...
VCF 是一种常用的生物信息学文件格式,用于存储基因组中的遗传变异数据,特别是单核苷酸多态性(SNP)和小插入/缺失(Indel)等变异。 VCF 文件通常由文本格式组成,可以用文本编辑器进行查看...
CSVTK,即CSV工具包,是一个用于处理逗号分隔值(CSV)文件的实用命令行程序。由于其简单性、灵活性和效率,对于经常处理CSV文件的人来说,特别是在数据科学、生物信息学以及任何需要数据分析的...
运行命令makeblastdb -in all.pep.fa -dbtype prot -title all.pep.fa 时卡住报错,生成all.pep.fa.pdb-lock 空文件。 解决:makeblastdb 工具版本问题,从2.13.0版本改成2.6.0版本,就可以...
bedtools 对bed 文件进行排序
BLAST (Basic Local Alignment Search Tool) 是我们常用的短序列比对工具,直接输入fasta格式的序列文件就可进行比对
计算RNASeq 的Power值
构建一致性序列
使用python2运行lefse软件的时候报错这是因为当前LEfSe依赖的R包rpy2的版本与你的R版本不兼容,你可以尝试更新一个rpy2的小版本,比如我更新了 pip2 install rpy2==2.8.6 随后就可以直接使用...
minimap2是生信大牛Heng Li在2018年发表的三代序列比对工具。与传统的bwa相比,Minimap2可以用于三代测序, 也支持 splicing awared 比对;与一些传统三代比对工具相比,Minimap2 速度非常快,...
MNP标记设计中DP的算法
MNP标记设计
这个其实很多办法都可以做到,基本就是靠zcat后接awk,sed,或者wc命令,不过速度差强人意,比如这个 awk应该是这几个里最快的,但一个3个G左右的文件仍然运行了接近2分钟,考虑到还有几个30个...
如果某fq_clean文件的其中一端出现了错误,我们手里还持有他的原始数据,那我们就可以用以下方法处理1,首先提取clean文件另一端的id,我用了python脚本 import gzipimport argparsedef extrac...