三代组装软件Flye安装及使用
Seqtk工具地址:https://github.com/lh3/seqtk Seqtk工具命令: 操作举例: 01. 将FASTQ格式文件转换成FASTA格式; seqtk seq -a in.fq.gz > out.fa 02. 将FASTQ(Illumina 1.3+)格式...
Rush(Rapid Utilities SHell)是一款强大的并行任务执行工具,专门设计用于在Linux或Unix环境中进行批处理任务。该工具的设计初衷是为了使并行处理和任务管理变得更为简洁明了,同时具备灵活性...
Linux环境下从百度网盘上传、下载数据 bypy upload -v
外源插入流程报错运行不了
VCF 是一种常用的生物信息学文件格式,用于存储基因组中的遗传变异数据,特别是单核苷酸多态性(SNP)和小插入/缺失(Indel)等变异。 VCF 文件通常由文本格式组成,可以用文本编辑器进行查看...
CSVTK,即CSV工具包,是一个用于处理逗号分隔值(CSV)文件的实用命令行程序。由于其简单性、灵活性和效率,对于经常处理CSV文件的人来说,特别是在数据科学、生物信息学以及任何需要数据分析的...
运行命令makeblastdb -in all.pep.fa -dbtype prot -title all.pep.fa 时卡住报错,生成all.pep.fa.pdb-lock 空文件。 解决:makeblastdb 工具版本问题,从2.13.0版本改成2.6.0版本,就可以...
bedtools 对bed 文件进行排序
BLAST (Basic Local Alignment Search Tool) 是我们常用的短序列比对工具,直接输入fasta格式的序列文件就可进行比对
计算RNASeq 的Power值
构建一致性序列
使用python2运行lefse软件的时候报错这是因为当前LEfSe依赖的R包rpy2的版本与你的R版本不兼容,你可以尝试更新一个rpy2的小版本,比如我更新了 pip2 install rpy2==2.8.6 随后就可以直接使用...
MNP标记设计中DP的算法
MNP标记设计
这个其实很多办法都可以做到,基本就是靠zcat后接awk,sed,或者wc命令,不过速度差强人意,比如这个 awk应该是这几个里最快的,但一个3个G左右的文件仍然运行了接近2分钟,考虑到还有几个30个...
如果某fq_clean文件的其中一端出现了错误,我们手里还持有他的原始数据,那我们就可以用以下方法处理1,首先提取clean文件另一端的id,我用了python脚本 import gzipimport argparsedef extrac...
三代测序在检测基因组结构变异方面有着很大的优势,但是由于数据分析算法、软件还处于不断开发更新中,当前还没有公认推荐的软件。这里为大家推荐一款国人开发的三代数据SV检测软件—cuteSV。该...
使用vcftools对vcf文件做滑窗处理
统计每个窗口内SNP变异位点数量